Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

ウィークリーチャレンジ

トップになるためのスキルをお持ちですか? ウィークリーチャレンジを購読しましょう。ベストを尽くして問題を解決し、解決策を共有して、他のユーザーがどのように同じ問題に取り組んだのか確認しましょう。私たちも解答例を共有しています。

チャレンジ #144: スポーツ記事の見出しとキーワード

SaoriG
Alteryx Alumni (Retired)

Weekly Challenge Image 296.png先週のチャレンジの解答は こちらで見つけることができます。

 

 

このデータセットには、2020年1月1日から2020年12月31日までのニューヨークタイムズの記事が含まれています。

 

まず最初のタスクは、スポーツに関する記事の数が最も多い曜日を特定することです。

 

2番目のタスクは、スポーツに関する記事の数が最も多い曜日に「Football」または「football」という単語が記事の見出しまたはキーワードに含まれている回数を特定することです。

 

最終的な結果として、次のようなステートメントを作成する必要があります。「Football という単語は、_____に公開されたスポーツ記事に____回表示されました。」

 

ボーナス問題!

70%の信頼区間の上限を使用して、記事に対するコメントが2,000万件のマイルストーンを超える月を予想してください (ヒント:2020年以降のすべての投稿の累積合計を考慮してください)

 

ボーナス問題に回答するためには、予測ツールをダウンロードしてインストールする必要があります。 また、出力が解答の出力とわずかに異なっていても心配しないでください。重要なのは結果を理解することです。

 

Good luck!

sanae
ボリード

分析ツールの正しい使い方がよく分からず・・・。とりあえずマイルストーンを超える年月だけにはたどり着きました。

スポイラ
Weekly_Challenge_ja_144_sanae.png
gawa
15 - Aurora
15 - Aurora

70%有意水準をどう解釈するか悩みました

スポイラ
回帰分析するのか?と悩んだのですが、Outputのデータみて、毎月のNoを決め打ちと気づきました。どちらの結果も図示しました。70%有意水準だと、甘めの見込みなので、線形回帰(R-sq0.996)よりも早くターゲットに到達してるっぽいです。
本当は、ちゃんとQ-Qプロット作って正規分布の仮定でOKか確かめないといけませんけどね・・・
gawa_0-1638352785388.pnggawa_1-1638352804831.png

 

 

DaisukeTsuchiya
パルサー

Time Seriesを使うのですよね?

 

スポイラ
ARIMAとETSを試しましたが、両方ともいまいち合わなかったです。なにかやり方が違うのかなぁ。

キャプチャ.JPG




Qiu
20 - Arcturus
20 - Arcturus
スポイラ
Weekly_Challenge_ja_144_Start.PNG
AkimasaKajitani
17 - Castor
17 - Castor

できました!

 

スポイラ
70%の信頼区間ということなので、ETSやARIMAかな、と思ってやっているんですが、値の一致はうまくしないんですよね・・・。一応答えの月は合いましたが・・・。

AkimasaKajitani_0-1638439851652.png

 

AkimasaKajitani_1-1638439869066.png

海外のコミュニティ見ても一致させてる人はいなさそうです・・・。
ks4050kt
アステロイド

基本問題だけやりました。 

 

「Football」または「football」という単語が記事の見出しまたはキーワードに含まれている回数を特定することです。

 

結果が違ってしまいました。。

AkimasaKajitani
17 - Castor
17 - Castor

結果が合わないと悩んでいたBonusですがソリューションファイル見てみました。

 

スポイラ
結論として、理由はわかりませんが月をわざわざ英名の月にしており、順番が英名の月順に並べ替えられた状態で時系列予測(ARIMA)を行っているので、本来であれば考慮されるべきシーズン性などがまったくおかしな状態で予測されている、ということになります。

つまり、このような状態でそのまま予測されています。
AkimasaKajitani_0-1641179482495.png

本来はこのように月の順でソートされるべきかと思います。
AkimasaKajitani_1-1641179540044.png


ソリューションファイルの結果は以下のとおりですが、

AkimasaKajitani_2-1641179571329.png


月順に並べ替えると以下のようになります。

AkimasaKajitani_3-1641179593428.png

 


 



SaoriG
Alteryx Alumni (Retired)

ありがとうございます!出題者につたえておきます!

ntakeda
ボリード

できていると思いますが、回答より遠い未来になりました。

スポイラ
ntakeda_0-1654744880806.png