先週のチャレンジの解答は こちらで見つけることができます。
このデータセットには、2020年1月1日から2020年12月31日までのニューヨークタイムズの記事が含まれています。
まず最初のタスクは、スポーツに関する記事の数が最も多い曜日を特定することです。
2番目のタスクは、スポーツに関する記事の数が最も多い曜日に「Football」または「football」という単語が記事の見出しまたはキーワードに含まれている回数を特定することです。
最終的な結果として、次のようなステートメントを作成する必要があります。「Football という単語は、_____に公開されたスポーツ記事に____回表示されました。」
ボーナス問題!
70%の信頼区間の上限を使用して、記事に対するコメントが2,000万件のマイルストーンを超える月を予想してください (ヒント:2020年以降のすべての投稿の累積合計を考慮してください)
ボーナス問題に回答するためには、予測ツールをダウンロードしてインストールする必要があります。 また、出力が解答の出力とわずかに異なっていても心配しないでください。重要なのは結果を理解することです。
Good luck!
分析ツールの正しい使い方がよく分からず・・・。とりあえずマイルストーンを超える年月だけにはたどり着きました。
70%有意水準をどう解釈するか悩みました
できました!
結果が合わないと悩んでいたBonusですがソリューションファイル見てみました。
ソリューションファイルの結果は以下のとおりですが、
月順に並べ替えると以下のようになります。
ありがとうございます!出題者につたえておきます!
できていると思いますが、回答より遠い未来になりました。