先週のチャレンジに対する解答は こちらで確認できます。
女の子は数学ができないなんて誰が言ったのでしょう?
今は2020年です。
今日、データサイエンスを含む多くの数学や科学の分野で女性は活躍しています。
こちらの Women of Analytics のページ(英語)をぜひご覧ください!
ここに、2013年から2019年までのニューヨーク市の公立学校の統一数学試験の結果のデータがあります。
まず、Grade 8を対象に、最も優秀とされるレベル4で、男子生徒に対する女子生徒の比率(%)を計算し、次に2013年から2019年の間に(男子生徒レベル4に対して)女子生徒のレベル4の比率(%)が最も飛躍したトップ3の地区(District)を見つけてください。
*投稿時に「Grade 8を対象に」というところが抜けてしまいご迷惑をおかけいたしました。
問題文の意味がいまいち理解できず、問題が解けませんでした。
先週の英語版とも読み込みシートや回答も違うので、別の問題なのかもと思いましたが…
OriginalだとSheet Allを読み込んでいますが、男女の区別ないため、問題が解けません。
英語版同様Sheet Genderを読み込んでみましたが日本語版ではGradeや受験者数は関係なく、単にレベル4を取得した男女比を算出するのでしょうか?答えが合いません。
@DaisukeTsuchiya
同意見です。
さらに、GradeのColumnにAll Gradeのデータについての処理はどうするかと思います。
英語版のほうが数多くの回答が8のみでFilterしていて、All Gradeのデータを無視することになります。
答えとあっていますが、なんか違うと気がします。
答えとあいました。対象Gradeを8に絞り、読み込むシートも Genders に変更してます。
tokimatsuさん、よくわかりましたね。
自分のやり方自体はあっていました。
Sheet Gender+Grade8だけでFilterですね。さすがに行間を読めませんでした。
@DaisukeTsuchiya さんと @Tokimatsu さんと同じ前提でやりました。
Sheet Gender+Grade8+切り捨て。
先入観は禁物です。
すみません。問題文から「Grade8を対象にする」のが抜けていました。Startファイル/Solutionファイルを訂正いたしました。
皆さんの書き込みのおかげで出来ました。
とりあえず初チャレンジなので結果にたどり着くためにゴリゴリやってみました。
Female/Male以外のジェンダーが無くデータに欠落が無いという事実、Male生徒数が0の場合にDivided Zero Errorで計算結果がNull値になることが2回発生するが2013年と2019年には無いという幸運を前提にちょっとインチキくさい手を使いました。TOP3のディストリクトは見つかり正解と一致しましたが、我ながら美しくない。もう少しスマートなやり方がいくらでもありそうで恥ずかしい。他の方のWorkflowを参考に勉強したいと思います。
蛇足ながら:
1.GenderにはF、Mに加え「どちらでもない」が含まれている方が私のようなインチキ防止になるしPolitical Correctness上も望ましいかも。
2.ディストリクト17は81ポイントではなく82ポイントの上昇となるのが正しいように思えるのですが81となっているのは何か理由が有るのでしょうか?