Free Trial

ディスカッション

答えを見つけ、質問し、Alteryx の専門知識を共有してください。

データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(27問目~32問目:統計量計算編)

AkimasaKajitani
17 - Castor
17 - Castor

一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編のウィークリーチャレンジ方式による出題第6回目は27問目~32問目を一つにまとめてみました。今回は統計量の計算です。標準偏差、分散は少し厄介な問題です。

 

  • P-027: レシート明細データ(receipt.csv)に対し、店舗コード(store_cd)ごとに売上金額(amount)の平均を計算し、降順でTOP5を表示せよ。
  • P-028: レシート明細データ(receipt.csv)に対し、店舗コード(store_cd)ごとに売上金額(amount)の中央値を計算し、降順でTOP5を表示せよ。
  • P-029: レシート明細データ(receipt.csv)に対し、店舗コード(store_cd)ごとに商品コード(product_cd)の最頻値を求め、10件表示させよ。

    ※出力データは、店舗コード(store_cd)の昇順で並べ、10件を表示すること

  • P-030: レシート明細データ(receipt.csv)に対し、店舗コード(store_cd)ごとに売上金額(amount)の分散を計算し、降順で5件表示せよ。

    ※不偏分散をまず出力しましょう。余裕があれば標本分散にもチャレンジしてください

  • P-031: レシート明細データ(receipt.csv)に対し、店舗コード(store_cd)ごとに売上金額(amount)の標準偏差を計算し、降順で5件表示せよ。

    ※不偏標準偏差(標本標準偏差)をまず出力しましょう。余裕があれば標準偏差にもチャレンジしてください

  • P-032: レシート明細データ(receipt.csv)の売上金額(amount)について、25%刻みでパーセンタイル値を求めよ。

    ※データの持ち方として、横持ち(パーセンタイルと各フィールドとして持つ)と縦持ち(パーセンタイルと値のリストとして持つ)の二つのタイプでデータを整形してください

 

解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。

 

 

solutionファイルは次回添付します。

 

添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。

 

前回:データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(21問目~26問目:データ抽出中級+カウント編)

24件の返信24
yutaro_K
アステロイド

基本的な統計量が1ツールのみで処理できることを学びました。

パーセンタイル値の設定がどのようにするのかとても迷いました。。。

スポイラ
answer.png

Hirokane
アステロイド

よろしくお願いします。

Hashiba
アステロイド

一応回答までたどり着けました。よろしくお願いいたします。

Sawaoka
メテオール

何とか回答しました。

yyokoyama
アステロイド

提出します。

・29問目について、解答はStore codeの昇順になっておりますが、問題文にその様な条件が含まれておりません。ご連絡まで。

・30~32問目は解答を参照しながら解きました。

Ken_Taka
アステロイド

回答を送付します。不偏分散やパーセンタイルをググるところから始めました。良い復習となりました。よろしくお願い致します。

OKMT
メテオロイド

回答を送付します。

tkdsnj
メテオール

回答します。

mtakeuchi
メテオロイド

提出します。よろしくお願いします。

rkato2
アステロイド

提出いたします。よろしくお願いします。