ディスカッション

AkimasaKajitani · ‎08-27-2022

一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック構造化データ加工編のウィークリーチャレンジ方式による出題第６回目は27問目～32問目を一つにまとめてみました。今回は統計量の計算です。標準偏差、分散は少し厄介な問題です。

P-027: レシート明細データ（receipt.csv）に対し、店舗コード（store_cd）ごとに売上金額（amount）の平均を計算し、降順でTOP5を表示せよ。
P-028: レシート明細データ（receipt.csv）に対し、店舗コード（store_cd）ごとに売上金額（amount）の中央値を計算し、降順でTOP5を表示せよ。
P-029: レシート明細データ（receipt.csv）に対し、店舗コード（store_cd）ごとに商品コード（product_cd）の最頻値を求め、10件表示させよ。
※出力データは、店舗コード（store_cd）の昇順で並べ、10件を表示すること
P-030: レシート明細データ（receipt.csv）に対し、店舗コード（store_cd）ごとに売上金額（amount）の分散を計算し、降順で5件表示せよ。
※不偏分散をまず出力しましょう。余裕があれば標本分散にもチャレンジしてください
P-031: レシート明細データ（receipt.csv）に対し、店舗コード（store_cd）ごとに売上金額（amount）の標準偏差を計算し、降順で5件表示せよ。
※不偏標準偏差（標本標準偏差）をまず出力しましょう。余裕があれば標準偏差にもチャレンジしてください
P-032: レシート明細データ（receipt.csv）の売上金額（amount）について、25％刻みでパーセンタイル値を求めよ。
※データの持ち方として、横持ち（パーセンタイルと各フィールドとして持つ）と縦持ち（パーセンタイルと値のリストとして持つ）の二つのタイプでデータを整形してください

解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。

solutionファイルは次回添付します。

添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。

前回：データサイエンス100本ノック構造化データ加工編をAlteryxでやってみる（21問目～26問目：データ抽出中級＋カウント編）

yutaro_K · ‎11-27-2023

基本的な統計量が1ツールのみで処理できることを学びました。

パーセンタイル値の設定がどのようにするのかとても迷いました。。。

スポイラ

Hirokane · ‎11-28-2023

よろしくお願いします。

Hashiba · ‎11-29-2023

一応回答までたどり着けました。よろしくお願いいたします。

Sawaoka · ‎12-04-2023

何とか回答しました。

yyokoyama · ‎12-05-2023

提出します。

・29問目について、解答はStore codeの昇順になっておりますが、問題文にその様な条件が含まれておりません。ご連絡まで。

・30~32問目は解答を参照しながら解きました。

Ken_Taka · ‎12-06-2023

回答を送付します。不偏分散やパーセンタイルをググるところから始めました。良い復習となりました。よろしくお願い致します。

OKMT · ‎12-15-2023

回答を送付します。

tkdsnj · ‎12-30-2023

回答します。

mtakeuchi · ‎01-15-2024

提出します。よろしくお願いします。

rkato2 · ‎01-22-2024

提出いたします。よろしくお願いします。

ディスカッション

データサイエンス100本ノック構造化データ加工編をAlteryxでやってみる（27問目～32問目：統計量計算編）

Shape Fileで日本語のフィールド名を使いたい件をIdeaに投稿しました

日本語版コミュニティへようこそ!

Alteryx Skills labのお知らせ

【バグ関連】2020.3にてExcelファイルのパスに２バイト文字を含むと保存できないようです

データサイエンス100本ノック構造化データ加工編をAlteryxでやってみる（１問目～４問目：デー...

ディスカッション

データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる（27問目～32問目：統計量計算編）

Shape Fileで日本語のフィールド名を使いたい件をIdeaに投稿しました

日本語版コミュニティへようこそ!

Alteryx Skills labのお知らせ

【バグ関連】2020.3にてExcelファイルのパスに２バイト文字を含むと保存できないようです

データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる（１問目～４問目：デー...

データサイエンス100本ノック構造化データ加工編をAlteryxでやってみる（27問目～32問目：統計量計算編）

データサイエンス100本ノック構造化データ加工編をAlteryxでやってみる（１問目～４問目：デー...