データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(21問目~26問目:データ抽出中級+カウント編)
- RSS フィードを購読する
- トピックを新着としてマーク
- トピックを既読としてマーク
- このトピックを現在のユーザーにフロートします
- ブックマーク
- 購読
- ミュート
- 印刷用ページ
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編のウィークリーチャレンジ方式による出題第5回目は21問目~26問目を一つにまとめてみました。データ抽出も若干複雑になってきました!
- P-021: レシート明細データ(receipt.csv)に対し、件数をカウントせよ。
- P-022: レシート明細データ(receipt.csv)の顧客ID(customer_id)に対し、ユニーク件数をカウントせよ。
P-023: レシート明細データ(receipt.csv)に対し、店舗コード(store_cd)ごとに売上金額(amount)と売上数量(quantity)を合計せよ。
※出力結果は、店舗コード(store_cd)の昇順で並び替えて出力してください(Alteryxオリジナル条件)
P-024: レシート明細データ(receipt.csv)に対し、顧客ID(customer_id)ごとに最も新しい売上年月日(sales_ymd)を求め、10件表示せよ。
※出力結果は、顧客ID(customer_id)の昇順で並び替えて出力してください(Alteryxオリジナル条件)
※出力結果の項目は、顧客ID(customer_id)、売上年月日(sales_ymd)のみとするP-025: レシート明細データ(receipt.csv)に対し、顧客ID(customer_id)ごとに最も古い売上年月日(sales_ymd)を求め、10件表示せよ。
※出力結果は、顧客ID(customer_id)の昇順で並び替えて出力してください(Alteryxオリジナル条件)
※出力結果の項目は、顧客ID(customer_id)、売上年月日(sales_ymd)のみとするP-026: レシート明細データ(receipt.csv)に対し、顧客ID(customer_id)ごとに最も新しい売上年月日(sales_ymd)と古い売上年月日を求め、両者が異なるデータを10件表示せよ。
※出力結果は、顧客ID(customer_id)の昇順で並び替えて出力してください(Alteryxオリジナル条件)
※最も新しい売上年月日をsales_ymd_max、最も古い売上年月日をsales_ymd_minとする
解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。
solutionファイルは次回添付します。
添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。
前回:データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(16問目~20問目:データ抽出基礎+順位付け編)
- ラベル:
- データサイエンス100本ノック
