一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編のウィークリーチャレンジ方式による出題第5回目は21問目~26問目を一つにまとめてみました。データ抽出も若干複雑になってきました!
P-023: レシート明細データ(receipt.csv)に対し、店舗コード(store_cd)ごとに売上金額(amount)と売上数量(quantity)を合計せよ。
※出力結果は、店舗コード(store_cd)の昇順で並び替えて出力してください(Alteryxオリジナル条件)
P-024: レシート明細データ(receipt.csv)に対し、顧客ID(customer_id)ごとに最も新しい売上年月日(sales_ymd)を求め、10件表示せよ。
※出力結果は、顧客ID(customer_id)の昇順で並び替えて出力してください(Alteryxオリジナル条件)
※出力結果の項目は、顧客ID(customer_id)、売上年月日(sales_ymd)のみとする
P-025: レシート明細データ(receipt.csv)に対し、顧客ID(customer_id)ごとに最も古い売上年月日(sales_ymd)を求め、10件表示せよ。
※出力結果は、顧客ID(customer_id)の昇順で並び替えて出力してください(Alteryxオリジナル条件)
※出力結果の項目は、顧客ID(customer_id)、売上年月日(sales_ymd)のみとする
P-026: レシート明細データ(receipt.csv)に対し、顧客ID(customer_id)ごとに最も新しい売上年月日(sales_ymd)と古い売上年月日を求め、両者が異なるデータを10件表示せよ。
※出力結果は、顧客ID(customer_id)の昇順で並び替えて出力してください(Alteryxオリジナル条件)
※最も新しい売上年月日をsales_ymd_max、最も古い売上年月日をsales_ymd_minとする
解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。
solutionファイルは次回添付します。
添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。
前回:データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(16問目~20問目:データ抽出基礎+順位付け編)
やってみました。
できました!
はじめはSummarizeツールに苦戦しましたが、少し感覚がつかめた気がします。