Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

ディスカッション

答えを見つけ、質問し、Alteryx の専門知識を共有してください。

データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(33問目~38問目:データ抽出・データ結合編)

AkimasaKajitani
17 - Castor
17 - Castor

一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編のウィークリーチャレンジ方式による出題第7回目は33問目~38問目を一つにまとめてみました。今回はデータ抽出、データ結合で比較的素直な問題が多いかと思います。

 

  • P-033: レシート明細データ(receipt.csv)に対し、店舗コード(store_cd)ごとに売上金額(amount)の平均を計算し、330以上のものを抽出せよ。

    ※結果はstore_cdの昇順に並べ替えること

  • P-034: レシート明細データ(receipt.csv)に対し、顧客ID(customer_id)ごとに売上金額(amount)を合計して全顧客の平均を求めよ。ただし、顧客IDが"Z"から始まるものは非会員を表すため、除外して計算すること。
  • P-035: レシート明細データ(receipt.csv)に対し、顧客ID(customer_id)ごとに売上金額(amount)を合計して全顧客の平均を求め、平均以上に買い物をしている顧客を抽出し、10件表示せよ。ただし、顧客IDが"Z"から始まるものは非会員を表すため、除外して計算すること。

    ※出力結果は、顧客ID(customer_id)の昇順で並び替えて出力してください(Alteryxオリジナル条件)

  • P-037: 商品データ(product.csv)とカテゴリデータ(category.csv)を内部結合し、商品データの全項目とカテゴリデータのカテゴリ小区分名(category_small_name)を10件表示せよ。

    ※出力結果は、product_cdの昇順としてください

  • P-036: レシート明細データ(receipt.csv)と店舗データ(store.csv)を内部結合し、レシート明細データの全項目と店舗データの店舗名(store_name)を10件表示せよ。

    ※出力結果は、元のreceipt.csvの並びのままとしてください(Alteryxオリジナル条件)

  • P-038: 顧客データ(customer.csv)とレシート明細データ(receipt.csv)から、顧客ごとの売上金額合計を求め、10件表示せよ。ただし、売上実績がない顧客については売上金額を0として表示させること。また、顧客は性別コード(gender_cd)が女性(1)であるものを対象とし、非会員(顧客IDが"Z"から始まるもの)は除外すること。

    ※出力データの並びは、customer.csvのデータ順とする

※36と37は意図的に順序を変えています

 

解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。

 

 

solutionファイルは次回添付します。

 

添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。

 

前回:データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(27問目~32問目:統計量計算編)

 

※customer.csvが含まれていなかったので、更新しました

21件の返信21
Yoshiro_Fujimori
オーロラ

回答します。

(データファイルが大きいので.yxmdファイルのみ添付します)

スポイラ
#33
Yoshiro_Fujimori_0-1662352539256.png

#34

Yoshiro_Fujimori_1-1662352584036.png

#35

Yoshiro_Fujimori_2-1662352636301.png

#37

Yoshiro_Fujimori_3-1662352717003.png

#36

Yoshiro_Fujimori_4-1662352773619.png

#38: customer.csv は追加しました。

Yoshiro_Fujimori_5-1662352821989.png

 

AkimasaKajitani
17 - Castor
17 - Castor

@Yoshiro_Fujimori さん

 

メッセージありがとうございます。customer.csvファイルを追加したものをアップしました。

 

sanae
ボリード

できました!

スポイラ
100knocks_alteryx_01_033-03_sanae.png
Qiu
20 - Arcturus
20 - Arcturus

やってみました。

スポイラ
100knocks_alteryx_01_033-038.PNG
AkimasaKajitani
17 - Castor
17 - Castor

できました!

 

スポイラ
AkimasaKajitani_0-1662773310219.png
AkimasaKajitani_1-1662773342559.png
AkimasaKajitani_2-1662773369262.png

 

 

DaisukeTsuchiya
パルサー

周回遅れですが、できました。

 

スポイラ
キャプチャ.JPG
Masao
メテオール

できました!

他の方の解答を見ていたらレコード選択ツールなどというものがあることに気づきました。ピンポイントで狙えるんですね。

「準備」のツールセットの中に入っていないので存在そのものに気づいていませんでした。。。

スポイラ
Masao_0-1669633436350.png

 

gawa
15 - Aurora
15 - Aurora

処理の途中経過を、別の処理のインプットに使えるというのが、ETLのいいところですね。

スポイラ
image.png

メモ

このへんから、JOINの概念が分かってないと辛くなってくる

Hirokane
アステロイド

よろしくお願いします。