Free Trial

ディスカッション

答えを見つけ、質問し、Alteryx の専門知識を共有してください。

データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(5問目~9問目:データ抽出基礎編)

AkimasaKajitani
17 - Castor
17 - Castor

一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編のウィークリーチャレンジ方式による出題第二回です。興味のある方は参加いただければと思います。

 

 

2回目は5問目~9問目を一つにまとめてみました。簡単なデータ抽出の問題です。

 

  • P-005: レシート明細データ(receipt.csv)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の全ての条件を満たすデータを抽出せよ。

    ・顧客ID(customer_id)が"CS018205000001"
    ・売上金額(amount)が1,000以上

 

  • P-006: レシート明細データ(receipt.csv)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上数量(quantity)、売上金額(amount)の順に列を指定し、以下の全ての条件を満たすデータを抽出せよ。

    ・顧客ID(customer_id)が"CS018205000001"
    ・売上金額(amount)が1,000以上または売上数量(quantity)が5以上

 

  • P-007: レシート明細データ(receipt.sv)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の全ての条件を満たすデータを抽出せよ。

    ・顧客ID(customer_id)が"CS018205000001"
    ・売上金額(amount)が1,000以上2,000以下

 

  • P-008: レシート明細データ(receipt.csv)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の全ての条件を満たすデータを抽出せよ。

    ・顧客ID(customer_id)が"CS018205000001"
    ・商品コード(product_cd)が"P071401019"以外

 

  • P-009: 以下の処理において、出力結果を変えずにORをANDに書き換えよ。

    NOT([prefecture_cd] = "13" OR [floor_area] > 900)

    ※Alteryx用にPythonの問題から書き換えています

 

 

解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。

 

 

solutionファイルは次回添付します。

 

添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。

 

前回:データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(1問目~4問目:データ抽出基礎編)

28件の返信28
Hashiba
アステロイド

できました。よろしくお願いいたします。

Hirokane
アステロイド

よろしくお願いします。

Sawaoka
メテオール

回答しました。
最初条件式でエラーが出た時に、条件式の書き方の問題ではないと気付くのに時間がかかりました。

tsaito333
メテオロイド

よろしくお願いいたします。

Khanipura
メテオール

ご確認お願いします。

yyokoyama
アステロイド

最適な回答かわかりませんが、回答送付します

Ken_Taka
アステロイド

回答送付します。よろしくお願い致します。

OKMT
メテオロイド

回答送付いたします。

mtakeuchi
メテオロイド

課題を提出いたします。

mtakeuchi
メテオロイド

課題を提出いたします。