Free Trial

ディスカッション

答えを見つけ、質問し、Alteryx の専門知識を共有してください。

データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(10問目~15問目:データ抽出基礎編)

AkimasaKajitani
17 - Castor
17 - Castor

一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編のウィークリーチャレンジ方式による出題第三

3回目は10問目~15問目を一つにまとめてみました。データ抽出の問題ですが、バリエーションが出てきています。

 

  • P-010: 店舗データ(store.csv)から、店舗コード(store_cd)が"S14"で始まるものだけ全項目抽出し、10件表示せよ。
  • P-011: 顧客データ(customer.csv)から顧客ID(customer_id)の末尾が1のものだけ全項目抽出し、10件表示せよ。
  • P-012: 店舗データ(store.csv)から、住所 (address) に"横浜市"が含まれるものだけ全項目表示せよ。
  • P-013: 顧客データ(customer.csv)から、ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まるデータを全項目抽出し、10件表示せよ。
  • P-014: 顧客データ(customer.csv)から、ステータスコード(status_cd)の末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。
  • P-015: 顧客データ(customer.csv)から、ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まり、末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。

 

解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。

 

 

solutionファイルは次回添付します。

 

添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。

 

前回:データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(5問目~9問目:データ抽出基礎編)

 

※startファイルを8/9 9:00に差し替えました

28件の返信28
Qiu
21 - Polaris
21 - Polaris

@AkimasaKajitani 
出題ありがとうございます。

3点ほどコメントさせてください

1.第三回?

2.第10問の答え合わせがあっていないと思います。

3.  Store.csvのCodingをUTF-8に変換し、読めました。

スポイラ
100knocks_alteryx_01_010-015-1.PNG100knocks_alteryx_01_010-015-2.PNG100knocks_alteryx_01_010-015-3.png
AkimasaKajitani
17 - Castor
17 - Castor

@Qiu さん

 

ご指摘ありがとうございます。

差し替えたファイルをアップしました・・・。

 

sanae
ボリード

やってみました!

スポイラ
100knocks_alteryx_01_010-01_sanae.png
AkimasaKajitani
17 - Castor
17 - Castor

できました!

 

スポイラ
AkimasaKajitani_0-1660391862231.pngAkimasaKajitani_1-1660391890486.png

 

 まだまだ基本的な問題ですね・・・。

DaisukeTsuchiya
14 - Magnetar
14 - Magnetar

周回遅れですが、やってみました。

 

スポイラ
 昔は正規表現苦手でしたが、最近はWeekly Challengeで慣れてきて業務でもよく使います。

 

キャプチャ.JPG
Yoshiro_Fujimori
15 - Aurora
15 - Aurora

できました。

が、どうもネットワークの調子が悪くワークフローが添付できないので、添付は省略し、フィルタツールの中の式だけ記載します。

スポイラ
#10 : StartsWith([store_cd], "S14")
#11 : EndsWith([customer_id], "1")
#12 : Contains([address], "横浜市")
#13 : REGEX_Match([status_cd], "^[A-F].*")
#14 : REGEX_Match([status_cd], ".*[1-9]$")
#15 : REGEX_Match([status_cd], "^[A-F].*[1-9]$")

100本ノックの問題は以下のような構成になっているらしいので、次回はソートツールの出番ですね。

 

Yoshiro_Fujimori_0-1660540939444.png

 

 

Masao
メテオール

まだまだ快調です!

スポイラ
Masao_0-1669027587193.png

 

gawa
16 - Nebula
16 - Nebula

まだまだ青ツールだけでいけますね~

スポイラ
image.png

メモ

正規表現なしでもいける

yutaro_K
アステロイド

a~fや1~9の条件はもっとうまくやれるだろうなと想像しつつ、諦めてしまいました。復習します。
ヒントに記載があった正規表現というのが気になって後半は使ってみました。
便利そうですが、すべてをこれでやってたらダメなのかなぁとか想像しつつ解いていました。

スポイラ

 
answer.png
トップのソリューション投稿者