データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(10問目~15問目:データ抽出基礎編)
オプション
- RSS フィードを購読する
- トピックを新着としてマーク
- トピックを既読としてマーク
- このトピックを現在のユーザーにフロートします
- ブックマーク
- 購読
- ミュート
- 印刷用ページ
17 - Castor
08-06-2022
09:15 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編のウィークリーチャレンジ方式による出題第三
3回目は10問目~15問目を一つにまとめてみました。データ抽出の問題ですが、バリエーションが出てきています。
- P-010: 店舗データ(store.csv)から、店舗コード(store_cd)が"S14"で始まるものだけ全項目抽出し、10件表示せよ。
- P-011: 顧客データ(customer.csv)から顧客ID(customer_id)の末尾が1のものだけ全項目抽出し、10件表示せよ。
- P-012: 店舗データ(store.csv)から、住所 (address) に"横浜市"が含まれるものだけ全項目表示せよ。
- P-013: 顧客データ(customer.csv)から、ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まるデータを全項目抽出し、10件表示せよ。
- P-014: 顧客データ(customer.csv)から、ステータスコード(status_cd)の末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。
- P-015: 顧客データ(customer.csv)から、ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まり、末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。
解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。
solutionファイルは次回添付します。
添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。
前回:データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(5問目~9問目:データ抽出基礎編)
※startファイルを8/9 9:00に差し替えました
ラベル:
- ラベル:
- データサイエンス100本ノック
28件の返信28
21 - Polaris
08-08-2022
04:24 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
@AkimasaKajitani
出題ありがとうございます。
3点ほどコメントさせてください
1.第三回?
2.第10問の答え合わせがあっていないと思います。
3. Store.csvのCodingをUTF-8に変換し、読めました。
14 - Magnetar
08-13-2022
08:17 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
15 - Aurora
08-14-2022
10:32 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
できました。
が、どうもネットワークの調子が悪くワークフローが添付できないので、添付は省略し、フィルタツールの中の式だけ記載します。
スポイラ
#10 : StartsWith([store_cd], "S14")
#11 : EndsWith([customer_id], "1")
#12 : Contains([address], "横浜市")
#13 : REGEX_Match([status_cd], "^[A-F].*")
#14 : REGEX_Match([status_cd], ".*[1-9]$")
#15 : REGEX_Match([status_cd], "^[A-F].*[1-9]$")
#11 : EndsWith([customer_id], "1")
#12 : Contains([address], "横浜市")
#13 : REGEX_Match([status_cd], "^[A-F].*")
#14 : REGEX_Match([status_cd], ".*[1-9]$")
#15 : REGEX_Match([status_cd], "^[A-F].*[1-9]$")
100本ノックの問題は以下のような構成になっているらしいので、次回はソートツールの出番ですね。
Masao
メテオール
11-21-2022
02:54 AM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
まだまだ快調です!
yutaro_K
アステロイド
11-24-2023
02:35 AM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
a~fや1~9の条件はもっとうまくやれるだろうなと想像しつつ、諦めてしまいました。復習します。
ヒントに記載があった正規表現というのが気になって後半は使ってみました。
便利そうですが、すべてをこれでやってたらダメなのかなぁとか想像しつつ解いていました。
