Free Trial

ウィークリーチャレンジ - 日本語

トップになるためのスキルをお持ちですか? ウィークリーチャレンジを購読しましょう。ベストを尽くして問題を解決し、解決策を共有して、他のユーザーがどのように同じ問題に取り組んだのか確認しましょう。私たちも解答例を共有しています。

チャレンジ #115: 領収書のデータ抽出

SaoriG
Alteryx Community Team
Alteryx Community Team

先週のチャレンジに対する解答はこちらになります。 262_image_crop.png

 

今週のチャレンジは @phottovy さんからです!

 

Alteryx をしばらく使っている間にデータ解析はすっかり習得されたのではないでしょうか?

今回は社外で作成されたレポートをクリーンアップして、必要なデータだけ抽出するタスクに挑戦してみましょう。

r4upadhye
ボリード

出来た!

 

スポイラ
キャプチャ.JPG
Qiu
キャスター

@SaoriG 
力作業になりました。

スポイラ
challenge_ja_115.PNG
DaisukeTsuchiya
クエーサー

あまりきれいな処理とは言えませんができました。

 

スポイラ
ハイフンの長さで分割、動的リネームを用いてヘッダーを処理しましたが、汎用性はいまいち無いです…。

キャプチャ.JPG

gawa
ファイアボール
スポイラ
gawa_0-1620709712134.png

 

こういう汚いデータのパース処理は、業務でもやってます。せめて区切り文字いれてくれ・・・といつも思ってます。笑

sanae
コメット

超力ずくになりました。
わたしはマクロ使う方法しか思い浮かばなかったです・・・。

スポイラ
ハイフンの数から切り出す位置と長さを特定し、Substringで切り出すというのをマクロでぐるぐるやりました。
でもそんな回りくどいことしなくてもできるんですね・・・。

■メインフロー
challenge_ja_115_start_sanae_Main.png

■マクロ
challenge_ja_115_start_sanae_Macro.png

 

 

AkimasaKajitani
オーロラ

こういうログっていろんな形式ででてきますよね・・・。

今回のサンプルも、ちゃんと仕様がわかってないと、実用になると思わぬ形式で出てきたりすることがあるので、サンプルだけだとすべてのパターンを網羅できないので、なかなか一筋縄じゃいかないですよね・・・。

 

スポイラ

今回は英語版のコピペじゃなくて改めてやってみました。
正規表現でいくか、列分割で行くか悩ましいところではありますが、こういう固定長テキスト的なものは正規表現で文字数カウントしながらやった方が確実な気はしています。

AkimasaKajitani_0-1620747106200.png


正直、業務でやるなら動的なWF作るのに時間かけるより、もう決め打ちでいっちゃう気がします(結局データの仕様を理解しているかどうか、だと思いますが)

DaisukeTsuchiya
クエーサー

皆さんのワークフロー拝見しました。色々個性があって面白いですね。

@AkimasaKajitani さん、正規表現を関数で作っているのは恐れ入りました。確かに今回は決め打ちのほうが楽そうではありますが、勉強になりました。

AkimasaKajitani
オーロラ

@DaisukeTsuchiya さん

 

単にものぐさなだけでして・・・。いちいち数えるのが面倒だったのでフォーミュラツールで作りました・・・(だいたい数え間違えるので)。

 

ntakeda
アステロイド

フィールド名は文字数以外のやり方がわからなかったです。

スポイラ
ntakeda_0-1625929925949.png