先週のチャレンジの回答はこちらで見つけることができます。
このチャレンジは @gawa さんからのものです。Ippei さん、ご投稿ありがとうございました!
ほとんどの人は、ポケモンに馴染みがあるでしょうし、そうでなくとも、少なくともピカチューの象徴的な黄色い顔をどこかで見たことがあるでしょう。ポケモンは、その独自の属性と技によって特徴づけられ、タイプとして知られている18の異なるバリエーションにグループ化されています。それぞれのポケモンは、1つまたは2つのタイプに関連付けることができます。例えば、ヒトカゲ(Charmander)は単一のタイプ(ほのお(Fire))であり、一方フシギダネ(Bulbasaur)はデュアルタイプ(くさ(Grass)とどく(Poison))です。
このチャレンジでは、ポケモンの名前、主タイプ(タイプ1)、副タイプ(タイプ2)およびスピード、世代などの追加特性など、ポケモンの詳細を含む包括的なデータセットが用意されています。あなたのタスクは、ポケモンの組み合わせのタイプである、タイプ1と2を分析し、このデータセットに存在しない組み合わせを特定することです。例えば、データセットには、「むし(Bug)」タイプと「あく(Dark)」タイプの組み合わせを持つポケモンは存在しません。
注:出力は、単一の組み合わせのみを含む必要があります。つまり、「タイプ1:くさ(Grass)、タイプ2:どく(Poison)」の組み合わせは、「タイプ1:どく(Poison)、タイプ2:くさ(Grass)」と同じとみなします。
ソース: https://gist.github.com/armgilles/194bcff35001e7eb53a2a8b441e8b2c6#file-pokemon-csv
@AYXAcademy I'm afraid of that this challenge is from @gawa -san. please fix it.
Thanks @AkimasaKajitani and sorry @gawa !!! We'll fix it now.
@DaisukeTsuchiya さん、@sanae さん、ありがとうございます。私が出題時に作った1発目のWFも結構ごちゃっとしてました😅
せっかく無料お試し期間中なので、Designer Cloud版も。
できました!
Designer Desktop
Designer Cloud(Designer Experience)
@gawa さん
フィールド付加するとデータのサンプリングのせいでレコードが減るので結果を確認しにくくなるのはどうしようもないですね。これはTrifactaも同様なのですが・・・。正直ここがDesigner Cloudの一番使いにくい部分だと自分は認識しています。時間かかってもフルデータ読み込みオプションがほしいところです。
Trifacta Classic
・逆パターン避けをするのに、ArrayにしてからArraySortするのが一番楽みたいです
・フィールド付加ツールのかわりに、クロスジョインでやっています
そして @gawa さん採用おめでとうございます!ぜひTrifactaも使ってみてください。使い勝手が違いすぎて結構最初つらいですけど、意外とこれはこれで楽しいです。
この問題は初級タグついてますが、かなり嘘ですよね・・・(笑)
Trifactaでも解いてみましたが、これはもうAlteryxとは別物ですね。サーバ立てるほどでもないSystem間の単純なパイプとかには良い気がします。今まで触ったETL製品の中では、Azure Data Factoryに近い感じがしました。
アイディアを提出した際に"Beginner Level"にチェックいれたので、初級のカテゴリーで登録されたようですが、これは中級相当です。みなさんごめんなさい。
@gawa さん
実はこの問題はTrifactaだとちょっとしんどい系の問題ですね・・・。TrifactaはTableau Prepに近い使い勝手かな、と思います(Prepに比べると非常に強力な機能を持っていますが)。ちなみにGoogleのDataprepはTrifactaのOEM版です(名前もDataprep by Trifactaなのでご存知の方もいらっしゃるかと思います)。