Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

ウィークリーチャレンジ

トップになるためのスキルをお持ちですか? ウィークリーチャレンジを購読しましょう。ベストを尽くして問題を解決し、解決策を共有して、他のユーザーがどのように同じ問題に取り組んだのか確認しましょう。私たちも解答例を共有しています。

チャレンジ #53: Alteryx Designer Expert 認定試験の問題

SaoriG
Alteryx Alumni (Retired)

先週の解答はこちらで確認できます 

 

Alteryx Designer Expert 認定試験の問題をこっそり覗いて見たいと思ったことはありませんか? もしかして、そんなこともあるかもしれないと思ったので、引退したExpert 認定の問題の1つをウィークリーチャレンジとしてリリースします! この問題は;@CristonS  が作成し、2018年の夏にアナハイムで最初のExpert 認定試験の問題としてデビューしました。この問題には誰もが苦労し、ほとんどの人が解答するのを避けたので、もしこの問題が威圧的だと思ったとしても、それはあなただけではありません!  

実際の試験の問題と同じ形式で、入力ファイルだけを表示します。

 

あなたには複数の変数を含むデータセット (Q2_variables.yxdb) が提供されます。まず、変数重要度プロットから、Mean Decreace Gini 係数が最も高い10個の数値変数を選択してください。 次に、これらの変数を使用して、ターゲット変数 [H0] を予測するモデルを構築してください。

そして以下のような 2つのモデルをつくり、比較してください。1つは選択したすべての変数に基づいており、もう1つは [F_38] を除いた変数を含んでいるモデルです。

変数 [F_38] をモデルから削除することにより、どのような影響がありますか?解答としてカイ二乗検定 (Chi-Sq) の効果を求めてください。

DaisukeTsuchiya
パルサー

機械学習素人なので全く自信ないですでが、Weekly Challengeの皆勤賞を守るため投稿してみます。(青、赤、黄のコンテナが解答のつもりで、それ以外はテストしてみたものです。)

スポイラ
キャプチャ.PNG



AkimasaKajitani
17 - Castor
17 - Castor

Expertは相当難しいですね・・・

スポイラ
英語版の157に該当する問題みたいで、すみません、チラ見しました(変数重要度プロットまではわかったのですが、カイジ②二乗検定がよくわからず)・・・。

とはいえ設定まで見てないのであってるかどうかわかりませんが、とりあえずミソは入れ子型テストツールみたいで、これでChi-Sqが一発で出てくるのに愕然としました・・・。

VarImportance.pngwf.pngkouka.png

Expertは機械学習系が出てくるので、よく学習しないと厳しいですね(空間系は大丈夫(だと信じてる)なのですが)。

DaisukeTsuchiya
パルサー

なるほど、面白いですね。こんなことができるのですか。0,1には機械学習のこれを使うとかの常識がないので少しずつ勉強してみます。

AkimasaKajitani
17 - Castor
17 - Castor

@DaisukeTsuchiya さん

 

Designerに付属しているサンプルワークフローが参考にはなりますね。今回の問題ではあまり参考になりませんでしたが、逆にこの問題で色々と学んだことも多いです。

まぁ、Predictive系はそもそもの機械学習のスタンダードなやり方を知らないとうまく使いこなせないですね・・・。今度も知見をためていきたいところです。

gawa
15 - Aurora
15 - Aurora

みなさんのスポイラをカンニングしましたが、それでも結構はまりました。Expert恐るべし・・・

スポイラ
gawa_0-1635128792929.png

χ2乗検定は、ノーヒントだと無理でした

公式回答だと、変数10個選んだあとに相関係数求めて多重共線性のチェックしてました。こういうのって、機械学習のマナーなんでしょうか?

AkimasaKajitani
17 - Castor
17 - Castor

@gawa さん

 

>公式回答だと、変数10個選んだあとに相関係数求めて多重共線性のチェックしてました。こういうのって、機械学習のマナーなんでしょうか?

 

多重共線性のチェックはすべきかと思います。

最初にアソシエーション分析ツールで弾いたり、という形がスタンダードですね。

 

このあたりはインタラクティブレッスンの予測分析のパートが勉強になります。

 

ntakeda
ボリード

まったくわからなかったので、

インタラクティブレッスンで勉強しました。

少しだけ理解できるようになりました。

スポイラ
ntakeda_0-1654590283367.png

 

Tokimatsu
クエーサー

やってみましたが。。。

スポイラ
 いろいろ調べて解いてみましたが、身についた気がしません。

スクリーンショット 2023-08-21 193622.png