先週の解答はこちらで確認できます
Alteryx Designer Expert 認定試験の問題をこっそり覗いて見たいと思ったことはありませんか? もしかして、そんなこともあるかもしれないと思ったので、引退したExpert 認定の問題の1つをウィークリーチャレンジとしてリリースします! この問題は;@CristonS が作成し、2018年の夏にアナハイムで最初のExpert 認定試験の問題としてデビューしました。この問題には誰もが苦労し、ほとんどの人が解答するのを避けたので、もしこの問題が威圧的だと思ったとしても、それはあなただけではありません!
実際の試験の問題と同じ形式で、入力ファイルだけを表示します。
あなたには複数の変数を含むデータセット (Q2_variables.yxdb) が提供されます。まず、変数重要度プロットから、Mean Decreace Gini 係数が最も高い10個の数値変数を選択してください。 次に、これらの変数を使用して、ターゲット変数 [H0] を予測するモデルを構築してください。
そして以下のような 2つのモデルをつくり、比較してください。1つは選択したすべての変数に基づいており、もう1つは [F_38] を除いた変数を含んでいるモデルです。
変数 [F_38] をモデルから削除することにより、どのような影響がありますか?解答としてカイ二乗検定 (Chi-Sq) の効果を求めてください。
Expertは相当難しいですね・・・
なるほど、面白いですね。こんなことができるのですか。0,1には機械学習のこれを使うとかの常識がないので少しずつ勉強してみます。
Designerに付属しているサンプルワークフローが参考にはなりますね。今回の問題ではあまり参考になりませんでしたが、逆にこの問題で色々と学んだことも多いです。
まぁ、Predictive系はそもそもの機械学習のスタンダードなやり方を知らないとうまく使いこなせないですね・・・。今度も知見をためていきたいところです。
みなさんのスポイラをカンニングしましたが、それでも結構はまりました。Expert恐るべし・・・
χ2乗検定は、ノーヒントだと無理でした
公式回答だと、変数10個選んだあとに相関係数求めて多重共線性のチェックしてました。こういうのって、機械学習のマナーなんでしょうか?
@gawa さん
>公式回答だと、変数10個選んだあとに相関係数求めて多重共線性のチェックしてました。こういうのって、機械学習のマナーなんでしょうか?
多重共線性のチェックはすべきかと思います。
最初にアソシエーション分析ツールで弾いたり、という形がスタンダードですね。
このあたりはインタラクティブレッスンの予測分析のパートが勉強になります。
やってみましたが。。。