ディスカッション - 日本語

答えを見つけ、質問し、Alteryx の専門知識を共有してください。
解決済み

トランスポーズツールで、意図せず、キーカラムのレコードの種類(ユニーク数)が変わってしまう。

dominono9
メテオール

こんにちは。

 

税関別の貿易統計データ(eStat掲載のcsvデータ、横に時系列になっている)を横型→縦型にしたくて、

トランスポーズツールを使ったのですが、キーカラムのユニーク数が意図せず変わって(減って)しまいます。

 

「Custom」は元データで133個(ユニーク数)なので、トランスポーズ後も133種類であってほしいのですが、トランスポーズ後に意図せず10種類になってしまいました。Countryの数も減ってしまうのですが、そちらもどうして減ってしまうのかわかりません。

ご教示お願いできないでしょうか。

 

 

キャプチャ.JPG

AkimasaKajitani
マグネター

@dominono9 さん

 

2020.3にて閲覧ツールに修正が入りまして、その影響ですべてのデータをプロファイルできていないということだと思います。

(もともとはすべてのデータを見るには閲覧ツール、ということだったのですが・・・)。

 

具体的には「データプロファイリングの上限が300M」になっているため、

閲覧ツールが全てのデータをプロファイルできていない、ということになります。

(この300Mというのはファイルサイズとは異なるようです)

https://help.alteryx.com/ja/release-notes/designer/designer-20203-release-notes

 

 

試しに、CSVの直後と転置の直後に集計ツールを置いてグループ化しますと・・・

 

AkimasaKajitani_0-1614960903755.png

 

1の場所(CSV直後)

AkimasaKajitani_1-1614961009667.png

 

2の場所(転置のあと)

AkimasaKajitani_2-1614961033091.png

 

ということで、138個のユニークな数値がある、ということになりますので、転置前後で変わっていないことが

わかるかと思いますので、このままWFの作成を続けていただければ・・・。

 

正確なデータプロファイルをするには、「基本データプロファイル」ツールを使う必要があります。

 

AkimasaKajitani_4-1614961236992.png

 

AkimasaKajitani_3-1614961215775.png

 

dominono9
メテオール

@AkimasaKajitani さま ありがとうございます。

 

なるほど。今回のようななケース(簡易検算:ユニーク数かわってないよね?)は、集計ルーツを使うのがよさそうですね。

また、基本プロファイルツールも紹介ありがとうございます。初めて使ってみました。転置後でユニーク数見てみると、25個に、、これも「データプロファイル上限300MBの罠」と認識して大きいデータを扱うときは気を付けるしかないって感じですかね。

 

今回も勉強になりました。ありがとうございました。

 

キャプチャ.JPG

AkimasaKajitani
マグネター

@dominono9 さん

 

基本データプロファイルツールも、設定値を変えないと正確に計測できないので、

設定してみてください・・・。

 

AkimasaKajitani_0-1615005185250.png

 

 

dominono9
メテオール

@AkimasaKajitani さん

ありがとうございます。

 

基本プロファイルツール設定変えてみました。

上限を最大の10,000,000にしてみたのですが、25行で変わらなかったんですよね。

 

もやもやしますね。。。

名称未設定-1.jpg

AkimasaKajitani
マグネター

@dominono9 さん

 

セレクトで項目をしぼったら(Customのみにする)正確に出ましたね・・・。

 

AkimasaKajitani_1-1615462189582.png

 

なにかの制限がありそうですが、そこが明確ではないですね・・・。