こんにちは。
税関別の貿易統計データ(eStat掲載のcsvデータ、横に時系列になっている)を横型→縦型にしたくて、
トランスポーズツールを使ったのですが、キーカラムのユニーク数が意図せず変わって(減って)しまいます。
「Custom」は元データで133個(ユニーク数)なので、トランスポーズ後も133種類であってほしいのですが、トランスポーズ後に意図せず10種類になってしまいました。Countryの数も減ってしまうのですが、そちらもどうして減ってしまうのかわかりません。
ご教示お願いできないでしょうか。
解決済! 解決策の投稿を見る。
@dominono9 さん
2020.3にて閲覧ツールに修正が入りまして、その影響ですべてのデータをプロファイルできていないということだと思います。
(もともとはすべてのデータを見るには閲覧ツール、ということだったのですが・・・)。
具体的には「データプロファイリングの上限が300M」になっているため、
閲覧ツールが全てのデータをプロファイルできていない、ということになります。
(この300Mというのはファイルサイズとは異なるようです)
https://help.alteryx.com/ja/release-notes/designer/designer-20203-release-notes
試しに、CSVの直後と転置の直後に集計ツールを置いてグループ化しますと・・・
1の場所(CSV直後)
2の場所(転置のあと)
ということで、138個のユニークな数値がある、ということになりますので、転置前後で変わっていないことが
わかるかと思いますので、このままWFの作成を続けていただければ・・・。
正確なデータプロファイルをするには、「基本データプロファイル」ツールを使う必要があります。
@AkimasaKajitani さま ありがとうございます。
なるほど。今回のようななケース(簡易検算:ユニーク数かわってないよね?)は、集計ルーツを使うのがよさそうですね。
また、基本プロファイルツールも紹介ありがとうございます。初めて使ってみました。転置後でユニーク数見てみると、25個に、、これも「データプロファイル上限300MBの罠」と認識して大きいデータを扱うときは気を付けるしかないって感じですかね。
今回も勉強になりました。ありがとうございました。
ありがとうございます。
基本プロファイルツール設定変えてみました。
上限を最大の10,000,000にしてみたのですが、25行で変わらなかったんですよね。
もやもやしますね。。。