Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

ディスカッション

答えを見つけ、質問し、Alteryx の専門知識を共有してください。

Treasure Dataからのデータ入力で、配列カラムが文字化けすることに関して

Marumoto
アトム

◆INデータのレイアウト

顧客NO(文字列)とその属性(配列)についてのトランザクションがあります。

実際のデータは500万行、40カラム程度あります。

顧客NO属性
100

["男性","20","バイト"]

101

["会社員"]

102

["40","会社員"]

 

Alteryx上では、汎用接続のODBCで取り込んでいるのですが、

配列部分が以下のように文字化けしてしまいます。

◆文字化け例

顧客NO属性
100

["繧ャ繧ス繝ケ繧ソ繝ウ繝"]

101

["繧ッ繝ォ繝"]

102

["繧ア繝シ繧ソ繧、"]

 

何か良い対処法があれば、ご教示いただきたいです。
よろしくお願いいたします。

3件の返信3
AkimasaKajitani
17 - Castor
17 - Castor

@Marumoto さん

 

Treasure Dataは使っていないのでなんとも言い難いのですが、一般的にDBでの文字化けは、格納されている文字列とアプリ側でサポートしている文字コードが異なることから発生していると考えられます。

 

おそらく、Treasure Data側がUTF8で、Alteryx側がShift-JISで表示しているのではないかと思うのですが・・・。

場合によっては、Alteryx側でConvertFromCodePage関数などで修正できる場合もあります・・・。

 

元がUTF-8の場合は、

 

ConvertFromCodePage([Field1], 65001)

 

で解消されると思います(この場合に、関数の処理後のフィールドがV_WString形式などである必要があります)

Marumoto
アトム

ありがとうございます。
大変参考になりました。

AkimasaKajitani
17 - Castor
17 - Castor

@Marumoto さま

 

うまく行った場合は、今後同じ問題に出会った方に参考になりますので、是非内容を共有いただけると幸いでございます。