Free Trial

ディスカッション - 日本語

答えを見つけ、質問し、Alteryx の専門知識を共有してください。

Treasure Dataからのデータ入力で、配列カラムが文字化けすることに関して

Marumoto
アトム

◆INデータのレイアウト

顧客NO(文字列)とその属性(配列)についてのトランザクションがあります。

実際のデータは500万行、40カラム程度あります。

顧客NO属性
100

["男性","20","バイト"]

101

["会社員"]

102

["40","会社員"]

 

Alteryx上では、汎用接続のODBCで取り込んでいるのですが、

配列部分が以下のように文字化けしてしまいます。

◆文字化け例

顧客NO属性
100

["繧ャ繧ス繝ケ繧ソ繝ウ繝"]

101

["繧ッ繝ォ繝"]

102

["繧ア繝シ繧ソ繧、"]

 

何か良い対処法があれば、ご教示いただきたいです。
よろしくお願いいたします。

3件の返信3
AkimasaKajitani
15 - Aurora
15 - Aurora

@Marumoto さん

 

Treasure Dataは使っていないのでなんとも言い難いのですが、一般的にDBでの文字化けは、格納されている文字列とアプリ側でサポートしている文字コードが異なることから発生していると考えられます。

 

おそらく、Treasure Data側がUTF8で、Alteryx側がShift-JISで表示しているのではないかと思うのですが・・・。

場合によっては、Alteryx側でConvertFromCodePage関数などで修正できる場合もあります・・・。

 

元がUTF-8の場合は、

 

ConvertFromCodePage([Field1], 65001)

 

で解消されると思います(この場合に、関数の処理後のフィールドがV_WString形式などである必要があります)

Marumoto
アトム

ありがとうございます。
大変参考になりました。

AkimasaKajitani
15 - Aurora
15 - Aurora

@Marumoto さま

 

うまく行った場合は、今後同じ問題に出会った方に参考になりますので、是非内容を共有いただけると幸いでございます。