◆INデータのレイアウト
顧客NO(文字列)とその属性(配列)についてのトランザクションがあります。
実際のデータは500万行、40カラム程度あります。
顧客NO | 属性 |
100 | ["男性","20","バイト"] |
101 | ["会社員"] |
102 | ["40","会社員"] |
Alteryx上では、汎用接続のODBCで取り込んでいるのですが、
配列部分が以下のように文字化けしてしまいます。
◆文字化け例
顧客NO | 属性 |
100 | ["繧ャ繧ス繝ケ繧ソ繝ウ繝"] |
101 | ["繧ッ繝ォ繝"] |
102 | ["繧ア繝シ繧ソ繧、"] |
何か良い対処法があれば、ご教示いただきたいです。
よろしくお願いいたします。
@Marumoto さん
Treasure Dataは使っていないのでなんとも言い難いのですが、一般的にDBでの文字化けは、格納されている文字列とアプリ側でサポートしている文字コードが異なることから発生していると考えられます。
おそらく、Treasure Data側がUTF8で、Alteryx側がShift-JISで表示しているのではないかと思うのですが・・・。
場合によっては、Alteryx側でConvertFromCodePage関数などで修正できる場合もあります・・・。
元がUTF-8の場合は、
ConvertFromCodePage([Field1], 65001)
で解消されると思います(この場合に、関数の処理後のフィールドがV_WString形式などである必要があります)
ありがとうございます。
大変参考になりました。