Free Trial

ディスカッション - 日本語

答えを見つけ、質問し、Alteryx の専門知識を共有してください。
解決済み

データ入力のコードページで扱える文字コードを増やす方法

post
メテオロイド

手元にあるデータの文字コードが「EUC-JP」なのですが

「データ入力」のコードページで選択できる文字コードの一覧に「EUC-JP」がありません。

 

リストには以下の計26種類しか表示されていません。

ANSI 10種

EBCDIC 2種

ISO-8859 10種

MAC

GB18030

UTF-8,UTF-16

 

データ入力のコードページで扱える文字コードを増やす方法を教えてください。

2件の返信2
AkimasaKajitani
16 - Nebula
16 - Nebula

古いバージョンのAlteryxでは日本語Shift-JisやUTF-8も普通には読めませんでしたが、最近のバージョンではデータ入力ツールで指定するだけでできるようになりましたが、たしかにEUC-JPはありませんね・・・。

 

デフォルトで用意されていない文字コードのデータを読み込む場合は、まず「ISO 8859-1ラテン語I」で読み込み、そこから関数「ConvertFromCodePage」を使い、コードページ変換を行う必要があります(昔は全部この方法で読み込みを行っていました)。

 

WFとしては以下のような感じになります。

AkimasaKajitani_0-1591785444935.png

この際、ヘッダが文字化けしてしまうので、一旦「先頭行にフィールド名を含める」オプションをはずして読み込み、動的リネームツールで「データの最初の行からフィールド名を取得」でフィールド名をリネームするという方法を取ると良いかと思います。

 

データ入力ツールの設定:

説明1.png

 

 

複数フィールドフォーミュラの設定:

※なんか最近 出力形式を変更オプションが埋まって見えなくて・・・バグ??

 

関数は、「ConvertFromCodePage([_CurrentField_], 20932)」です。

出力形式はV_WStringにしてください。デフォルトだとStringなどになっており、日本語を格納できません(文字化けします)。

 

説明2.png

 

動的リネーム設定:

説明3.png

 

結果:

説明4.png

ちなみに、コードページを増やす方法は、Alteryx社にお願いするしかないと思います・・・ CommunityのIdeaのページに投稿することで増えるかもしれません

post
メテオロイド

ありがとうございました。

無事に解決しました。