(情報共有)入力データツール の File Format: Excel Legacy で文字化けが回避できた件
- RSS フィードを購読する
- トピックを新着としてマーク
- トピックを既読としてマーク
- このトピックを現在のユーザーにフロートします
- ブックマーク
- 購読
- ミュート
- 印刷用ページ
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
入力データツール で ある Excel ファイル を読み込んだ際に なぜか
記号や全角英字などが 以下のように Hex コードで抽出されて困っていました。
文字化けにはいろいろな出方や原因がありますので、対処法もケースバイケースですが、
今回の化け方から、恐らくExcelの内部で使用されるエスケープシーケンスが影響していると思われたので
ツールの File Format オプションを 以下のように
"Microsoft Excel (*.xlsx)" から "Microsoft Excel Legacy (*.xlsx)" に変えてみたところ;
以下のようにキレイに読み出せるようになりました✌️
以上、文字化けの際のご参考になれば幸いです(すでにご存じでしたらすみません)。
なお、Excel Legacy フォーマットについては
下記の @AkimasaKajitani さんのブログ記事を参考にさせて頂きました。
【AlteryxTips】Excelファイルの読み込みについての注意事項
|
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
共有ありがとうございます。ちなみに、このようなExcelになる際に、なにか再現性などあるのでしょうか?
ちょっとXMLの中身を見てみたい感じですね・・・。
※ちなみに、弊社ブログは私のみで書いてるわけではないので、私のブログ、ではなく弊社のブログ、ですかね・・・(とはいえ、リンクいただいたのは私が書いている記事なので間違いではないですが・・・(笑)。
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
>弊社ブログは私のみで書いてるわけではないので
失礼しました 😅 Author が AkimasaKajitani になっていたので。
>ちょっとXMLの中身を見てみたい
.xlsx を unzip して xl/sharedStrings.xml の中身をみると、もともと Hex で入っています。
...
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
Alteryxで書き込むとxl/sharedStrings.xml は作成されないですが、Excelで上書きすると出てきますね・・・。
でも、普通の文字で入っているので、SAS側のExcelの作り方の問題ですね・・・そもそもUnicode文字列そのまま書き込むのが仕様通りなのかどうかよくわかりませんが・・・(さすがにMSの仕様まではちょっと読む気にはならないです・・・)。
ちょこちょこMicrosoft以外が作るExcelファイルってExcel以外で読み込もうとするとおかしいケースがあるので要注意ですね・・・。
一度CASEであげてみて反応を見るのも手かな、と思います。
(標準の接続はネイティブドライバですが、レガシーだとMicrosoftのドライバなので、そっちの方だとExcelが読み込んでいるのと同じように読み込めるのかもしれません)。
