Alteryxにデータを取り込むとき、多くのユーザーはデータタイプと構造をチェックするために選択ツールをよく追加しています。ツールで利用可能な操作/機能は、使用されているデータ型に合わせて調整できるため、データ型は非常に重要です。
たとえば、基本的なフィルタツールを使用する場合、文字列フィールドは「equals」や「contains」などの文字列演算子で埋められますが、「> =」や「isnull」などの演算子は数値フィールドに含まれます。
データ型を確認/変更するにはどうすればいいですか?
オートフィールドツール
- オートフィールドツールを使用して、各実行時にデータセットを評価し、Alteryxに適切なタイプとサイズを決定させます。データが変更された場合は、オートフィールドツールによって設定されるタイプとサイズが調整されます。これはデータ処理の高速化を図るときに特に役立ちます。Alteryxは最も効率的なサイズとデータタイプを割り当てようとするからです。
- このツールは完璧ではないでしょうし、Alteryxに決定させたくない場合があるかもしれません。例えば、郵便番号のフィールドは、Alteryxには数字であるように見えてしまいます。Alteryxはそれを数字として設定してしまうため、マサチューセッツ州の郵便番号の冒頭にあるゼロがすべて消えてしまうのです。この場合は、選択ツールを使用することをお勧めします。
選択ツール
- 選択ツールを使用すると、Alteryxは新しい特定な型に合わないデータは評価せず、[Null] に置き換えられます。
- フィールドサイズを検討するときは、文字列の長さを超えると切り捨てられるので、文字列の長さを把握していることを確認してください。
- 数値型の場合、サイズは設定できませんが、精度を求める場合は固定小数点を使用してください。
- 長すぎるデータは四捨五入されます(通常、小数点以下6桁になります)。
- 固定小数点は例外です。ドット数の長さとそれに続く小数点以下の桁数の形式を使用します。
自分のデータをAlteryxに取り込むとどうなりますか?
- データ型は列/フィールド全体とその列内の各値に適用されます。
- Alteryxは自動的にデータベースと構造化ファイル(Excel)から入ってくるタイプを最適なAlteryxテーブル内のタイプににマップします。
文字列データ型
文字列はそのままにしておきたいものです。文字列は、文字、英数字、および記号の組み合わせです。あるセルに数字、別のセルに単語を持つ混合値のフィールドの場合でも、文字列型を使用します。
- 文字列とWstringの長さは決まっています。
- V_string型は可変長です。処理用に確保されているメモリの量はさまざまです。
- Wstringは、日本語や中国語などのインターナショナルな文字をキャプチャします。
- V_Stringは、フィールドを切り捨てない柔軟性があるだけでなく、文字列サイズの長さを調整することによって処理時間の短縮を図るのに有利です。
数値データ型
数値または数値フィールドには数値のみが含まれます。注記:数値フィールド型および値で先頭に0がつけられたもの(例:01- この場合、0は削除され、数値は1として表示されます)。郵便番号を扱う場合にはこれを覚えておいてください。
- バイトは小さい整数です。
- 整数は、16、32、および64が数字のサイズである整数です(数字が大きいほどスペースが必要です)。
- 固定小数点は、よく通貨に使用されますが、計算に使用し、後でロールアップする数値には注意してください。
- Float型とDouble型は最も正確な数値ですが、ある値が別の値と直接等しいかどうかを調べようとしている比較には適していません。
日付時刻データ型
Alteryxの日付/時刻の形式は固有のものであり、フォーミュラツール内でdatetime関数を利用する場合は、データをAlteryx形式に変換するために何らかのデータ操作を行う必要があります。形式は以下の通りです:
- 日付 – YYYY-MM-DD
- 日時: YYYY-MM-DD HH:MMS
- 時間: HH:MMS
日付の扱いが難しい場合もあるため、日付フィールドをAlteryx形式に変換する際に使用できる優れたツールをいくつか紹介します。
日付時刻マクロ
- 日時ツールは、表現に優しい形式と人間が読める形式の両方を含む、さまざまな形式との間で日付/時刻データを変換します。
@AlexKo 日付解析マクロ
- 55個のAlteryxツールの中で、このマクロはAlteryx Galleryで最も多くダウンロードされている上位5個のマクロになりつつあります。このマクロは日付解析によくある頭痛の種を取り除いてくれ、日付の作業を楽しいものにしてくれます!
ブーリアンデータ型
ブーリアンは単にtrueまたはfalseであり、データにフラグを立てる際に便利です。
- 1 = true、0 = falseの条件付きフラグ
空間オブジェクトデータ型
空間オブジェクトはマッピングに使用される重心やポリゴンなどの空間オブジェクトです。
- AlteryxはESRI Shapefilesなどのデータファイルタイプから空間オブジェクトを取り込むことができます。
- ただし、Excelに緯度と経度がある場合は、ポイント作成ツールを使用してAlteryx内に空間オブジェクトを作成できます。
データ型の詳細については、Alteryxヘルプを参照してください。