ナレッジベース - 日本語

エキスパートから学ぶ。

ツールマスタリー | ファジーマッチ

Alteryx Community Team
Alteryx Community Team
Created
Fuzzy Match.png

この記事はツールマスタリーシリーズの一部で、Designer ツールの使用に役立つさまざまな活用例をナレッジベースにまとめたものです。ここでは、Alteryx Designer を習得するための一歩として、ファジーマッチツールの使用について深く掘り下げて説明します。

 

Excel のファジールックアップと同様に、ファジーマッチツール ここでマスター)を使用すると、ユーザーはデータの不正確な一致を簡単に実行できるようにします。類似のしきい値を指定し、さまざまなマッチングアルゴリズムを利用し、他の設定オプションを指定することによって、データセットに最適なツールをカスタマイズできます。ツールは高度にカスタマイズされているため、ツールのより複雑なアプリケーションが予想される場合は、入門 および中級live training video  で学習することをお勧めします。また、よくある質問 とファジーマッチングのヒントとコツ のリストもあり、ツールの使用も補足できます。

 

人生では、白黒に分けられるものはほとんどありません。グレーの領域が至る所にあり、それを分ける線が少しあいまいになることがあります。特に人間が入力した場合において、同じことがデータにも当てはまります。そのために、ファジーマッチツールがあります。データが明確でない場合でも、標準化されたものと照合することで、レコードから価値を引き出すことができます。ファジーマッチは次の場合に便利です。

 

  •  重複レコードの単一のデータセットのパージ(重複除去)(Fuzzy Match.yxmd に添付):

 

Purge Mode.jpg

 

  • 2 つのデータセットをマージし、冗長なレコードを識別(Fuzzy Match.yxmd に添付)

注: 重複する一致を排除するために、マージモードで使用する前に各マージデータセットを最初にパージ(重複排除)することをお勧めします。これにより、マッチングプロセスが大幅に高速化されます。

 

Merge.jpg

 

 

これらの手法は、データ内の類似した名前、住所、電話番号、スペルミスの単語を特定するのに役立ち、不正確な文字列を正確に分析するのに役立てることができます!

 

特に名前を使用している場合は、ニックネームのファジーマッチングのガイドを確認してください。一部の文字列が誤って一致するポイントまで一致しきい値を緩める必要があるが、それでも他の文字列が取得されない場合は、別のファジーマッチツールでマッチプロセスを「ウォーターフォール」してみてください。そして、一致したセットにそれらを追加してユニオンしましょう。

 

これで、ファジーマッチツールのエキスパートレベルの習熟度が得られました!他にもユースケースをご存知の場合は、以下のコメント欄でお知らせください!もうツールマスターですか?あなたの作成したクリエイティブなツールをツールマスタリーシリーズに掲載したい場合は、 community@alteryx.com でお知らせください。

 

Twitter で Alteryx  をフォローして  Tool Tuesday  の最新の投稿をご確認ください! Designer ツールのすべてをマスターしたい方は、 メールでのお知らせ登録 されることをお薦めします。