大量の緯度経度データがあり、その中で重複している緯度経度を洗い出したいと思っています。
データの中には緯度経度が完全一致で重複している場合と、同じ物件の中で若干指すポイントが異なっている重複疑いの場合があり、疑いも含めて重複のレコードがあるかどうかと、重複相手が分かるような出力にできればと思いますが、この場合どのような方法があるのでしょうか。
当方Alteryxは触り始めたばかりでして、
初歩的な質問で大変恐縮ですが、ご教示いただけましたら幸いです。
解決済! 解決策の投稿を見る。
@Mari_jp さん
達成したいことは、以下2ステップと理解しました。
①緯度経度が完全一致するレコードを特定したい
②緯度経度が一致はしないものの、なんとなく同じ場所を指しているデータを特定したい
①について
緯度経度の生データに対して、ユニークツールを使うと簡単です。
②について
①のユニークツールのUアンカーからの出力をまず空間データに変換します。そして、2組のレコードの組み合わせを作り、それぞれの距離を計算します。距離の値がxx以下でフィルターをかけて、重複してそうなレコードをみつける。(xxの値は、データセット見ながらトライ&エラーで設定すると良いと思います)
サンプルのワークフローをあげておきますので、良かったら参考にしてみてください
ご丁寧にご教示いただき、誠にありがとうございました。
無事出力できました。
別の案のご提案、誠にありがとうございました。
inputデータの件数が多かったので、ご記載の通り処理時間がかなり短縮できました。
大変勉強になりました、重ねてお礼申し上げます。