Buen dia a todos y a la comunidad..
Tengo una duda a cerca de la contrucción de un sistema inteligente que trate de estandarizar las direcciones de acuerdo a las similitudes de las mismas.
El problema consiete en crear un sistema inteligente que pueda reconocer diracciones escritas de cualquier forma y que pueda referenciarse su direccion correcta. es decir.
Si vivo en un edificio de apartamentos que se llama Mayorca, este esta ubicado en la direccion Calle 51# 33 - 23. las personas pueden escribir esta dirección de distintas maneras, por ejemplo (edicicio mayorca de la calle 51 con carrera 33) o (Calle 51 #33 23 edificio Mayorca ap 201) y asi sucesivamente.
el sistema que debo construir es que sea capaz de identificar esas combinaciones e interpretar la como una unica dirección y no como (N) direcciones distintas
¿Hola @darcila todo bien?
por lo que está describiendo, creo que la mejor manera sería que use REGEX - Expresión regular - que de alguna manera lo hace por usted.
Pero creo que con el tiempo tendrás que seguir haciéndole mantenimiento debido a las infinitas posibilidades de escribir una dirección.
Eche un vistazo a este enlace que le enseña cómo usar REGEX con alteryx.
Saludos
Hola @darcila ,
Una forma de hacerlo es utilizando fuzzy match o coincidencia difusa, es decir buscar parecidos no exactos. Funciona muy bien para ese caso que mencionas y lo puedes complementar con un catálogo que te ayude a estandarizar los valores.
Este artículo describe el proceso de la coincidencia difusa:
Este otro describe un proceso similar al que buscas usando fuzzy match y catalogos de datos para mejorar datos capturados a mano.
Espero te sean de utilidad.