Free Trial

Base de conocimiento

Dominio de Herramientas | Coincidencia difusa

FláviaB
Alteryx Community Team
Alteryx Community Team
Created
Fuzzy Match.png

Este artículo es parte de la serie Dominio de Herramientas, una compilación de contribuciones a la Base de Conocimiento para introducir diferentes ejemplos prácticos de las herramientas de Alteryx Designer. Vamos a profundizar en los usos de la herramienta Coincidencia difusa en nuestro camino hacia el dominio de Alteryx Designer:

 

Parecida a la Búsqueda difusa de Excel, la herramienta Coincidencia difusa facilita realizar coincidencias inexactas en tus datos. Al especificar limites de similitud, utilizar algoritmos de correspondencia variados y especificar otras

Opciones de configuración, puedes personalizar la herramienta para mejor adaptarla a tu conjunto de datos. Debido al gran nivel de personalización en la herramienta, recomendamos nuestros videos de formación en vivo introductorios e intermedios para usos más complejos de la herramienta. Además, tenemos una lista con preguntas frecuentes y trucos y consejos para la herramienta Coincidencia difusa que pueden ayudarte.

 

En la vida, pocas cosas son claramente blanco o negro; hay ambigüedad en todos. Lo mismo ocurre con los datos, en especial, cuando se ingresan manualmente. Por eso tenemos la herramienta Coincidencia difusa. Si tus datos no son perfectamente claros, aún puedes obtener valor al combinarlos con algo un poco más estandarizado. Esto puede ser útil para lo siguiente:

 

  •  Eliminar datos duplicados de un solo conjunto (ejemplo adjunto en Coincidencia difusa.yxmd)
5.png

  • Unir dos conjuntos de datos e identificar registros redundantes (ejemplo adjunto en Coincidencia difusa.yxmd):

Nota: recomendamos eliminar duplicados de cada uno de tus conjuntos de datos antes de unirlos para eliminar cualquier coincidencia redundante; esto aumentará significativamente el proceso de coincidencia.

 

11.png

 

Estas técnicas te ayudarán a identificar nombres, direcciones y teléfonos parecidos, incluso palabras mal escritas en tus datos, que harán que las cadenas inexactas se conviertan en análisis exactos.

 

Si estás trabajando específicamente con nombres, asegúrate de consultar nuestra guía para coincidencias difusas de apodos. Si tienes que reducir el umbral de coincidencia hasta el punto en que algunas cadenas coinciden incorrectamente, pero aun algunas cadenas no encuentran coincidencias, intenta aplicar una "cascada” al proceso. Usa otra herramienta Coincidencia difusa solo para las cadenas que necesitan un umbral de coincidencia inferior y, luego, utiliza la herramienta Unión para combinarlas de nuevo con el primer conjunto.

 

¡A esta altura, ya debes tener conocimiento experto de la herramienta Coincidencia difusa! Si ya eres un genio con otras herramientas de Designer, contribuye al Blog de la Comunidad compartiendo tus experiencias y diciéndonos cómo y para qué utilizas nuestras herramientas en tu vida diaria. Si te interesa contribuir al Blog, envía un correo electrónico a flavia.brancato@alteryx.com para acceder a la sección.

Todos los lunes publicamos sobre una herramienta. Con eso en mente, nos encantaría saber cuál es tu favorita o, quizás, qué herramienta te gustaría ver aquí en la Comunidad la próxima semana. No olvides de suscribirte al panel de la Base de Conocimiento para recibir notificaciones de las últimas novedades.

 

*Esta publicación fue escrita originalmente por @MattD en la Comunidad en inglés

Adjuntos