Base de Connaissance - Français

Apprenez auprès des experts.

Maîtrise de l'outil | Correspondances partielles - Fuzzy matching

Alteryx
Alteryx
Créé

Maîtrise de l'outil | Fuzzy MatchingFuzzy match .png

Cet article fait partie de la série d'outils de maîtrise, une compilation des contributions de base de connaissances pour introduire des exemples de travail diversifiés pour les instruments de concepteur. Ici, nous allons plonger dans les utilisations de l'outil Fuzzy match sur notre façon de maîtriser Alteryx Designer:

 

Semblable à la recherche floue d'Excel, l'outil Fuzzy match (voir en action ici), il est facile pour un utilisateur d'effectuer des correspondances inexactes dans leurs données. En spécifiant des seuils de similarité, en utilisant des algorithmes de correspondance variables et en spécifiant d'autres options de configuration, vous pouvez personnaliser l'outil pour mieux adapter votre jeu de données. En raison du degré élevé de personnalisation dans l'outil, nous vous recommandons de gagner tu temps avec nos vidéos d'introduction et de formation intermédiaire en direct si des applications plus complexes de l'outil sont prévues.

 

Dans la vie, il y a peu de choses en noir et blanc. Il ya des zones grises partout et les lignes qui séparent peut être un peu floue. La même chose vaut pour les données-surtout quand elles sont saisies manuellement. C'est pourquoi nous avons l'outil Fuzzy match-si vos données ne sont pas claires comme le jour, vous pouvez toujours obtenir de la valeur de vos dossiers en les assortissant à quelque chose d'un peu plus standardisé. Cela peut être utile lorsque:

 

  • Purge (deduping) un ensemble de données singulier d'enregistrements dupliqués (joints dans le workflow flou yxmd):

 

Mode de purge .jpg

 

  • Fusion de deux DataSets et identification d'enregistrements redondants (joints dans le yxmd):

Remarque: il est fortement recommandé de purger d'abord (déduplication) chacun de vos datasets fusionnants avant de les utiliser en mode fusion afin d'éliminer les correspondances redondantes, ce qui accélère considérablement le processus de correspondance.

 

Fusionner .jpg

 

 

Ces techniques vous aideront à identifier des noms, adresses, numéros de téléphone, et même des mots mal orthographiés dans vos données qui vous aideront à faire des chaînes inexactes dans des analyses exactes!

 

Si vous travaillez spécifiquement avec des noms, n'oubliez pas de consulter notre guide pour Pseudo Fuzzy Matching. Si vous vous trouvez avoir à diminuer le seuil de match au point où certaines chaînes sont incorrectement matchées, mais des correspondances sont manquantes, essayez de "cascader" le processus correspondant avec un autre outil de correspondance floue juste pour les chaînes de seuil inférieures que vous cherchez puis ajoutez les et reconstituez la table globale.

 

Maintenant, vous devriez avoir des compétences de niveau expert avec l'outil Fuzzy match! Si vous pouvez penser à un cas d'utilisation, nous avons laissé de côté, n'hésitez pas à utiliser la section commentaires ci-dessous! Vous vous considérez comme un maître de la conception des outils? Faites le nous savoir à Community@alteryx.com et si vous souhaitez que votre outil soit utilisé pour être présenté dans la série de maîtrise d'outils.

 

Restez à l'écoute avec nos derniers messages chaque outil mardi en suivant Alteryx sur Twitter! Si vous souhaitez maîtriser tous les outils de concepteur, envisagez de vous abonner aux notifications par courrier électronique.

Pièces jointes
Étiquettes