Free Trial

Forum

Trouvez des réponses, posez des questions, et partagez votre expertise d’Alteryx.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index
RÉSOLU

correspondance partielle

Abdesslem_19
Astéroïde

Bonjour a tous,

 

J'ai besoin d'identifier les doublons non identiques dans la BASE 2 par rapport a la BASE 1

 

J'ai utilisé l'outil correspondance partielle, ça marche dans l'étape de l'identification des doublons ... MAIS ;  pour les doublons je veux garder celle de la BASE 1 ....

 

Par exemple : 

j'ai dans la base 2 : 

 

BASE 2
CORSO PRODUCTS ALGERIE
CORSO PRODUCT
PRODUCTS CORSO

 

et  dans la BASE 1 ;

Base 1
CORSO PRODUCTS ALGERIE E

Dans ce cas par exemple je veux remplacer les 3 de la BASE 2 par celle de la BASE 1 !

 

donc je veux comparer identifier les doublons non identiques dans la BASE 2 par rapport a la BASE 1

 

Pouvez vous m'aider SVP ! 

 

 

 

 

1 RÉPONSE 1
StephaneP
Alteryx
Alteryx

Salut @Abdesslem_19 ,

 

Je te propose cette méthode

Capture.PNG

 

Dans les grandes lignes tu:

  • génères des ID et des labels distincts pour les 2 sources pour bien les différencier dans la suite du flux.
  • unifies et prépares les données.
    passes le Fuzzy matching.
  • rappatries les libellés pour visualiser ce qu'il propose
  • Génères la nouvelle sortie en remplacant les anciens noms par les nouveaux

Souvent si le fuzzy ne suffit pas, on en rajoute une ou plusieurs passent sur les lignes qui n'ont pas de correspondance. L'idée est que d'autres algos trouveront peut être une correspondance.

 

2 bonnes ressources sur le fuzzy matching

Article pour découvrir le Fuzzy Matching:

https://community.alteryx.com/t5/Alteryx-Designer-Knowledge-Base/Tool-Mastery-Fuzzy-Match/ta-p/45485

 

Vidéos sur la méthodologie de préparation (55mn)

https://community.alteryx.com/t5/Videos/Fuzzy-Matching-for-Beginners/td-p/330575

 

 

J'espère que cela t'aidera

 

 

 

 

Stéphane Portier
Sales Engineer
Alteryx
Étiquettes