Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !
Voir l'indexBonjour a tous,
J'ai besoin d'identifier les doublons non identiques dans la BASE 2 par rapport a la BASE 1
J'ai utilisé l'outil correspondance partielle, ça marche dans l'étape de l'identification des doublons ... MAIS ; pour les doublons je veux garder celle de la BASE 1 ....
Par exemple :
j'ai dans la base 2 :
BASE 2
CORSO PRODUCTS ALGERIE
CORSO PRODUCT
PRODUCTS CORSO
et dans la BASE 1 ;
Base 1
CORSO PRODUCTS ALGERIE E
Dans ce cas par exemple je veux remplacer les 3 de la BASE 2 par celle de la BASE 1 !
donc je veux comparer identifier les doublons non identiques dans la BASE 2 par rapport a la BASE 1
Pouvez vous m'aider SVP !
Résolu ! Accéder à la solution.
Salut @Abdesslem_19 ,
Je te propose cette méthode
Dans les grandes lignes tu:
Souvent si le fuzzy ne suffit pas, on en rajoute une ou plusieurs passent sur les lignes qui n'ont pas de correspondance. L'idée est que d'autres algos trouveront peut être une correspondance.
2 bonnes ressources sur le fuzzy matching
Article pour découvrir le Fuzzy Matching:
https://community.alteryx.com/t5/Alteryx-Designer-Knowledge-Base/Tool-Mastery-Fuzzy-Match/ta-p/45485
Vidéos sur la méthodologie de préparation (55mn)
https://community.alteryx.com/t5/Videos/Fuzzy-Matching-for-Beginners/td-p/330575
J'espère que cela t'aidera