Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !
Voir l'indexComment optimiser les temps d’exécution des jointures ?
Dans certains cas l’outil FIND AND REPLACE/TROUVER ET REMPLACER est plus performant.
L’outil JOIN/JOINTURE d’Alteryx Designer est extrêmement performant si les sources de données gauches et droites ont à peu près le même nombre d’enregistrements et si les champs de jointures sont ordonnés de la même manière.
Si vous effectuez une jointure d’une table ayant un grand nombre d’enregistrements avec une table de plus petite taille (plus petite signifie < 32000 lignes), alors l’outil FIND AND REPLACE/TROUVER ET REMPLACER vous donne la possibilité de mettre la table de donnée de petite taille en mémoire et ainsi accélérer le temps de réalisation de la jointure.
Des tests effectués sur un jeu de donnée contenant 184 845 000 lignes pour la table principale et 30 000 lignes pour la table de petite taille ont donné les résultats suivants : la jointure est effectuée en 6 minutes avec l'outil JOIN/JOINTURE.
Contre 1 minute et 39 secondes pour la même jointure avec l’outil FIND AND REPLACE/TROUVER ET REMPLACER. Bien entendu, dans ce cas, toutes les lignes de la table primaire seront conservées ainsi que les valeurs de la table secondaire associée lorsque la correspondance est trouvée ce qui est équivalent à une jointure externe gauche. S’il y a nécessité de ne conserver que les enregistrements ayant une correspondance, positionner un filtre après l’outil FIND AND REPLACE/TROUVER ET REMPLACER.
Configuration de l'outil FIND AND REPLACE/TROUVER ET REMPLACER:
Bonjour William,
merci pour cette astuce !
est-ce que le champs de jointure doit être exclusivement du texte ?
faut-il changer le type de champs avec l'outil "sélectionner" avant le traitement ?
merci
Laurence.
Bonjour,
oui l'outil "Rechercher et remplacer" fonctionne efféctivement avec du texte. Il faut préalablement changer votre type de donnée avec un Select.
Cordialement,
Merci !