Free Trial

Base de Connaissance

Apprenez auprès des experts.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index
Cet article fait partie de la série Maîtrise des outils, une compilation de contributions à la Base de connaissances visant à présenter divers exemples d'utilisation des outils Designer. Ici, nous allons nous pencher sur les utilisations de l'outil Correspondance partielle dans le cadre de notre apprentissage de la maîtrise d'Alteryx Designer :   Similaire à la recherche partielle d'Excel, l'outil Correspondance partielle (admirez-le en pleine action ici) facilite la mise en correspondance inexacte des données. En spécifiant des seuils de similarité, en utilisant différents algorithmes de correspondance et en définissant d'autres options de configuration, vous pouvez personnaliser l'outil afin qu'il s'adapte au mieux à votre jeu de données. Du fait du haut degré de personnalisation de l'outil, nous recommandons d'évoluer progressivement en visionnant nos vidéos de formation interactive  de niveau initiation et intermédiaires si vous envisagez d'utiliser des applications plus complexes de l'outil. Nous vous proposons également une Foire aux questions et des Conseils et astuces en matière de correspondance partielle qui peuvent également vous faciliter l'utilisation de l'outil !   Dans la vie, peu de choses sont complètement claires et précises, noir sur blanc. Dans tous les domaines, il existe des zones intermédiaires, et les lignes qui séparent les choses les unes des autres peuvent être partielles. Il en est de même pour les données, en particulier quand elles sont saisies manuellement. C'est pourquoi nous avons conçu l'outil Correspondance partielle : si vos données ne sont pas claires comme de l'eau de roche, vous pouvez tout de même tirer parti de vos enregistrements en les mettant en correspondance avec quelque chose d'un peu plus standardisé. Une opération qui peut s'avérer utile dans les cas suivants :    Suppression des données dupliquées d'un seul jeu de données contenant des enregistrements en double (exemple ci-joint dans Fuzzy Match.yxmd) :     Fusion de deux jeux de données et identification des enregistrements redondants (exemple ci-joint dans Fuzzy Match.yxmd)  : Remarque  : Il est vivement recommandé de commencer par purger (dédupliquer) chacun de vos jeux de données à fusionner avant de les utiliser en mode fusion afin d'éliminer toutes les correspondances redondantes et accélérer ainsi considérablement le processus de mise en correspondance.     Comparaison et nettoyage des chaînes, et mise en correspondance avec des mots-clés   Ces techniques vous aideront à identifier les noms, adresses et numéros de téléphone similaires, voire les fautes d'orthographe dans vos données, afin de transformer les chaînes inexactes en analyses exactes !   Si vous manipulez spécifiquement des noms, assurez-vous de consulter notre Guide sur la mise en correspondance partielle des surnoms. Si vous devez diminuer le seuil de correspondance au point où la mise en correspondance de certaines chaînes devient incorrecte, mais que d’autres chaînes ne correspondent pas, tentez de « mettre en cascade » le processus de mise en correspondance à l'aide d'un autre outil Correspondance partielle uniquement pour les chaînes qui ont besoin d’un seuil de correspondance inférieur, puis utilisez l’outil Union pour les fusionner avec le premier jeu.   Maintenant, vous devriez être un(e) expert(e) de l'outil Correspondance partielle ! Si vous pensez à un cas d'utilisation que nous avons oublié, n'hésitez pas à utiliser la section commentaires ci-dessous !    Vous souhaitez maintenant contribuer au blog de la communauté en partageant vos expériences et en apprenant à utiliser nos nouveaux outils dans votre vie quotidienne, envoyez moi un e-mail à Stephanie.jansen@alteryx.com.   Si vous avez des questions, la communauté est là pour y répondre sur le Forum.    Restez à l'écoute de nos dernières publications en vous abonnant aux notifications par email sur la Base de Connaissance.    *Cet article a été écrit par @MattD sur la Communauté anglaise. 
Afficher l'article complet
Produit cartésien Join/cartésien Question Comment puis-je créer une jointure cartésienne de mes données? Réponse Une jointure cartésienne, également connue sous le nom de produit cartésien, est une jointure de chaque ligne d'une table à chaque ligne d'une autre table. Par exemple, si la table a a 100 lignes et est jointe à la table B, qui a 1 000 lignes, une jointure cartésienne se traduira par 100 000 lignes. Ce type de jointure peut être utile lorsque vous devez produire un DataSet qui contient toutes les combinaisons de deux tables ou plus. Vous pouvez continuer à ajouter à la jointure en ajoutant d'autres outils d'ajout. Il suffit de connecter la sortie du premier outil Append à l'entrée cible d'un deuxième outil Append et de connecter la troisième table à l'entrée source du deuxième outil Append. Poursuivez cette configuration pour autant de tables que nécessaire. Dans l'exemple ci-dessous, un concessionnaire de voiture avait besoin d'une liste de chaque combinaison de modèle, couleur extérieure, couleur intérieure et paquet d'options. Voici ce que les quatre table cartésienne Join ressemble à: Les tableaux contiennent les données suivantes: Un échantillon des résultats du workflow illustré ci-dessus ressemble à ceci: Important Par défaut, l'outil Append est défini sur erreur sur plus de 16 ajouts afin de protéger l'utilisateur de produire par inadvertance une quantité étendue d'enregistrements. Si vos données ont plus d'ajouts que cela, vous pouvez modifier ce paramètre comme indiqué ci-dessous pour autoriser tous les ajouts: Ce workflow, créé en 10,6, est joint. Merci! 10,6
Afficher l'article complet
Étiquettes