Cet article fait partie de la série Maîtrise des outils, une compilation de contributions à la Base de connaissances visant à présenter divers exemples d'utilisation des outils Designer. Ici, nous allons nous intéresser aux utilisations de l'outil Ajouter des champs dans le cadre de notre apprentissage de la maîtrise d'Alteryx Designer :
L'outil Ajouter des champs permet d'ajouter chaque ligne de l'entrée source à chaque ligne de l'entrée cible sous forme de nouvelles colonnes. Cette opération est appelée J
jointure cartésienne ou jointure croisée. Si votre entrée cible comporte A lignes avec B colonnes et si votre entrée source comporte C lignes avec D colonnes, la sortie générée par l'outil Ajouter des champs aura A fois C lignes et B plus D colonnes.
Effectuer une jointure cartésienne (exemple ci-joint dans le workflow Append.yxwz) :
Il peut arriver que vous souhaitiez joindre chaque ligne d'une table à chaque ligne d'une autre table. Imaginons que vous ayez une liste de clients potentiels et votre inventaire de produits. Vous pouvez utiliser un outil Ajouter des champs pour joindre ces données :
J'ai commencé avec 26 produits et 26 clients, ce qui a donné 26 x 26 = 676 combinaisons possibles de clients et de produits. Étant donné que la table de produits est connectée à l’ancrage (T) de l'entrée cible, la sortie est triée selon cette table. Si nous l'inversions et que nous avions les clients dans l'entrée cible, la seule différence serait l'ordre des colonnes (le client se trouverait dans la première colonne) et des lignes (le client 1 occuperait les 26 premières lignes, car chaque produit est répertorié séquentiellement). Étant donné que ma table source contenait plus de 16 enregistrements, j'ai dû modifier le paramètre de l'outil Ajouter pour le permettre :
Cette option est importante parce que les jointures cartésiennes posent problème si vous tentez accidentellement d'ajouter un trop grand nombre d'enregistrements.
Ajouter un seul enregistrement à un jeu de données complet (exemple ci-joint dans le workflow Append.yxwz) :
Parfois, vous pouvez avoir besoin d’ajouter une même information à tous les enregistrements. C'est le moment idéal de faire intervenir un outil Ajouter des champs. Supposons que vous disposiez d'un jeu de données contenant des noms de couleur (avec des doublons possibles). Dans une table principale, chaque couleur est répertoriée avec une valeur. Votre objectif est de permettre à l'utilisateur de sélectionner une couleur donnée et de renvoyer tous les enregistrements du jeu de données avec des valeurs inférieures ou égales à la valeur sélectionnée.
Étape 1 - Prenez la couleur sélectionnée par l'utilisateur et recherchez sa valeur dans la table principale :
L'utilisateur a sélectionné la couleur bleu. Nous l'avons donc cherchée dans la table principale et trouvé sa valeur : 10.
Étape 2 – Ajoutez les valeurs à votre jeu de données des couleurs :
Étant donné que le jeu de données ne contient que des couleurs, nous pouvons utiliser un outil Rechercher et remplacer (ou un outil Jointure si nous souhaitons perdre une nanoseconde à trier les données J) pour ajouter la valeur de la table principale. À présent, chaque enregistrement a une valeur. Jusqu'ici tout va bien.
Étape 3 – Ajoutez la valeur sélectionnée par l'utilisateur et appliquez un Filtre afin d'obtenir uniquement les enregistrements d'une valeur inférieure ou égale à cette valeur :
Notez que nous avons configuré l'outil Ajouter des champs de sorte qu'il modifie le nom de la colonne de valeurs connectée à l’ancrage Source pour qu'elle devienne Max_Value et qu'il désélectionne la couleur du côté Source :
L'outil Ajouter des champs comporte les mêmes options et fonctionnalités que l'outil Jointure pour modifier les données.
Ajouter la date et l'heure actuelles à tous les enregistrements (exemple ci-joint dans le workflow Append.yxwz) :
Supposons que vous souhaitiez que chaque enregistrement de votre jeu de données comporte un horodatage lors de sa sortie. La difficulté, c'est que vous souhaitez que chaque enregistrement ait le même horodatage que le moment de l'ouverture du workflow. Cela vous empêche d'utiliser un outil Formule qui le recalculerait pour chaque enregistrement, si bien qu'il pourrait obtenir des horodatages différents de quelques secondes. Une manière simple d'accomplir cette tâche consisterait à utiliser un outil Ajouter des champs. Nous allons utiliser un outil Générer les lignes pour obtenir l'horodatage, puis nous allons l'ajouter à tous nos flux de données :
J'ai modifié mes connexions sources afin qu'elles soient sans fil, pour que le résultat ait un aspect plus propre :
Et voilà ! Un outil Ajouter des champs est essentiellement un outil Jointure sans conditions de jointure et une seule sortie J. Consultez la documentation d'aide de l'outil Sélectionner pour en savoir plus sur les « options » de l'outil Ajouter des champs.
Maintenant, vous devriez être un(e) expert(e) de l'outil Ajouter des champs !
Si vous pensez à un cas d'utilisation que nous avons oublié, n'hésitez pas à utiliser la section commentaires ci-dessous !
Vous souhaitez maintenant contribuer au blog de la communauté en partageant vos expériences et en apprenant à utiliser nos nouveaux outils dans votre vie quotidienne, envoyez moi un e-mail à Stephanie.jansen@alteryx.com.
Si vous avez des questions, la communauté est là pour y répondre sur le Forum.
Restez à l'écoute de nos dernières publications en vous abonnant aux notifications par email sur la Base de Connaissance.
*Cet article a été écrit par @patrick_digan sur la Communauté anglaise.
Afficher l'article complet