Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !
Voir l'indexVoici les réponses aux deux questions « Questions pour un outil » de la semaine du 20 au 26 septembre 2021.
Vous pouvez toujours y participer sur LinkedIn ou la communauté :
La question du mardi était :
En comparant le jeu de données et le résultat on constate ceci :
Au vu des constatations, on déduit qu'il faut trier le jeu de données selon la colonne Prénom d'abord, puis la colonne Ville, puis la colonne Âge.
Dans l'outil Trier, il est possible d'utiliser autant de champs que disponibles dan le jeu de données. Et pour chacun des champs utilisés, on indique si le tri est Croissant ou Décroissant.
C'est l'ordre dans lequel sont configurés les champs dans l'outil Trier qui est important puisque ce sera le même lors de l'application du tri. Nous devons donc d'abord indiquer le champ Prénom avec un ordre de tri Croissant, puis le champ Ville avec un ordre de tri Décroissant et enfin le champ Âge avec un tri Décroissant.
La configuration finale est celle-ci :
Voici la documentation de l'outil pour plus d'informations : https://help.alteryx.com/fr/current/designer/sort-tool
La question du jeudi était :
En comparant le jeu de données et le résultat on constate ceci :
Pour commencer à configurer l'outil Union, il faut choisir le type d'union. Ici, les colonnes Marque et Modèle sont unies mais ne sont pas aux mêmes positions dans chacun des jeux de données en entrée. Ils ne sont donc pas unis par position mais par nom de colonne. On choisit donc l'option Configuration automatique par nom.
Pourquoi pas la configuration manuelle ? Par définition elle est utilisable dans tous les cas mais on privilégiera la configuration automatique lorsque c'est possible car c'est plus simple et cela permet d'éviter les erreurs humaines.
Ensuite, les colonnes présentes dans un seul des jeux de données d'entrée ne sont pas présentes dans le résultat. Et cela est dû à la partie Lorsque les champs diffèrent. Dans cette partie se trouvent deux options : que dire à l'utilisateur lorsque c'est le cas (rien, avertissement, erreur) et s'il faut ajouter les champs concernés dans le résultat.
Dans notre cas peu importe la première option, c'est la deuxième qui est importante. Il faut choisir la valeur Sortir un sous-ensemble commun de champs pour ne sortir que les champs présents dans tous les jeux de données en entrée.
Enfin, il reste à gérer l'ordre des lignes dans le résultat. En fonction de l'ordre dans lequel les sources ont été connectées à l'outil Union, la configuration change.
Si vous avez connecté la première source (celle au-dessus dans le workflow) en premier, alors il n'y a rien à changer. En revanche si vous avez fait l'inverse, il faut cocher l'option Définir un ordre de sortie spécifique et placer la valeur #2 au dessus de la valeur #1. Ces valeurs sont celles des connexions entre les sources et l'outil Union. Par défaut, l'outil Union empile les données en fonction de l'ordre dans lequel vous lui connectez les sources.
La configuration finale est celle-ci :
Voici la documentation de l'outil pour plus d'informations : https://help.alteryx.com/fr/current/designer/union-tool
C'est tout pour cette semaine ! Rendez-vous la semaine prochaine pour deux nouvelles questions ! 🙂
Pour ajouter un commentaire ici, vous devez être inscrit. Si vous êtes déjà inscrit, connectez-vous. Dans le cas contraire, inscrivez-vous puis connectez-vous.