Free Trial

Blog

Les analyses et les idées des plus grands esprits de l'analyse.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index
Jean-Balteryx
16 - Nebula
16 - Nebula

Voici les réponses aux deux questions « Questions pour un outil » de la semaine du 25 au 31 octobre 2021.

 

Vous pouvez toujours y participer sur LinkedIn ou la communauté :

 

La question du mardi était :

 

Slides.125.jpeg

 

En comparant les jeux de données et le résultat attendu on constate ceci :

  • Les calculs sont séparés de manière à avoir un terme par ligne
  • Les opérateurs sont utilisés pour séparer les termes
  • Les termes entre parenthèses ne sont pas séparés

 

Tout d'abord, il faut choisir le champ à séparer. Ici il n'y a que le champ Calcul présent dans notre jeu de données, il est donc choisi automatiquement.

 

Ensuite, il faut choisir les délimiteurs permettant de séparer les valeurs. Ici ce sont les opérateurs. Il faut donc indiquer les caractères "-", "*", "/" dans la partie Délimiteurs. Dans notre cas, l'opérateur "+" n'est pas nécessaire au vu des données.

 

Il est possible de séparer la colonne en entrée en plusieurs colonnes ou en plusieurs lignes. Comme nous avons plus de lignes dans le résultat que dans l'entrée, cela signifie que les valeurs ont été séparées en lignes. il faut donc choisir l'option Fractionner en lignes.

 

Enfin, afin de ne pas séparer les termes entre parenthèses, il faut cocher l'option Ignorer les délimiteurs entre parenthèses. Ainsi, les blocs de parenthèses resteront groupés.

 

La configuration finale est celle-ci :

 

configuration.png

 

Voici la documentation de l'outil pour plus d'informations : https://help.alteryx.com/fr/current/designer/text-columns-tool

 

La question du jeudi était :

 

Slides.126.jpeg

 

En comparant les jeux de données et le résultat attendu on constate ceci :

  • Il y a autant de lignes dans le résultat que dans chaque entrée de données
  • Tous les prénoms de la première entrée sont présents dans le résultat
  • La colonne Prénom n'apparait qu'une fois
  • La colonne Nom est placée avant la colonne Animal

 

Pourquoi tout les prénoms sont présents dans le résultat alors que le prénom "Julien" n'est pas présent dans la deuxième entrée ? Et pourquoi l'animal "Poisson" lui est associé alors qu'il est associé à "Julian" dans la deuxième entrée ? C'est parce que les lignes sont jointes en utilisant l'option Joindre par position d'enregistrement. Ainsi, la première ligne de la première entrée et associée à la première ligne de la deuxième entrée et ainsi de suite.

 

Le champ Prénom est présent dans chaque source mais n'est présent qu'une fois dans le résultat. Il y a donc une des deux colonnes qui a été enlevée. On remarque que le prénom "Julien" est présent dans le résultat, signifiant que c'est la colonne Prénom de la première entrée qui est gardée. Il suffit donc de décocher la colonne Prénom de la deuxième entrée pour qu'elle n'apparaisse pas dans le résultat.

 

Enfin, il faut placer la colonne Nom avant la colonne Animal. Il y a deux méthodes pour le faire : sélectionner le champ et utiliser les deux flèches (haut/bas) à droite du menu Options pour le déplacer ou maintenir un clic-droit sur l'espace à gauche de la case à cocher du champ concerné et le déplacer à la position souhaitée.

 

La configuration finale est celle-ci :

 

configuration.png

 

Voici la documentation de l'outil pour plus d'informations : https://help.alteryx.com/fr/current/designer/join-tool

 

C'est tout pour cette semaine ! Rendez-vous la semaine prochaine pour deux nouvelles questions ! 🙂

Étiquettes