Free Trial

Blog

Les analyses et les idées des plus grands esprits de l'analyse.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index
Jean-Balteryx
16 - Nebula
16 - Nebula

Voici les réponses aux deux questions « Questions pour un outil » de la semaine du 04 septembre au 10 octobre 2021.

 

Vous pouvez toujours y participer sur LinkedIn ou la communauté :

 

La question du mardi était :

 

Slides.116.jpeg

 

En comparant le jeu de données et le résultat on constate ceci :

  • On passe d'une date dans un format spécifique à une date au format Alteryx
  • Le format en entrée est jour.mois année
  • La nouvelle colonne s'appelle date_formatee

 

Premièrement, il faut choisir le mode de conversion. Passe-t-on d'un champ au format Date à une chaîne de caractères ou inversement ? Dans notre cas, c'est la deuxième option, on choisit donc la valeur Chaîne au format Date/heuredans le menu Sélectionner le format à convertir.

 

Ensuite, il faut sélectionner le champ à convertir, ici le seul champ disponible, Date. On le choisit donc dans la partie Sélectionner le champ date/heure à convertir.

 

L'outil DateHeure ne modifie pas le champ choisi mais en crée un nouveau. Il faut donc donner un nom à ce champ. On entre donc la valeur date_formatee dans la partie Spécifier le nom de la nouvelle colonne.

 

Certaines langues ont différents formats pour les dates qui sont propres à elles-mêmes. Alteryx permet de choisir certaines de ces langues (français, anglais, japonais, etc.) dans la partie Spécifiez la langue pour la date et l'heure. Ici, on garde la valeur Français.

 

Enfin, il faut spécifier le format d'entrée. Alteryx propose plusieurs formats par défaut dans la partie Sélectionner le format pour la nouvelle colonne. Cependant, le format nécessaire ici ne s'y trouve pas. Nous allons donc utiliser l'option Personnalisé. Lorsque celle-ci est sélectionnée, il faut spécifier le format voulu manuellement dans la partie Spécifier un format personnalisé pour la nouvelle colonne. On indique donc la valeur dd.MMM yy :

  • dd : cela indique le jour
  • MMM : cela indique le mois en lettres et en abrégé
  • yy : cela indique l'année sur deux digits

Tout en saisissant votre format, vous pouvez voir le résultat en direct grâce aux parties Exemple et Sortie.

 

La configuration finale est celle-ci :

 

configuration.png

 

Voici la documentation de l'outil pour plus d'informations : https://help.alteryx.com/fr/current/designer/datetime-tool

 

La question du jeudi était :

 

Slides.117.jpeg

 

En observant le résultat on constate ceci :

  • Il y a plusieurs fois le même animal
  • Il y a plusieurs fois le même nom
  • Il y a plusieurs fois la même couleur

 

Il y a donc au moins deux champs utilisés pour l'unicité des données. Mais lesquels ?

 

Les 3 champs sont-ils utilisés ? Si c'est le cas, nous devrions avoir 10 lignes car il y a les lignes 1 et 12 qui sont identiques et les lignes 9 et 10. Or nous avons 7 lignes dans le résultat. Ce ne sont donc pas les 3 champs qui sont utilisés mais une combinaison de deux champs.

 

Est-ce que les champs utilisés sont Age et Nom ? En prenant par exemple les lignes avec Cochon comme animal, on devrait avoir 3 lignes car les 3 noms sont différents. Or nous n'avons que 2 lignes avec Cochon dans le résultat. Ce n'est donc pas cette combinaison.

 

Est-ce que les champs utilisés sont Nom et Couleur ? C'est le même principe que l'exemple précédent puisque les 3 noms sont différents. Nous devrions donc là aussi avoir 3 lignes or il n'y en a que 2. Ce n'est donc pas cette combinaison.

 

Par élimination, c'est donc la combinaison des champs Animal et Couleur qu'il faut utiliser dans ce cas.

 

La configuration finale est celle-ci :

 

configuration.png

 

Voici la documentation de l'outil pour plus d'informations : https://help.alteryx.com/fr/current/designer/unique-tool

 

C'est tout pour cette semaine ! Rendez-vous la semaine prochaine pour deux nouvelles questions ! 🙂

Étiquettes