Free Trial

Blog

Les analyses et les idées des plus grands esprits de l'analyse.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index
Jean-Balteryx
16 - Nebula
16 - Nebula

Voici les réponses aux deux questions « Questions pour un outil » de la semaine du 15 au 21 novembre 2021.

 

Vous pouvez toujours y participer sur LinkedIn ou la communauté :

 

La question du mardi était :

 

Slides.134.jpeg

 

En comparant le jeu de données et le résultat on constate ceci :

  • Il y a 2 lignes maximum par Couleur

 

L'outil Échantillon est très simple à configurer, il faut choisir un mode et optionnellement un ou plusieurs champs pour grouper l'échantillonnage.

 

Dans notre cas, on voit qu'il y a 2 lignes pour les couleurs ayant 2 lignes ou plus dans les données en entrée et qu'il n'y a qu'1 ligne pour les couleurs ayant 1 ligne.

 

Ensuite, quelles lignes sont sélectionnées ? En observant les données, on remarque que ce ne sont pas les 2 premières ou 2 dernières lignes qui sont sélectionnées mais plutôt que c'est une ligne sur 2.

 

Le mode à choisir est donc 1 toutes les N lignes et il faut spécifier N = 2.

 

Enfin, comme nous avons remarqué que l'échantillonnage se fait pour chaque couleur, il faut cocher le champ Couleurdans la partie Regrouper par colonne (facultatif).

 

Voici donc la configuration nécessaire pour échantillonner ce jeu de données :

 

configuration.png

 

Voici la documentation de l'outil pour plus d'informations : https://help.alteryx.com/fr/current/designer/sample-tool

 

La question du jeudi était :

 

Slides.135.jpeg

 

En comparant le jeu de données et le résultat attendu on constate ceci :

  • Le workflow génère un avertissement

 

Cette fois-ci, la configuration n'est pas très compliquée. Il n'y a que deux champs et ils ne sont ni renommés, ni déplacés, ni retypés, ni supprimés.

 

Le point important réside dans le message d'avertissement "La source contient plus de 16 enregistrements". En effet, cet outil peut prendre énormément de temps s'il y a beaucoup d'enregistrements des deux côtés. Il y a donc une option Avertissement/erreur en cas d'enregistrements générés trop nombreux qui permet de générer un avertissement ou une erreur s'il y a plus de 16 enregistrements ajoutés. Cela permet de prévenir de possibles problèmes de performance.

 

Dans notre cas, puisque c'est un message d'avertissement, il faut configurer l'option avec la valeur Avertissement à l'ajout de plus de 16 enregistrements.

 

Voici donc la configuration nécessaire :

 

configuration.png

 

Voici la documentation de l'outil pour plus d'informations : https://help.alteryx.com/fr/current/designer/append-fields-tool

 

C'est tout pour cette semaine ! Rendez-vous la semaine prochaine pour deux nouvelles questions ! 🙂

Étiquettes