Free Trial

Blog

Les analyses et les idées des plus grands esprits de l'analyse.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index
Jean-Balteryx
16 - Nebula
16 - Nebula

Voici les réponses aux deux questions « Questions pour un outil » de la semaine du 13 au 19 septembre 2021.

 

Vous pouvez toujours y participer sur LinkedIn ou la communauté :

 

La question du mardi était :

 

Slides.107.jpeg

 

En comparant le jeu de données et le résultat on constate ceci :

  • Il y a 2 lignes maximum par Animal

 

L'outil Échantillon est très simple à configurer, il faut choisir un mode et optionnellement un ou plusieurs champs pour grouper l'échantillonnage.

 

Dans notre cas, on voit qu'il y a 2 lignes pour les animaux ayant 2 lignes ou plus dans les données en entrée et qu'il n'y a qu'1 ligne pour les animaux ayant 1 ligne.

 

Ensuite, quelles lignes sont sélectionnées ? En observant les données, on remarque que ce sont les 2 dernières lignes à chaque fois.

 

Le mode à choisir est donc Dernières N lignes et il faut spécifier N = 2.

 

Enfin, comme nous avons remarqué que l'échantillonnage se fait pour chaque animal, il faut cocher le champ Animaldans la partie Regrouper par colonne (facultatif).

 

La configuration finale est celle-ci :

 

Slides.107.jpeg

 

Voici la documentation de l'outil pour plus d'informations : https://help.alteryx.com/fr/current/designer/sample-tool

 

La question du jeudi était :

 

Slides.108.jpeg

 

Et les bonnes réponses sont ... C - WString et D - V_WString !

 

Les types String et V_String ne peuvent contenir que des caractères Latin-1. Qu'est-ce que Latin-1 ? C'est un type d'encodage qui permet d'utiliser un ensemble défini de caractères qui peut être retrouvé sur cette page : https://fr.wikipedia.org/wiki/ISO/CEI_8859-1

 

Cet encodage peut donc être limitant en fonction des caractères contenus dans les données. C'est pourquoi les types WString et V_WString acceptent n'importe quel caractère. C'est le "W" pour "Wide" qui fait la différence. Il indique que ces types de données utilisent le standard Unicode qui permet de rendre utilisables tous les caractères quelque soit le système utilisé.

 

Voici la documentation des types de données pour plus d'informations : https://help.alteryx.com/fr/current/designer/data-types

 

C'est tout pour cette semaine ! Rendez-vous la semaine prochaine pour deux nouvelles questions ! 🙂

Étiquettes