Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !
Voir l'indexBonjour,
Je vous partage un nouveau cas d'usage autour de la segmentation de la population.
L'idée est de vous illustrer comment on groupe les données qui ont potentiellement un même profil. Vous pourrez très facilement reproduire ce cas sur vos propres données car la démarche sera à peu de chose près la même ! Ici on segmente la population française, mais on segmente le plus souvent sa clientèle pour améliorer son ciblage et/ou mieux connaître ses clients.
Liste des villes similaires à Oyonnax
(j'ai choisi Oyonnax car c'est ma ville d'origine !)
L'outil clé dans le workflow est le suivant:
Ensemble (ou Tile)
Cet outil permet de créer des groupes de données en fonction de critères (numériques) tels que l'âge, le nombre d'actifs, la superficie, etc. Par défaut, il crée 2 nouvelles colonnes : Tile_num, qui est le numéro du groupe, et Tile_SequenceNum qui est le numéro de l'enregistrement dans le groupe. Il existe plusieurs méthodes de segmentation : Smart tile, Equal Num, Equal Sum, Manual, etc. que je vous invite à regarder plus en détail dans l'aide en ligne ou dans l'aide incorporée dans votre Alteryx Designer (clic gauche sur l'outil Tile dans la palette d'outils, puis cliquer sur Open Exemple).
En source de données, j'ai choisi la base comparateur de territoires de l'INSEE, qui contient des informations sur les communes de France telle que la population, le nombre de naissance, le nombre de résidence principale, le nombre de chômeurs, etc. Avant de commencer à travailler, on n'oublie pas d'analyser les données source pour comprendre les données et également identifier les problèmes de qualité éventuels (données manquantes, données aberrantes, fautes d'ortographe, etc.). Par exemple, je sais que je n'utiliserai pas (tel quel) le champ MED15 qui correspond à la médiane du niveau de vie car il n'est pas suffisamment renseigné pour ma segmentation. Libre à vous par la suite soit de les corriger dans Alteryx lorsque c'est possible avec une formule, soit de sortir les enregistrements dans un fichier de rejet pour les retraiter dans la base source. Tout dépend du type de l'erreur et de votre stratégie interne.
Pour analyser les données, on pensera en premier lieu à l'outil Explorateur de données (ou Browser) mais également aux outils de la palette Examen des données (ou Data Investigation) tels que le Récapitulatif de champs (ou Field Summary) pour avoir un visuel de la répartition des données.
Le workflow est en fait une application analytique, c'est-à-dire que j'ai rendu le workflow paramétrable : un utilisateur peut alors exécuter mon workflow en saisissant la ville ciblée pour laquelle il recherche les villes similaires. J'ai simplement utilisé l'outil Zone de texte (ou Text box) que j'ai paramétré.
Pour exécuter l'application (et non le workflow) lorque vous êtes dans le Designer, il suffit de cliquer sur la baguette magique à gauche du bouton Run : , ce qui ouvrira une nouvelle fenêtre de saisie de paramètre :
Il suffit ensuite de saisir un nom de ville et cliquer sur Finish !
En sortie du workflow, vous obtiendrez le rapport HTML avec les villes similaires à celle que vous aurez saisi en paramètre.
Imaginons que la segmentation vous donne en sortie :
Comme Alteryx Designer est une solution agile, tous ces changements et tests sont très rapides et faciles à réaliser ! On revient en arrière à l'infini, on crée plusieurs branches à son workflow pour tester plusieurs stratégies, ...
Je joins bien entendu mon workflow à ce post.
A vous de jouer !
Irène
Well done!