Free Trial

Forum

Trouvez des réponses, posez des questions, et partagez votre expertise d’Alteryx.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index

Clustering avec des données temporelles

scassagnes
Atome

Bonjour,
J'ai bien pu lire et appliquer les doc mis à disposition par Alteryx :
- Tool Mastery (voir article :  Tool Mastery | K-Centroids Cluster Analysis)

- P8 - Task1 - Clusters for Current Stores

 

Seulement je veux utiliser des données temporelles (des ventes mensuelles sur 3 années).

Est-ce qu'il existe des contraintes a ces modèles ? est-ce qu'il faut traiter les données comme des points, ou bien peut-on garder la date ?

Merci par avance,

5 RÉPONSES 5
WilliamR
Alteryx
Alteryx

Bonjour,

tout dépend des groupes que vous souhaitez faire avec l'outil clustering.

Que cherchez vous exactement à réaliser, identifier des périodes au sein de vos données en regroupant vos venter ?

Pouvez-vous nous en dire un peu plus?

 

Cordialement.

scassagnes
Atome

Merci de votre réponse William

En effet, je dispose de données de vente mensuelles, sur plusieurs centaines de magasins et sur plusieurs années.
L'objectif serait de les séparer en 3-5 clusters différents, puis de les typologiser selon des groupes de performance.
In fine, le but est de dire que, pour chaque nouvelle ouverture de magasin, il a une probabilité X d'appartenir a un cluster, au vu de ses premiers mois de vente.

Je vous remercie par avance,

WilliamR
Alteryx
Alteryx

Une première idée à tester pourrait être de créer une métrique de performance des magasins sur les X premiers mois d'activité puis de ségmenter les magasins en groupe en utilisant par exemple l'outil Tile, en incuant le ou les nouveaux magasins.

Par exemple une métrique pourrait être l'écart type sur les 3 premiers mois, puis vous ségmentez avec l'outil Tile (option SmartTile) qui le fait de manière automatique et va vous créer des groupes.

Cette approche est une première approche.

Si cela vous intéresse, je peux essayer de vous fournir un début de workflow en exemple.

 

scassagnes
Atome

D'accord, je suis preneur de cette première solution.

Est-ce que vous pensez à quelque chose qui implique les techniques de Clustering/KCentroids Tool qui sont utilisés dans :

- KCentroidsToolMastery
- P8+-+Task1+-+Clusters+for+Current+Stores

 

Ce sont exactement ces outputs qu'il me faudrait

Merci par avance,

WilliamR
Alteryx
Alteryx

Voici en pj un exemple avec différentes approches:

Pour commencer j'ai généré des données fictives avec des magasins et des valeurs (disons par mois):

 

Capture3.JPG

 

Puis utilisé l'outil Tile pour une segmentation automatique et enfin le clustering sur 3 mois:

 

Capture.JPG

 

Avec la configuration suivante sur l'outil clusteranalysis:

 

Capture2.JPG

Nous utilisons ensuite l'outil append cluster pour attribuer les groupes.

En fin de workflow, vous avez une table de donnée avec le numéro du groupe.

 

Capture4.JPG

 

Si cette solution vous convient, n'hésitez pas à la marquer comme approuvée pour qu'elle puisse servir la communauté.

 

Étiquettes