Forum

scassagnes · ‎06-10-2019

Bonjour,
J'ai bien pu lire et appliquer les doc mis à disposition par Alteryx :
- Tool Mastery (voir article : Tool Mastery | K-Centroids Cluster Analysis)

- P8 - Task1 - Clusters for Current Stores

Seulement je veux utiliser des données temporelles (des ventes mensuelles sur 3 années).

Est-ce qu'il existe des contraintes a ces modèles ? est-ce qu'il faut traiter les données comme des points, ou bien peut-on garder la date ?

Merci par avance,

WilliamR · ‎06-12-2019

Bonjour,

tout dépend des groupes que vous souhaitez faire avec l'outil clustering.

Que cherchez vous exactement à réaliser, identifier des périodes au sein de vos données en regroupant vos venter ?

Pouvez-vous nous en dire un peu plus?

Cordialement.

scassagnes · ‎06-12-2019

Merci de votre réponse William

En effet, je dispose de données de vente mensuelles, sur plusieurs centaines de magasins et sur plusieurs années.
L'objectif serait de les séparer en 3-5 clusters différents, puis de les typologiser selon des groupes de performance.
In fine, le but est de dire que, pour chaque nouvelle ouverture de magasin, il a une probabilité X d'appartenir a un cluster, au vu de ses premiers mois de vente.

Je vous remercie par avance,

WilliamR · ‎06-12-2019

Une première idée à tester pourrait être de créer une métrique de performance des magasins sur les X premiers mois d'activité puis de ségmenter les magasins en groupe en utilisant par exemple l'outil Tile, en incuant le ou les nouveaux magasins.

Par exemple une métrique pourrait être l'écart type sur les 3 premiers mois, puis vous ségmentez avec l'outil Tile (option SmartTile) qui le fait de manière automatique et va vous créer des groupes.

Cette approche est une première approche.

Si cela vous intéresse, je peux essayer de vous fournir un début de workflow en exemple.

scassagnes · ‎06-12-2019

D'accord, je suis preneur de cette première solution.

Est-ce que vous pensez à quelque chose qui implique les techniques de Clustering/KCentroids Tool qui sont utilisés dans :

- KCentroidsToolMastery
- P8+-+Task1+-+Clusters+for+Current+Stores

Ce sont exactement ces outputs qu'il me faudrait

Merci par avance,

WilliamR · ‎06-12-2019

Voici en pj un exemple avec différentes approches:

Pour commencer j'ai généré des données fictives avec des magasins et des valeurs (disons par mois):

Puis utilisé l'outil Tile pour une segmentation automatique et enfin le clustering sur 3 mois:

Avec la configuration suivante sur l'outil clusteranalysis:

Nous utilisons ensuite l'outil append cluster pour attribuer les groupes.

En fin de workflow, vous avez une table de donnée avec le numéro du groupe.

Si cette solution vous convient, n'hésitez pas à la marquer comme approuvée pour qu'elle puisse servir la communauté.

Forum

TIPS de la semaine

Clustering avec des données temporelles