Free Trial

Blog

Les analyses et les idées des plus grands esprits de l'analyse.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index
RishiK
Alteryx
Alteryx

Le site Web de BBC News a récemment publié un article sur Alteryx et certains de nos clients (y compris McLaren). Si vous ne l'avez pas lu, il est disponible ici.  Cet article m'a fait réfléchir à mon parcours et à la manière dont je suis, je crois, devenu Citizen Data Scientist il y a de nombreuses années, sans vraiment le savoir.

 

Traits CDS.jpg

Source de l'image : Gartner

 

Lorsque j'ai obtenu mon diplôme en informatique, je savais qu'un poste dans un cabinet de conseil m'attendait déjà.  Avec les nouvelles manières de travailler et l'arrivée de la pandémie, c'est plus difficile maintenant pour les jeunes diplômés. Découvrez comment Alteryx vous aide à vous former, à devenir plus autonome et à améliorer vos compétences pour trouver une opportunité de carrière via notre programme SparkED.

 

À l'époque, j'avais le sentiment que les cabinets de conseil voulaient uniquement trouver des clients et les garder le plus longtemps possible.  Comme nous pouvons le voir, ce n'est plus le cas aujourd'hui.

 

J'ai commencé à travailler sur des projets d'entreposage des données, j'ai donc été en contact avec les données très tôt dans ma carrière. Alors que j'étais en poste dans une banque d'investissement, une chose a attiré mon attention d'informaticien. Mes clients, internes ou non, étaient des contrôleurs financiers chargés de produire des rapports pour les régulateurs, sur une base quotidienne, hebdomadaire, mensuelle, trimestrielle et annuelle. Les analystes financiers souhaitaient accéder à toujours plus de données, lesquelles orientaient les décisions. Des difficultés sont rapidement apparues au niveau de l'IT chargé de gérer les demandes de données, de générer des feuilles de calcul ou de compiler les données dans un rapport. Les contrôleurs financiers obtenaient la réponse à leurs questions initiales, mais c'est tout. Les régulateurs devenaient de plus en plus inquisiteurs face aux données qu'on leur présentait et ils avaient d'autres questions une fois qu'ils avaient analysé les données.

 

CDS Central.png

Source de l'image : Data Science Central

 

Et devinez quoi ?

Les banques d'investissement ont commencé à développer leurs propres outils et interfaces grâce auxquels nous, à l'IT, récupérions dès que possible les données stockées sur des systèmes dédiés dans les outils en question, pour permettre aux contrôleurs financiers d'effectuer leurs propres calculs et de créer leurs propres rapports. 

 

C'était une vraie révolution : les contrôleurs financiers pouvaient accéder aux données plus rapidement et me poser des tas de questions auxquelles je pouvais répondre. 

 

Plus besoin de tergiverser en me demandant sans cesse « Bon sang, Rishi, où vas-tu trouver la réponse ? ». Je m'appuyais sur l'outil et les données auxquelles j'avais accès pour fournir une réponse. Je pouvais également produire des rapports et des tableaux de bord auxquels les contrôleurs financiers auraient accès par la suite s'ils se posaient les mêmes questions. 

 

Malgré le potentiel évident de ces nouveaux outils, certains contrôleurs financiers hésitaient à franchir le pas. C'était le cas globalement surtout pour ceux qui utilisaient beaucoup Excel, en particulier dans la finance.  Ces personnes connaissent et maîtrisent Excel sans problème. Ils collaient mes données dans un fichier pour mieux les analyser, et je savais qu'il leur faudrait du temps et de l'énergie pour s'approprier les outils que nous mettions à leur disposition. J'avais pour mission d'aider les utilisateurs à oublier un peu Excel et de les inciter à adopter un nouvel ensemble d'outils analytiques intégrant des tableaux de bord en libre-service. Ils étaient forcément plus à l'aise avec leurs outils habituels, mais je devais leur prouver que cela valait la peine de changer. Je leur ai montré comment ces nouveaux tableaux de bord leur permettaient de voir et d'utiliser des données parfois difficiles à appréhender.  Une fois que les plus réticents ont pris conscience de ce potentiel, ils ont non seulement adopté les tableaux de bord, mais ils ont aussi convaincu tout le service financier d'en faire autant.

 

Gartner définit un Citizen Data Scientist comme une personne qui crée ou génère des modèles exploitant l'analytique diagnostique avancée ou des fonctionnalités prédictives ou prescriptives, alors que les statistiques et l'analytique n'entrent pas dans le cadre de sa fonction principale. Les Citizen Data Scientists sont des utilisateurs chevronnés, capables d'effectuer des tâches analytiques simples ou moyennement complexes qui auraient auparavant nécessité une plus grande expertise.

 

Je me souviens avoir lu cette définition, avoir réfléchi à ma carrière, et m'être dit… « Rishi, c'est ce que tu fais depuis 2004, mais tu ne t'en étais pas rendu compte ! Alors, est-ce que j'étais déjà à l'époque un Citizen Data Scientist ? »… À ce moment-là, je n'en étais pas très sûr.

 

Plus tard, j'ai rejoint un cabinet de conseil et rapidement commencé à travailler avec Alteryx. Je n'en avais jamais entendu parler. Jusqu'au jour où mon ancien collègue Shaan Mistry a débarqué dans nos locaux avec un magnifique tee-shirt de l'entreprise. Pendant deux semaines, il nous a formés, mon équipe et moi-même. À l'époque, j'associais la plateforme Alteryx à mon travail à la banque, où nous avions passé plusieurs années à œuvrer pour nos utilisateurs finaux dans la finance. Je comparais ce travail à celui d'Alteryx (car il s'agissait exactement de la même démarche !). J'ai adopté Alteryx (pas seulement à cause du tee-shirt de Shaan), mais parce que je voyais que de nombreuses entreprises étaient toujours confrontées aux mêmes problèmes que mes contrôleurs financiers en 2010.

 

Je travaillais pour un analyste en investissement qui me demandait généralement de récupérer sur une plateforme d'informations financières telle que Bloomberg toutes les données financières pertinentes (chiffre d'affaires, bénéfices par action, marges d'exploitation, etc.).  Fort heureusement, cette banque disposait déjà de plateformes analytiques intégrées et d'Alteryx. J'avais donc ce qu'il fallait pour obtenir un jeu de données d'une taille convenable à exploiter avec l'analyste en investissement. Nous attribuions le score 1 aux bons investissements et le score 0 aux investissements discutables.

 

Nos résultats étaient transmis aux Data Scientists de notre équipe, mais la préparation des données leur était pénible et chronophage. Pour certains, cette tâche représentait jusqu'à 80 % de leur charge de travail. Avec l'analyste en investissement, nous avons décidé de nous appuyer sur les plateformes auxquelles nous avions accès pour remanier et préparer les données de manière reproductible. Ces plateformes nous ont permis de comprendre comment corriger correctement les erreurs dans nos données, notamment avec les valeurs manquantes pour les ratios de répartition des parts. Nous connaissions tous les deux la cause de ce problème et nous avons pu remplir automatiquement tous les ratios manquants avec la valeur 0.  Pour gagner du temps sur des activités similaires à venir, nous avons sauvegardé les tâches de préparation des données dans un workflow. Ainsi, nos collègues pouvaient les vérifier et les réutiliser.

 

À ce stade, il était possible de voir comment les cibles d'investissement prometteuses se répartissaient sur les différents points de données financières saisis, par exemple les flux de trésorerie. Nous aurions certainement du mal à mettre en évidence une tendance claire. Cependant, les activités de préparation des données effectuées par l'utilisateur ont donné à l'analyste en investissement une occasion unique de visualiser et de remanier les données brutes avant de travailler avec le Data Scientist pour implémenter et déployer des modèles sur la même plateforme. 

 

Cela a changé la donne, car l'analyste et le Data Scientist ont notamment pu passer 80 % de leur temps sur des problématiques avancées et seulement 20 % sur la préparation.

 

AYX Stats.png

 

Je travaille désormais pour Alteryx. Quand je repense aux 15 années de carrière qui sont derrière moi, je me rends compte que j'étais plutôt doué alors que je n'avais pas vraiment eu de formation spécifique en mathématiques ou en statistique, mais que j'étais en mesure d'appréhender les problématiques métier que j'espérais résoudre, pour moi, mon entreprise et mes clients. J'avais tout ce qu'il fallait pour un jour développer et administrer des modèles basés sur l'analytique prédictive ou prescriptive, en m'appuyant sur des assistants et des modèles conçus pour des analyses business spécifiques, et pour interpréter les résultats destinés à des utilisateurs d'autres secteurs. 

 

DS Foundation.jpg

Source de l'image : Data Science Foundation

 

Le titre de Citizen Data Scientist était celui qui me correspondait le mieux, en raison de ma passion pour les données, mais également de ma patience et de mes aptitudes pour la communication et le conseil. J'étais, et je suis, capable de faire le lien entre les problématiques métier et les outils technologiques qui peuvent être utilisés pour les résoudre.

 

Votre parcours est peut-être, comme le mien, celui d'un Citizen Data Scientist qui s'ignore. Contactez-moi, et nous explorerons ensemble votre parcours, avec ou sans Alteryx. Je serais très heureux de vous aider dans vos cas d'usage et problématiques actuelles.

Étiquettes