Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !
Voir l'index
S’il y’a bien une profession qui a de l’humour en France, il s’agit bien de nos coiffeurs. Il existe une effet une règle implicite en France qui veut que plus de la moitié des salons soient nommés avec un jeu de mot.
Une simple balade dans une rue commercial permettra au promeneur à l’œil aiguisé de repérer ces « boulevard Volt’Hair » et autres « instinc’tif ».
Deux questions cependant me viennent à l’esprit quand il s’agit de ces jeux de mots :
Si la première question n’a pas de réponse évidente, la deuxième peut trouver une réponse relativement facilement grâce à Alteryx.
Cérémonie secrète à l'issue de la remise de diplôme CAP coiffure
Pour répondre à la question des jeux de mot les plus utilisés, nous allons donc partir de la base de données SIRENE que l’on peut trouver sur Datagouv.
Celle-ci comporte l’ensemble des entreprises françaises. Afin que le workflow reste téléchargeable, je vous fournis ici une version déjà filtrée sur les salons de coiffure.
Il s’agira d’ailleurs de notre première tâche sur ce workflow : Filtrer sur les salons de coiffure dont le code activité est 96.02. On utilisera donc un filtre comme ceci :
La base de données SIRENE contient énormément de valeurs null avec des salons dont le nom n’est pas renseigné. On va donc filtrer et enlever ces valeurs null :
On va ensuite chercher les jeux de mots. Pour cela, on va créer un filtre « custom » qui ne retiendra que les Salons qui comporte les mots « TIF », « HAIR » ou « TETE » :
Afin de compter nos salons, on ajoutera ensuite un RecordID (pour attribuer une clé unique à chaque salon) et avec un select, on va prendre juste nos colonnes RecordID et le nom du salon :
On va ensuite nettoyer nos noms de salons, afin de pouvoir mettre « nouvelle Hair », « nouvelle’Hair » et « NouvelleHair » comme étant le même jeu de mot. Pour cela, on supprimera la ponctuation, les espaces et on mettra tout en majuscule :
Reste maintenant un problème : Comment détecter et rapprocher les jeux de mot s très semblable comme « Imaginhair » et ImagineHair » ? Pour les identifier et les corriger, on utilisera un Fuzzy match, afin de comparer les noms de salon :
On va ainsi disposer d’une liste de noms de salon à corriger :
Pour automatiser nos corrections, on va utiliser un « Text input » et mettre les noms de salon à harmoniser :
Ce remplacement se fera ensuite au moyen d’un « Find Replace » :
On utilisera ensuite un summarize pour compter le nombre de salon par jeux de mot :
On utilisera enfin un sort et un sample pour classer par nombre de jeux de mots et établir le top 100 :
Le résultat ? Notre grand gagnant est « HAIRDUTEMPS » avec 190 salons, suivi de « NOUVELHAIR » (108 salons ) et « CREATIF » (83 salons)
Je dois avouer que j’adore me perdre dans ces données, voici donc un florilège de mes noms de salon préféré que j’ai repéré :
N’hésitez pas à indiquer en commentaires ceux que j’aurais raté.
Pour ajouter un commentaire ici, vous devez être inscrit. Si vous êtes déjà inscrit, connectez-vous. Dans le cas contraire, inscrivez-vous puis connectez-vous.