Free Trial

Base de Connaissance

Apprenez auprès des experts.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index

Comment j'ai relevé le défi n° 68

AMansour
Bolide
Créé

Alors, quel est le défi de cette semaine ? 

 

Cette semaine nous reprenons la problématique des données non-structurées. 

Capture d’écran 2021-05-16 à 15.36.16.png

 

Nous avons comme défi de structurer des données d'adresses. Il n'y a pas des séparateurs que nous pouvons utiliser et le nom des rues ne nous intéressent pas. Il faut donc analyser le texte ...

 

 

Capture d’écran 2021-05-16 à 16.29.59.png

 

   Avant de commencer de vous parler de ma solution, je voudrais prendre le temps pour remercier les experts des Regex qui m'ont débloqué à plusieurs reprises et qui m'ont donné l'envie et les raisons d'utiliser ces expersions ultra puissantes.

 

Merci @Toons pour ta soltion qui m'a débloqué sur ce défi. Merci @Ladarthure pour ta solution 100% RegEx sur le défi 56.

 

 Merci aussi à tous les contributeurs de cet article, que je vous le recommande fortement.

 

 

 

Entrée/Sortie

 

Capture d’écran 2021-05-16 à 19.22.54.png

 

      Comme nous pouvons voir ci-après les adresses sont sur une seule colonne avec plusieurs informations (n° voie, nom de voie, ville, code État et code postal parfois) 

 

Et voilà ce qu'on attend à la fin :

 

Capture d’écran 2021-05-16 à 19.26.52.png

 

 

Problématique / Choix

 

Capture d’écran 2021-05-16 à 19.29.18.png

 

Pour moi, il y avait deux difficultés sur ce défi, le premier est ma volonté d'utiliser le RegEx :RegEx: et la deuxième etait les villes à deux mots. 

 

 

Capture d’écran 2021-05-16 à 19.49.26.png  Finalement, le RegEx m'a permis facilement d’être plus efficace sur ce type d'analyse.

 

La méthode de sortie 'Analyser' m'a permis de créer plusieurs colonnes avec des expressions différentes.

 

J'ai cherché un peu comment isoler le nom de ville sachant qu'il est par fois composé de plusieurs mot mais je n'ai pas réussi. J'ai donc appris grâce à la solution de @Toons qu'il suffisait de prendre tous les caractères entre l' éspace après le type de voie et l'espace avant le code de l'État. 

 

 Solution
 
Capture d’écran 2021-05-16 à 20.03.58.png

 

À la semaine prochaine

Cheers,

Amr

 

contributeurs
Étiquettes