Cas d’utilisation - Français

Mappage de la Criminalité - Et s'il Etait Possible de Prévoir le Future?

AlteryxAdvocacy
Alteryx
Alteryx
Created
Participation aux Prix d'excellence 2018 : Cartographie de la criminalité - Et si vous pouviez prédire l'avenir ?
 
Nom : Kishan Dosa
Titre : Consultant principal - Business Intelligence
Entreprise : Climber
Collaborateurs : Kishan Dosa, Callum Stevens, Nathanael Norris, Goncalo Pereira
 
climber.png
 
 
 
Présentation d'un cas d'utilisation :

L'objectif du projet était d'utiliser une série de workflows Alteryx et de modèles prédictifs pour générer des prévisions chiffées de la criminalité dans les zones urbaines d'Angleterre au cours des trois prochaines années. En outre, nous voulions tester la fiabilité de nos prévisions en utilisant les données des trois premers mois de 2018.

 

Décrivez le défi professionnel que vous devez relever ou le problème que vous devez résoudre :

Climber, récent Partenaire privilégié d'Alteryx, avait hâte de démontrer sa maîtrise d'Alteryx à ses clients. Pour ce faire, nous avons passé en revue des jeux de données publiquement disponibles et exploitables pour ce travail ; ce qui nous a mené à l'analyse des statistiques de la criminalité en Angleterre et au Pays de Galles. Nous pensions que si nous pouvions prévoir le taux de criminalité pour les années à venir, ces informations pourraient être utilisées pour optimiser les dépenses consacrées à l'affectation de personnel et pour trouver le meilleur moyen d'allouer les ressources sur des périodes spécifiques, ainsi que pour identifier des groupes de régions afin de comprendre les causes profondes de ces taux de criminalité. La criminalité est aujourd'hui un sujet sensible : elle est en hausse et nous devons comprendre ses implications afin de mieux la gérer.

 

Décrivez votre solution de travail :
 

Nous avons téléchargé des jeux de données de statistiques sur la criminalité des trois années précédentes et filtré les champs et les lignes inutiles. Nous avons manipulé le champ des LSOA (Super Zones Statistiques Inférieures) pour obtenir le nom des zones locales, que nous avons ensuite cartographié par région (en utilisant le jeu de données de correspondance de district en région des autorités locales en Angleterre). Les catégories de criminalité ont été reclassées en groupes de niveau supérieur dans un but de cohérence en raison des écarts constatés ces dernières années.

 

crime-type-mappings.png

  

Prévision de série temporelle : Nous avons procédé à une prévision de série temporelle afin de prévoir les taux de criminalité sur un jeu de données test (janvier-mars 2018). Nous avons utilisé les outils « TS Model Factory » et « TS Forecast Factory » d'Alteryx Gallery pour exécuter des modèles ARIMA (moyenne de déplacement intégré auto-régressive) et ETS (lissage exponentiel).

 

Validation : Nous avons ensuite vérifié les prédictions par rapport aux chiffres réels de la criminalité sur la période de janvier à mars 2018.

 

2.png

 

Les résultats de la validation présentent des erreurs dans les différentes régions :

 

validation-results.png 

 Le taux d'erreurs par rapport à notre modèle « ETS » étaient de 12,2 %, ce qui suggérait que nos prévisions étaient exactes à 87,8 %. Les erreurs par rapport à notre modèle « ARIMA » étaient de 12,1 %, ce qui suggérait que les prévisions étaient exactes à 87,9 %. Comme nous avons constaté que le modèle « ARIMA » était légèrement plus performant que le modèle « ETS », nous avons décidé d'utiliser ces données pour notre analyse.

 

Amélioration des données : Nous étions intéressés par l'analyse des clusters pour connaître l'impact des carences sur le taux de criminalité en y combinant le jeu de données « Index de carence 2015 ».  Ces données contiennent les sept mesures relatives de la carence dans des zones limitées (Super Zones Statistiques Inférieures) dans toute l'Angleterre.

 

Nous avons utilisé les indicateurs pour chaque domaine, en excluant la criminalité, car c'était ce sujet que nous souhaitions prévoir et nous les avons ensuite réunis pour procéder à notre analyse de mise en cluster. Pour effectuer ces opérations efficacement, nous devions savoir quels facteurs étaient les plus susceptibles d'influer sur la criminalité et exclure ceux qui n'avaient aucun impact sur elle. L'outil Analyse d'association a généré une matrice de corrélation :

4.png

A partir des résultats de la matrice de corrélation, nous disposions de cinq champs d'un niveau de fiabilité élevé, que nous avons réduit encore davantage en utilisant plusieurs techniques afin de ne garder que ceux susceptibles d'améliorer l'exactitude des prévisions. Nous avons ensuite utilisé l'outil de Diagnostic K-Centroïdes pour déterminer le nombre optimal de clusters, puis l'outil Analyse des clusters K-Centroïdes pour attribuer chaque zone à un cluster.

 

5.png

 

Nous avons exporté les données d'Alteryx et chargé tous les fichiers pertinents dans Qlik Sense pour les visualisations, y compris les fichiers KML pour les cartes ([3],[4]).


6.png
7.png
 

 

Décrivez les avantages dont vous avez bénéficié :
 

L'utilisation d'Alteryx nous a permis de fusionner de grandes quantités de données publiques non structurées en provenance de multiples sources de données, que nous avons facilement combinées en vue d'analyses avancées. Nous avons utilisé des techniques avancées pour aboutir à des résultats clairs à la compréhension et pour nous préparer à ce qui est très susceptible de se produire. En effet, l'élaboration d'une base stable est essentielle à la production d'analyses fiables et de grande valeur qui garantissent des décisions de qualité supérieure. Nos prévisions quant aux taux de criminalité se sont avérées d’un degré d’exactitude supérieur et ont démontré comment les analyses prédictives peuvent être appliquées à des scénarios concrets. Nous avons partagé nos résultats à l'aide de Qlik Sense, un outil très accessible qui permet de comprendre le cheminement du problème à la solution. Nous avons présenté nos resultats auprès du personnel de la police ainsi qu'à la presse dans le cadre d'un webinaire, ce qui nous a valu des commentaires extrêmement positifs.

 

Ressources connexes

YouTube : regarder le replay du webinaire

 

Téléchargez notre présentation technique pour des instructions détaillées

 

 

Sources de données :

 

[1] Données globales de criminalité

https://data.police.uk/data/

 

[2] Liste des compétences des autorités locales en Angleterre par région (décembre 2016)

http://geoportal.statistics.gov.uk/datasets/local-authority-district-to-region-december-2016-lookup-...

 

[3] KML par zones géographiques - Districts anglais, agglomérations et quartiers de Londres, 2011https://borders.ukdataservice.ac.uk/easy_download_data.html?data=England_lad_2011

[4] KML par régions - Détails des Régions (décembre 2017) en Angleterre

http://geoportal.statistics.gov.uk/datasets/regions-december-2017-ultra-generalised-clipped-boundari...

 

[5] Données démographiques - Estimations de la densité en milieu d'année dans les zones de carence

https://www.ons.gov.uk/peoplepopulationandcommunity/populationandmigration/populationestimates/datas...

 

[6] Indice anglais de pauvreté de 2015

https://www.gov.uk/government/statistics/english-indices-of-deprivation-2015

Contributors