Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

Blog

Les analyses et les idées des plus grands esprits de l'analyse.
TIPS de la semaine

Chaque semaine, découvrez de nouvelles astuces et bonnes pratiques pour devenir un expert !

Voir l'index
StephV
Alteryx Alumni (Retired)

De tous les sens que possèdent les êtres humains, la vue est considérée comme le plus rapide et comme celui qui permet de traiter le plus d'informations. La vision par ordinateur apporte quelque chose de similaire à la technologie en lui permettant d'assimiler rapidement l'information.

 

C'est pourquoi nous avons ajouté un nouveau groupe d'outils, Vision par ordinateur, dans Alteryx Intelligence Suite pour vous aider à traiter un grand nombre de documents rapidement et de manière automatisée. Ces nouveaux outils utilisent des modèles de machine learning pour extraire les informations que contiennent les documents et images.

 

StephJ_0-1621247988360.png

 

Découvrez le nouveau groupe d'outils de vision par ordinateur dans Intelligence Suite !

 

Nous parlons beaucoup des modèles de machine learning, mais n'oublions pas que la qualité d'un modèle dépend de l'ensemble de données qu'il utilise. Par exemple, vous ne pouvez pas montrer 500 images de chien à un algorithme et lui demander à quoi ressemble un chat. Une qualité d'image médiocre, de mauvaises orientations, la variété des formats : tous ces obstacles vous empêchent d'obtenir rapidement des informations exploitables avec des ensembles de données volumineux et complexes, tels que des états financiers, des demandes de remboursement de soins de santé et bien d'autres encore.

 

Moins ces documents sont structurés, plus ils nécessitent d'interventions manuelles (c'est exponentiel !) pour en extraire des données significatives. Par exemple, un data scientist typique passe en moyenne 80 % de son temps à préparer les données et seulement 20 % à créer le modèle.

 

J'ai remarqué qu'à chaque fois que je me rends dans un cabinet médical et que je dois remplir un formulaire, je n'ai jamais assez de place pour inscrire mon nom ou mon adresse, ça déborde toujours. D'une part, je ne peux pas changer mon nom et mon adresse et d'autre part, il est logique qu'il y ait une certaine structure et une limite à la taille de ces formulaires.

Quelle est la solution pour ce casse-tête ? La flexibilité. L'équipe Alteryx considère que les algorithmes doivent être suffisamment flexibles pour travailler pour les humains et non l'inverse. C'est le cas pour les modèles que vous trouverez dans Alteryx.

 

Peu d'images vous résistent grâce à l'outil Entrée d'image

Grâce à la version remaniée de l'outil Entrée d'image, vous pouvez gérer différents formats d'image, qu'il s'agisse de vos PDF ou d'autres formats standard tels que JPEG, PNG et Bitmap. Oui, cela signifie que l'outil Entrée de PDF que vous connaissez et aimez a déménagé ! Il passe du groupe d'outils Exploration de texte au nouveau groupe d'outils Vision par ordinateur et fait désormais partie du nouvel outil Entrée d'image.

StephJ_1-1621247988364.png

 

L'outil Entrée de PDF offre davantage de possibilités et a un nouveau look. Il est devenu l'outil Entrée d'image.

 

Une bonne nouvelle en cache toujours une autre : pas besoin de mettre à jour vos workflows existants ! L'outil Entrée d'image est rétrocompatible. Lorsque vous passez à la version 21.2 d'Alteryx Intelligence Suite, vos workflows sont actualisés pour prendre en compte le nouvel outil et s'exécutent comme si de rien n'était.

 

 

Aucun mot ne vous échappe avec l'outil Traitement d'image

 

La qualité de l'image est l'un des principaux facteurs contribuant au succès et à la précision de la reconnaissance optique des caractères (OCR). C'est plus difficile avec des images floues et un faible contraste. Plus l'image est proche de l'impression d'origine, plus elle est facile à traiter. La solution à ce problème, et à d'autres, consiste à passer par un traitement de l'image avant de la soumettre au moteur OCR.

 

C'est exactement ce que fait le nouvel outil de traitement d'image. Et il en fait bien plus encore. Il vous permet d'effectuer rapidement les étapes généralement utilisées pour améliorer la qualité de l'image. Vous pouvez aligner, redimensionner et rogner les images, ainsi que leur appliquer un seuillage. Vous pouvez également régler la luminosité et convertir l'image en niveaux de gris. Toutes ces opérations sont essentielles pour améliorer la qualité de la reconnaissance du texte.

 

StephJ_2-1621247988373.png

 

Avec le nouvel outil de traitement d'image, vous disposez de plusieurs méthodes pour préparer vos images avant l'analyse.

 

Ce qui ressort clairement, c'est que l'ordre d'exécution des différentes étapes suit l'ordre dans lequel vous les ajoutez. Vous pouvez toujours les réorganiser en faisant glisser les widgets dans la fenêtre de configuration. Nous avons tous, un jour ou l'autre, appliqué trop de filtres à nos images Instagram… n'est-ce pas ? Eh bien, nous avons prévu ce cas de figure. Selon notre philosophie de la conception, des options intuitives sont offertes pour réinitialiser et supprimer toutes les étapes.

L'objectif est de vous permettre, aussi simplement que possible, de choisir une image capturée dans diverses circonstances (par exemple, si votre doigt tremble ou sous un mauvais éclairage) et d'en extraire des données significatives.

 

 

 

StephJ_3-1621247988399.png

 

De l'inexploitable au lisible ! Un reçu est prêt pour l'extraction de données grâce au nouvel outil de traitement d'image. Il est clair que la police Comic Sans était tendance en 2003 !

 

 

Maintenant que vous disposez d'une image prétraitée, celle-ci peut être soumise à des algorithmes pour être transformée : la photo prise avec votre smartphone devient une liste de données numérisées et modifiables. Une fois vos images converties au format numérique, elles offrent des possibilités infinies pour en extraire des informations exploitables.

 

Une flexibilité optimale grâce à la détection automatique des tableaux

Nous avons bien pris note de vos attentes. Nous comprenons que tenter d'exploiter l'OCR ou même l'utiliser avec le machine learning (ML) est un défi, et nous voulons nous assurer que vous disposez d'une flexibilité maximale avec un minimum d'interventions manuelles. Nous avons donc inclus la détection automatique des tableaux dans cette version.

 

StephJ_4-1621247988419.png

 

Grâce à la détection automatique des tableaux fournie par l'outil Modèle d'image, vous pouvez extraire automatiquement des données de vos PDF complexes.

 

 

Il n'est pas facile d'extraire les informations qui se trouvent dans des tableaux de documents complexes comme ci-dessus, surtout avec des structures compliquées qui changent à chaque page. Avec de tels documents, vous devez probablement passer des heures à vous battre avec des changements de mise en page, et des tableaux de taille variable, tout en effectuant de nombreux remaniements pour assurer une cohérence dans les formats de données.

 

Avec la détection automatique des tableaux, vous pouvez désormais extraire les données de vos images et documents non structurés. Le modèle ML trouve, nettoie et récupère les informations sans avoir besoin de guide. Il vous suffit de relier la sortie de l'outil Entrée d'image au point d'ancrage d'entrée facultatif de l'outil Modèle d'image.

 

L'interface de l'outil Modèle d'image change pour vous indiquer que vous êtes en mode de détection automatique de tableaux et que vous avez correctement configuré cet outil pour détecter automatiquement les tableaux.

 

Vous pouvez maintenant automatiser ce processus pour interpréter des documents tels que des reçus de supermarché ou même les factures des professionnels de santé. Les outils d'Alteryx Intelligence Suite sont précisément conçus pour effectuer toutes ces opérations d'une manière globale. Vous avez malgré tout la possibilité de faire des choix lorsque vous extrayez des informations depuis des documents détaillés tels que des états financiers. Intelligence Suite effectue la majeure partie de ces opérations avec l'OCR et les extensions d'OCR avec le Machine Learning.

 

 

À vous de jouer !

 

Vous pouvez télécharger le programme d'installation du module complémentaire Alteryx Intelligence Suite pour essayer gratuitement ces outils. Pour obtenir la licence, contactez la personne chargée de votre compte. Pour vous aider à démarrer, nous proposons des exemples de workflows utilisant ces nouveaux outils dans le menu Aide (Aide > Exemples de workflows > Apprendre un modèle à la fois).

 

*Cet article "Unlocking Insights from Images using Computer Vision" a été écrit par @sprakasam et publié sur la communauté anglaise

Étiquettes