Free Trial

Blog

Visiones e ideas de las mentes más brillantes en el campo del análisis.
FláviaB
Alteryx Community Team
Alteryx Community Team

*Esta publicación fue escrita originalmente por @sprakasam en la Comunidad en inglés

 

De todos los sentidos que tenemos los seres humanos, se considera que la visión es el que más información procesa y con mayor rapidez. La visión artificial ayuda a que la tecnología pueda asimilar la información con rapidez de manera similiar a la de la vista humana. Es por ello que hemos agregado un nuevo grupo de herramientas de visión artificial a Alteryx Intelligence Suite: para ayudarte a procesar una gran cantidad de documentos de manera rápida y automatizada. Las nuevas herramientas de visión artificial utilizan modelos de aprendizaje automático para ayudarte a extraer información de documentos e imágenes.

 

Te presentamos el nuevo grupo de herramientas de visión artificial en Alteryx Intelligence SuiteTe presentamos el nuevo grupo de herramientas de visión artificial en Alteryx Intelligence Suite

 

 

 

Hablamos mucho sobre los modelos de aprendizaje automático, pero recuerda que un modelo es tan bueno como su conjunto de datos. Por ejemplo, no puedes mostrarle 500 imágenes de un perro a un algoritmo y preguntarle cómo son los gatos. La baja calidad de las imágenes, las malas orientaciones, los distintos formatos, todo ello se interpone en la adquisición rápida de insights a partir de conjuntos de datos grandes y complejos, desde estados financieros hasta reclamos del sistema de salud.

 

Además, mientras menos estructurados estén estos documentos, se requerirá más intervención manual (exponencialmente más) para extraer datos significativos. Por ejemplo, un científico de datos promedio pasa un 80 % de su tiempo preparando datos y apenas un 20 % elaborando realmente el modelo.

 

Me he dado cuenta de que cada vez que entro en una consulta médica y alguien me entrega un portapapeles y un bolígrafo, siempre hay pocas casillas en las que colocar mi nombre o mi dirección, por lo que siempre sobrepaso ese límite. Por un lado, no puedo seguir cambiando mi nombre y dirección, pero por otro espero que existan ciertos límites y estructuras en el tamaño de estos formularios.

 

¿Cuál es la respuesta a este dilema? Flexibilidad. El equipo de Alteryx cree que los algoritmos deben ser lo suficientemente flexibles como para adaptarse a las personas y no al revés. Por lo tanto, los modelos que encontrarás en Alteryx también mantienen estos valores.

 

Introduce casi cualquier imagen con Entrada de Imagen

Con la herramienta Entrada de Imagen actualizada, puedes manejar una gran variedad de formatos de imagen, ya sean tus PDF u otros formatos de imagen estándar, como JPEG, PNG y de mapa de bits. Sí, esto significa que la herramienta Entrada de PDF que conoces y que te encanta tiene un nuevo hogar. Se traslada del grupo de herramientas de minería de textos al nuevo grupo de herramientas de visión artificial y se integra en la nueva herramienta Entrada de Imagen.

 

La herramienta Entrada de PDF tiene más funcionalidades y un nuevo aspecto. Se convirtió en la herramienta Entrada de ImagenLa herramienta Entrada de PDF tiene más funcionalidades y un nuevo aspecto. Se convirtió en la herramienta Entrada de Imagen

 

 

Y más buenas noticias: no es necesario actualizar los flujos de trabajo existentes. La herramienta Entrada de Imagen está diseñada para que sea compatible con versiones anteriores. Cuando realices la actualización a la versión 21.2 de Alteryx Intelligence Suite, tus flujos de trabajo se actualizarán a la nueva herramienta y se ejecutarán sin problemas.

 

Extrae cada palabra con Procesamiento de Imagen

Uno de los principales factores de éxito y exactitud en el reconocimiento óptico de caracteres (OCR) es la calidad de la imagen. Las imágenes con poco contraste y borrosas dificultan el reconocimiento de los caracteres. Cuanto más se acerque una imagen a su forma impresa original, más sencillo será determinar su contenido. La solución para esto (y algunos otros problemas) es procesar la imagen antes de pasarla por el motor de OCR.

 

La nueva herramienta Procesamiento de Imagen hace exactamente eso y mucho más. Te ayuda a realizar rápidamente los pasos que se suelen utilizar para mejorar la calidad de la imagen. La herramienta te permite alinear imágenes, modificar sus umbrales, escalarlas y recortarlas. También puedes equilibrar el brillo de las imágenes e incluso convertirlas a escala de grises. Todos estos pasos son fundamentales para mejorar la calidad del reconocimiento de textos.

 

La nueva herramienta Procesamiento de Imagen te ofrece muchas formas de preparar tus imágenes para su análisisLa nueva herramienta Procesamiento de Imagen te ofrece muchas formas de preparar tus imágenes para su análisis

 

 

 

Lo que es aún más interesante es que el orden de ejecución de los distintos pasos sigue el orden en el que los agregas. Por lo tanto, siempre puedes arrastrar los widgets en la ventana Configuración para reordenarlos. Todos hemos tenido esa experiencia en la que hemos aplicado demasiados filtros a nuestras fotos de Instagram, ¿verdad? Bueno, tenemos lo que necesitas. Como filosofía de diseño, todos los pasos tienen opciones intuitivas para restablecerlos y eliminarlos según sea necesario.

 

La motivación detrás de la herramienta Procesamiento de Imagen es hacer que sea lo más sencillo posible tomar una imagen capturada en diversas circunstancias (por ejemplo, cuando te tiembla la mano al capturar una imagen o cuando te enfrentas a malas condiciones de iluminación) y extraer de ella datos importantes.

 

De inservible a legible. Gracias a la nueva herramienta Procesamiento de Imagen podrás extraer los datos de un recibo. Evidentemente, la fuente Comic Sans estaba “de moda” en el 2003De inservible a legible. Gracias a la nueva herramienta Procesamiento de Imagen podrás extraer los datos de un recibo. Evidentemente, la fuente Comic Sans estaba “de moda” en el 2003

 

 

Ahora tienes una imagen preprocesada, que se puede ejecutar con los algoritmos para que pase de ser una instantánea en tu teléfono a una lista de datos que se puede editar digitalmente. Una vez que tengas estas imágenes traducidas digitalmente, las posibilidades de conseguir insights son infinitas.

 

Obtén la máxima flexibilidad con la detección automática de tablas

Lo pediste y te escuchamos. Comprendemos que tratar de realizar OCR o incluso utilizarlo con el aprendizaje automático (ML) tiene sus dificultades y queremos asegurarnos de que obtengas la máxima flexibilidad con una cantidad mínima de trabajo manual. Por ello, en esta versión presentamos la Detección Automática de Tablas.

 

Con la Detección Automática de Tablas en la herramienta Plantilla de imagen, puedes extraer datos automáticamente de PDF complejoCon la Detección Automática de Tablas en la herramienta Plantilla de imagen, puedes extraer datos automáticamente de PDF complejo

 

 

 

La extracción de tablas de un documento complejo como el anterior es una tarea ardua, especialmente cuando tiene estructuras complejas que varían de página en página. Si trabajas con este tipo de documentos actualmente, es probable que pases horas lidiando con los cambios en el diseño de las tablas, tanto grandes como pequeños, a la vez que realizas un extenso trabajo de reelaboración para mantener la coherencia de los formatos de los datos.

 

Con la incorporación de la Detección Automática de Tablas, ahora podrás extraer datos de imágenes y documentos no estructurados. En este caso, el modelo de ML encuentra, limpia y extrae completamente la información, sin necesidad de ninguna plantilla. Todo lo que debes hacer es conectar la salida de la herramienta Entrada de Imagen al ancla de entrada opcional de la herramienta Plantilla de imagen.

 

Ahora, la interfaz de la herramienta Plantilla de imagen cambiará para indicarte que está funcionando en el modo de detección automática de tablas y que configuraste correctamente esta herramienta para que detecte las tablas de manera automática.

 

Ahora puedes automatizar este proceso para interpretar cosas como las facturas de Walmart, de Costco o incluso de tus proveedores locales del sistema de salud. Las herramientas de Alteryx Intelligence Suite están precisamente diseñadas para hacer todo esto a medida. Y aunque Alteryx Intelligence Suite hace esto a medida, sigue ofreciendo la flexibilidad de elegir áreas específicas de enfoque cuando se extrae información de documentos detallados, como los estados financieros. Alteryx Intelligence Suite realiza gran parte de este trabajo con OCR y extensiones de OCR con aprendizaje automático.

 

Ahora es tu turno
 

Ahora puedes descargar el instalador del complemento de Alteryx Intelligence Suite para obtener una prueba gratuita de estas herramientas. Para obtener la licencia, comunícate con tu representante de cuenta. Estas nuevas herramientas tienen flujos de trabajo de muestra disponibles (Ayuda > Flujos de trabajo de muestra > Aprender un modelo a la vez) para ayudarte a comenzar.

 

 

 

 

 

 

 

Etiquetas