Free Trial

Blog

Insights e ideias das mentes mais brilhantes em análise de dados.
FláviaB
Alteryx Community Team
Alteryx Community Team

*Este artigo é uma reprodução do texto original escrito por @sprakasam na Comunidade em inglês  


De todos os sentidos humanos, a visão é considerada a que processa a maior parte das informações, a mais rápida. A Visão Computacional ajuda a dar à tecnologia uma capacidade semelhante de digerir informações rapidamente. Por esse motivo, adicionamos um novo grupo de ferramentas de Visão Computacional ao Alteryx Intelligence Suite para ajudar você a processar um grande número de documentos de forma rápida e automatizada. As novas ferramentas de Visão Computacional utilizam modelos de machine learning para ajudar você a extrair informações de documentos e imagens.


Conheça o novo grupo de ferramentas de Visão Computacional no Intelligence Suite!Conheça o novo grupo de ferramentas de Visão Computacional no Intelligence Suite!

 

 

Falamos bastante sobre modelos de machine learning, mas lembre-se de que não adiantará nada ter um modelo excelente se os dados não forem bons o suficiente. Por exemplo, você não pode mostrar um algoritmo de 500 imagens de um cão e perguntar sobre a aparência de um gato. Imagens de baixa qualidade, orientações ruins, formatos variados... tudo isso interfere na obtenção de insights rápidos em conjuntos grandes e complexos, de demonstrações financeiras até reclamações no setor de saúde.

 

Além disso, quanto menos estrutura esses documentos tiverem, mais intervenção manual é necessária (bem mais!) para extrair dados significativos. Por exemplo, um cientista de dados mediano gasta 80% de seu tempo preparando as informações e apenas 20% na criação do modelo.

 

Reparei que sempre que entro em um consultório médico e alguém me entrega uma prancheta e uma caneta, há sempre um espaço a menos para escrever meu nome ou meu endereço, sempre deixando algo de fora. Por um lado, não posso ficar mudando meu nome e endereço, mas por outro, espero que haja uma estrutura e um limite de tamanho para esses formulários.

 

Qual é a resposta para este dilema? Flexibilidade. A equipe Alteryx acredita que os algoritmos devam ser flexíveis o bastante para trabalhar a serviço dos humanos e não o contrário. Por isso, os modelos que você encontrará no Alteryx também são assim.

 

Eles são capazes de consumir praticamente qualquer imagem através da ferramenta Entrada de Imagem

Com a nova versão da ferramenta Entrada de Imagem, você pode processar vários formatos de imagem, sejam PDFs ou arquivos como JPEG, PNG e Bitmap. Sim, isso significa que a ferramenta Entrada de PDF que você já conhece e ama está de cara nova! Ela está mudando do grupo de ferramentas de Mineração de Texto para o novo grupo de ferramentas de Visão Computacional, além de passar a integrar a nova ferramenta de Entrada de Imagem.

 

A ferramenta Entrada de PDF está ganhando mais recursos e um novo visual! Agora ela é a ferramenta Entrada de ImagemA ferramenta Entrada de PDF está ganhando mais recursos e um novo visual! Agora ela é a ferramenta Entrada de Imagem

 

 

E as boas notícias não param por aí: você não precisa atualizar os seus fluxos existentes! A ferramenta Entrada de Imagem foi criada com compatibilidade para as versões anteriores. Quando você faz o upgrade para a versão 21.2 do Alteryx Intelligence Suite, os seus fluxos são atualizados para a nova ferramenta e executados sem problemas.

 

Extraia todas as palavras com a ferramenta Processamento de Imagem

Um dos principais fatores de um reconhecimento óptico de caracteres (OCR) bem executado e preciso é a qualidade da imagem. Imagens de baixo contraste e desfocadas dificultam o reconhecimento de caracteres. Quanto mais próxima do formulário impresso original a imagem for, mais fácil será adivinhar o que está escrito nela. A solução para isso (e para alguns outros problemas) é processar a imagem antes de executá-la no mecanismo de OCR.

 

A nova ferramenta Processamento de Imagem faz exatamente isso e muito mais. Ela ajuda você a seguir rapidamente as etapas normalmente adotadas para melhorar a qualidade da imagem. A ferramenta permite alinhar, limiarizar, redimensionar e recortar imagens. Você também pode ajustar o brilho e até converter para escala de cinza. Todas essas etapas são fundamentais para melhorar a qualidade do reconhecimento de texto.

 

A nova ferramenta Processamento de Imagem oferece a você várias maneiras de preparar as suas imagens para análiseA nova ferramenta Processamento de Imagem oferece a você várias maneiras de preparar as suas imagens para análise

 

 

 

O mais interessante é que as diversas etapas são executadas na ordem em que você as adiciona. Portanto, você sempre pode reordená-las arrastando os widgets na janela de configuração! Todos nós já tivemos a experiência de utilizar um filtro em excesso nas nossas fotos das redes sociais, certo? Nós temos a solução para isso. Como filosofia do Designer, todas as etapas vêm com opções intuitivas para redefinição e remoção conforme necessário.

 

O papel da ferramenta Processamento de Imagem é fazer com que você consiga extrair dados significativos de uma foto tirada em diversas circunstâncias (por exemplo, quando seu dedo não para quieto ou a iluminação não é apropriada) da forma mais simples possível.

 

Transformando algo inutilizável em legível! Agora, graças à nova ferramenta Processamento de Imagem, você pode extrair dados de um recibo. A fonte Comic Sans claramente estava na moda em 2003!Transformando algo inutilizável em legível! Agora, graças à nova ferramenta Processamento de Imagem, você pode extrair dados de um recibo. A fonte Comic Sans claramente estava na moda em 2003!

 

 

 

Agora que você tem uma imagem pré-processada, execute-a através dos algoritmos para converter um clique rápido do celular em uma lista de dados digitalmente editável. Depois que essas imagens forem convertidas digitalmente, a possibilidade de insights é infinita.

 

Obtenha flexibilidade máxima com a detecção automática de tabelas

Você pediu, nós atendemos! Sabemos que tentar realizar OCR ou mesmo utilizá-lo com machine learning (ML) pode ser algo desafiador. Queremos garantir que você tenha o máximo de flexibilidade com o mínimo de trabalho manual. É por isso que estamos introduzindo a detecção automática de tabelas nesta versão.

 

Com a detecção automática de tabelas na ferramenta Modelo de Imagem, você pode extrair dados de PDFs complexos automaticamenteCom a detecção automática de tabelas na ferramenta Modelo de Imagem, você pode extrair dados de PDFs complexos automaticamente

 

 

 

Extrair tabelas de um documento complexo como mostrado acima é trabalhoso, especialmente quando ele possui estruturas complexas que variam em cada página. Se hoje você trabalha com esses documentos, provavelmente terá que passar horas fazendo alterações em layouts de tabelas, além de ficar reajustando os formatos de dados para que fiquem consistentes.

 

Com a introdução da detecção automática de tabelas, agora você pode extrair dados de imagens e documentos não estruturados. Aqui, o modelo de ML encontra, limpa e extrai informações inteiramente sem precisar de nenhum modelo. Para isso, basta conectar a saída da ferramenta Entrada de Imagem à âncora de entrada opcional da ferramenta Modelo de Imagem.

 

Aqui, a interface da ferramenta Modelo de Imagem muda para informar que você está no modo de detecção automática de tabelas e configurou a ferramenta corretamente.

 

Agora você pode automatizar esse processo para interpretar coisas como faturas do Walmart, do Costco ou até mesmo prestadores locais de serviços de saúde. As ferramentas do Alteryx Intelligence Suite são projetadas com precisão para fazer tudo isso em escala. E mesmo o Intelligence Suite fazendo isso em escala, ele ainda oferece a flexibilidade de escolher áreas específicas de foco quando você estiver extraindo informações de documentos detalhados, como demonstrações financeiras.  Para fazer isso, o Intelligence Suite utiliza bastante OCR e extensões de OCR com aprendizado de máquina.

 

Agora é a sua vez!

Você pode baixar o add-on do Alteryx Intelligence Suite para obter uma avaliação gratuita dessas ferramentas. Obtenha a licença entrando em contato com o seu representante de conta. Essas novas ferramentas têm fluxos de amostra disponíveis (Ajuda > Fluxos de trabalho de amostra > Aprender um modelo por vez) para ajudar você a começar. 

Rótulos