Free Trial

Fórum

Extração de dados de varios PDFs

hdosremi
Átomo

Olá pessoal! sou novato no Alteryx e estou com uma duvida....

Preciso extrair dados de varios PDFs, são notas fiscais de ISRAEL...rss...e como esta tudo em hebraico, complica um pouco, mas os dados que preciso são numericos, de 2 campos especificos, mas as notas podem variar entre 1 ou mais paginas, mas somente na primeira tem a informação que preciso, mas queria fazer isso em massa, de varios pdfs de uma pasta. 

 

Testando, fiz o fluxo conforme a imagem, gostaria de saber se estou no caminho certo ou o que devo acrescentar ou excluir do fluxo para me trazer os dados em tabela.

 

Outra duvida...

 

ainda com invoice...preciso extrair do PDF o que tem a palavra tax invoice, ou seja, "SE" tiver, ele só indica que tem essa palavra no pdf, se não, ele indica que NAO tem. Alguem sabe como fazer isso?

 

Obrigado!!!

5 RESPOSTAS 5
carlosteixeira
15 - Aurora
15 - Aurora

Bom dia @hdosremi tudo bem?

Cara acho que você está em um caminho muito bom. Vá em frente.

 

Quanto a extrair a parte de invoice, vc vai conseguir fazer isso usando uma fórmula depois de extrair os dados do PDF.

 

Se você puder compartilhar uma das NF pra gente brincar seria interessante, e conseguiriamos te ajudar mais.

Compartilha o fluxo também se for possivel claro

 

Abraços

Carlos A Teixeira
hdosremi
Átomo

è minha primeira semana no Alteryx, e por isso estou um pouco "noob"...haha...

 

bom, vamos la...

 

segue o fluxo e o PDF, mas quero fazer isso em massa e com varios PDFs, quebrando a cabeça e não consigo achar a solução...rs

carlosteixeira
15 - Aurora
15 - Aurora

@hdosremi sem problemas estar começando agora. Todo mundo começou um dia também.

 

Consegue fazer um export do seu fluxo?

 

Faz assim: vai no menu Options/Export workflow

Quando ele abrir a tela do export, você marca tudo que estiver no Group Assets by tool.

 

A parte de baixo do seu fluxo, onde vc incluiu as anotações não veio.

 

Posta aqui o arquivo yxzp que vai ser gerado.

 

Abraços

Carlos A Teixeira
hdosremi
Átomo

Acho que agora foi, achei que era só o arquivo salvo....

carlosteixeira
15 - Aurora
15 - Aurora

@hdosremi pelo que eu entendi você já conseguiu extrair os dados que você precisa.

Para ler vários arquivos de uma vez você pode usar a ferramenta directory, e na Input Image mapear o campo Full Path que vem da Directory.

 

Segue algumas imagens:

 

image_1.pngimage_2.png

 

Veja se funciona

 

Abraços

Carlos A Teixeira
Rótulos