Free Trial

Blog

Insights e ideias das mentes mais brilhantes em análise de dados.
Garabujo7
Alteryx
Alteryx

Se você é uma das 750 milhões de pessoas que usam o Excel no mundo, este artigo será de seu interesse.

 

 

 

Garabujo7_0-1599601547143.jpeg

 

 

 

Quando você precisa trabalhar com vários arquivos de Excel, ou vários arquivos que possuem diferentes planilhas separadas, ler um intervalo ou se você tiver muitos arquivos em um diretório e quiser ler apenas o mais recente, aqui você deve encontrar a ajuda que precisa para resolver tudo isso. 

 

Ler vários arquivos usando um caractere curinga (*)

 

Se você tiver vários arquivos do Excel e quiser lê-los sem ter que usar uma ferramenta de Dados de Entrada para cada um, você pode fazer isso usando o curinga "*" que significa: qualquer coisa.

 

 

Garabujo7_1-1599601586201.png

 

 

 

Assim, serão lidos todos os arquivos que começam com "e" e têm a extensão xslx.

 

Isso pode ser combinado das seguintes formas:

 

  • Para ler todo o conteúdo de uma pasta, qualquer nome de arquivo de qualquer tipo (Excel, Word, csv): *. *
  • Para ler todos os arquivos de um único tipo, adicione a extensão após o ponto: * .xlsx ou * .csv ou * .doc
  • Se for preciso abrir os arquivos que possuem algumas letras ou números: abril * .xlsx

 

 

 

Garabujo7_2-1599601586206.png

 

 

 

Desta forma, é possível abrir vários arquivos ao mesmo tempo usando apenas uma ferramenta Dados de Entrada.

 

 

 

Garabujo7_3-1599601586207.png

 

 

 

Para diferenciar os arquivos que foram abertos, o parâmetro 5 da ferramenta Dados de Entrada pode ser modificado. Você pode optar por incluir o nome do arquivo como um campo que inclui o nome do arquivo ou todo o caminho do arquivo.

 

 

 

Garabujo7_4-1599601586209.png

 

 

 

Nota: a restrição para usar esta funcionalidade é que os arquivos a serem abertos devem ter o mesmo modelo, nome, número de colunas e ordem.

 

Caso não coincidam, a ferramenta apresentará um erro.

 

 

 

Garabujo7_5-1599601586210.png

 

 

 

Este erro indica que os arquivos estão em formatos diferentes.

 

Ler o arquivo mais recente

 

Quando começamos a sistematizar um processo de negócio, uma das principais atividades que precisam ser automatizadas é a leitura de arquivos, principalmente quando usamos arquivos de excel ou separados por vírgulas.

 

O que normalmente acontece é que um novo arquivo é criado a cada mês e salvo em uma pasta. Para ler sempre o mais atual sem a intervenção do usuário, é possível revisar os atributos de cada arquivo e utilizar a data de criação fornecida pela ferramenta. 

 

A ferramenta Diretório nos permite ler todos os arquivos em uma pasta, incluindo as subpastas.

 

 

 

Garabujo7_6-1599601586213.png

 

 

 

Pegando a data em que foi criado e sempre selecionando o mais recente, podemos ler automaticamente o último arquivo para alimentar nosso fluxo de trabalho.

 

 

 

Garabujo7_7-1599601586215.png

 

 

 

Classificamos por data de criação -> decrescente.

 

 

 

Garabujo7_8-1599601586216.png

 

 

 

Usamos a ferramenta Amostra para que nos forneça apenas o primeiro registro, que será o mais recente.

 

 

 

Garabujo7_9-1599601586219.png

 

 

Adicionamos uma ferramenta Entrada Dinâmica para nos ajudar a ler o conteúdo do arquivo.

 

 

Garabujo7_10-1599601586221.png

 

 

 

Se você nunca usou a Entrada Dinâmica, ela é muito versátil. Você pode aprender mais sobre ela em nossa série de artigos do Domínio de Ferramentas: Entrada Dinâmica.

 

Para adicionar o nome do arquivo como uma referência em um campo, você pode usar uma ferramenta Fórmula e colocar a expressão FileGetFileName.

 

 

 

Garabujo7_11-1599601586223.png

 

 

 

Garabujo7_12-1599601586226.png

 

 

Ler um intervalo em Excel

 

Para ler apenas um intervalo dentro de um arquivo, ao abri-lo, você deve simplesmente selecionar o intervalo.

 

 

 

Garabujo7_13-1599601805645.png

 

 

 

O intervalo tem o mesmo formato que no Excel: coluna-linha inicial e coluna-linha final.

 

 

 

Garabujo7_14-1599601805648.png

 

 

 

 

Ler um intervalo nomeado do Excel

 

Se o arquivo do Excel possui um intervalo nomeado, no Alteryx é muito fácil de ler. Basta escolher a opção "Selecionar um intervalo nomeado" e os intervalos nomeados aparecerão automaticamente.

 

 

 

Garabujo7_15-1599601805650.png

 

 

 

Ao abrirmos o arquivo, veremos apenas o conteúdo do intervalo selecionado.

 

 

 

Garabujo7_16-1599601805655.png

 

 

 

Ler páginas diferentes no mesmo arquivo

 

Para ler diferentes planilhas em um arquivo de Excel, podemos usar as ferramentas Dados de Entrada e Entrada Dinâmica.

 

Na ferramenta Dados de Entrada, selecione a opção "Importar somente a lista de nomes das planilhas".

 

 

 

Garabujo7_17-1599601805658.png

 

 

 

Depois você adiciona a ferramenta Entrada Dinâmica para ler o conteúdo das planilhas.

 

 

 

Garabujo7_18-1599601805660.png

 

 

 

Para obter o nome de cada planilha e poder ter a referência como um campo, usamos uma ferramenta RegEx.

 

 

 

Garabujo7_19-1599601805696.png

 

 

 

ferramenta RegEx nos permite pesquisar padrões de caracteres (letras e números) em vez de palavras específicas para substitui-los ou identificá-los.

 

Usando esta ferramenta podemos extrair apenas o nome da planilha que está dentro do caminho completo com a localização do arquivo.

 

 

 

Garabujo7_20-1599601805732.png

 

 

No exemplo acima, identificamos o padrão com 3 "\" e extraímos tudo depois dele.

 

 

 

Garabujo7_21-1599601805736.png

 

 

 

Assim temos o nome de cada planilha.

 

Por fim, usamos uma ferramenta Selecionar para ocultar as colunas que não precisamos.

 

 

 

Garabujo7_22-1599601805739.png

 

 

 

Nota: a restrição para usar esta funcionalidade é que os arquivos a serem abertos devem ter o mesmo modelo, número de colunas e ordem.

 

 

 

Garabujo7_23-1599601805742.png

 

 

Caso não coincidam, a ferramenta mostrará um alerta e só apresentará o conteúdo daqueles que forem iguais.

 

 

 

Garabujo7_24-1599601805745.png

 

 

 

Ler vários arquivos com várias planilhas e modelos diferentes

 

Se os casos anteriores não resolveram o que você precisa, abaixo está a solução.

 

Esta opção usa uma macro de processamento em lote.

 

 

Macros

 

As macros são muito úteis para encapsular processos de negócios amplos em uma ferramenta e tornar mais fácil para compartilhá-los com mais pessoas.

 

 

No Alteryx, temos três tipos:

 

  • Padrão

 

 

Se quiser começar a aprender sobre macros padrão com o Alteryx, você pode revisar este artigo.

 

  • Por lote

 

No caso das macros de processamento em lote, o que elas fazem é executar todo o fluxo com cada registro individualmente. O que lhe dá a possibilidade de modificar o resultado de acordo com o conteúdo de cada linha, dando grande flexibilidade ao processamento dos dados.

 

 

  • Iterativos

 

Isso funciona até que uma condição seja atendida.

 

 

Por que usar uma macro iterativa?

 

 

Como vimos nos processos anteriores, se usarmos uma ferramenta Dados de Entrada normal, sempre precisamos que os arquivos ou planilhas tenham o mesmo modelo para poderem ser lidos ao mesmo tempo. Se os formatos não corresponderem, isso nos dará um erro ou o conteúdo não será lido.

 

Macro de lote para ler várias exceles com diferentes folhas e formatos diferentes

 

É aqui que entra o poder da macro de lote. Como um registro é executado por vez, não importa se cada arquivo tem um modelo, número de colunas ou nomes diferentes.

 

Como a leitura é feita uma a uma e grava o resultado, só precisamos no final juntar o conteúdo de cada arquivo usando o comportamento da ferramenta União.

 

A ferramenta que torna o fluxo um processo em lote é a Parâmetro de Controle.

 

 

Garabujo7_25-1599601805745.png

 

 

 

Isso informa à macro para ler os registros um por um e escrever o resultado sucessivamente até terminar com todos eles.

 

O que vai mudar a cada vez que você ler um arquivo será o template e como são executados individualmente - evitando os erros.

 

Como mencionei, uma macro é um processo encapsulado, para usá-la precisamos apenas de uma ferramenta que possamos customizar.

 

 

 

Garabujo7_26-1599601805746.png

 

 

 

Para ver o conteúdo da macro, clicamos com o botão direito na ferramenta e selecionamos a opção "Abrir macro".

 

 

 

Garabujo7_27-1599601805749.png

 

 

 

Este é o conteúdo da macro. A lógica que processa os arquivos é inserida em uma única ferramenta que também adiciona ordem, clareza e torna nossos fluxos modulares.

 

 

Garabujo7_28-1599601805752.png

 

 

Depois de inserir a macro, adicionamos uma ferramenta Diretório para ler todos os arquivos que precisamos.

 

 

 

Garabujo7_29-1599601805754.png

 

 

 

Com a macro aberta, podemos alterar as suas configurações selecionando o menu Exibir -> Designer de interface.

 

Quando a tela da interface é exibida, selecionamos a engrenagem. Se quisermos colocar um ícone personalizado na macro, podemos fazer isso selecionando a opção de "ícone personalizado".

 

Para alterar o comportamento de união dos resultados selecionamos a opção por nome ou por posição.

 

A diferença é que por nome ele vai empilhar o conteúdo das colunas que têm o mesmo nome e, as que não combinam, serão colocadas no final, enquanto a opção por posição o fará de acordo com sua localização no primeiro arquivo.

 

Confira mais detalhes da operação na ferramenta União.

 

 

 

Garabujo7_30-1599601805757.png

 

 

 

Garabujo7_31-1599601805762.png

 

 

Adicionar a macro à paleta de ferramentas do Alteryx Designer

 

Para adicionar sua macro customizada ou outras que você baixou da galeria pública no Designer, selecione Opções -> Configurações de usuário -> Editar configurações de usuário.

 

 

 

Garabujo7_32-1599601805767.png

 

 

 

Uma vez lá, escolha a categoria Macros, clique no sinal +, dê um nome para a pasta para identificá-la facilmente como Macros e clique em Salvar.

 

 

 

Garabujo7_33-1599601805769.png

 

 

Garabujo7_34-1599601805770.png

 

 

Garabujo7_35-1599601805772.png

 

 

 

Agora, todas as macros que você criar ou baixar podem ser colocadas nessa pasta e o Designer irá reconhecê-las automaticamente e elas aparecerão em uma guia com o nome que você deu. No meu caso, a categoria se chama "Macros".

 

Alteryx Gallery

 

Galeria Alteryx tem muitas macros predefinidas que você pode baixar e usar em seus fluxos.

 

 

 

Garabujo7_36-1599601805783.png

 

 

Estas são as opções que temos para ler o conteúdo de vários arquivos de Excel ao mesmo tempo.

 

Espero que isso torne seus processos tão fáceis quanto os meus.

 

Se você tiver qualquer dúvida, não hesite em perguntar nos comentários deste post.

 

 

 

 

 

 

 

Rótulos