Free Trial

Blog

Insights e ideias das mentes mais brilhantes em análise de dados.
SylviaP
Moderator
Moderator

Pic_1.png

 

Trazer vários arquivos de uma vez para o seu fluxo pode parecer uma tarefa difícil, mas acredite na gente, você vai economizar muito tempo ao aprender diferentes maneiras de fazer isso.

 

Ler vários arquivos usando um caractere curinga (*) com a ferramenta Dados de Entrada

 

Na maioria das vezes, você só precisa de uma ferramenta Dados de Entrada para inserir seus dados, o que é excelente, porque é com certeza o método mais fácil e rápido.

 

Combinações:

Você pode usar um caractere curinga de diferentes formas:

  • Para ler todos os arquivos de um único tipo, adicione a extensão após o ponto: *.xlsx ou *.csv ou *.doc
  • Para abrir arquivos que possuem letras ou números, por exemplo, todos os arquivos do Excel que começam com a palavra “abril”: abril*.xlsx

Requisitos:

  • Você precisa que todos os seus arquivos estejam no mesmo diretório
  • Todos os arquivos devem ter a mesma extensão (por exemplo, .csv, .xlsx, .yxdb)
  • Todos os arquivos devem seguir o mesmo esquema, ou seja, ter o mesmo número de colunas, estar na mesma ordem e possuir os mesmos tipos de dados
  • Se os nomes das colunas forem diferentes o Designer gera um aviso e importa as colunas seguindo os nomes do primeiro arquivo importado

Como usar um caractere curinga:

1. Configure a ferramenta Dados de Entrada para ela trazer um dos arquivos de seu diretório.

Pic_2.png

 

2. No campo que mostra a conexão, substitua o nome do arquivo (ou uma parte do nome do arquivo) por um asterisco (*). O asterisco é um caractere curinga que substitui qualquer coisa.

Pic_3.png

 

Portanto, de acordo com a instrução acima, os arquivos serão procurados em C:\Users\sylvia.pereira\OneDrive - alteryx.com\Desktop\Artigo_LP\Planilhas\ e todos aqueles que começam com "Nome da loja -" e terminam com ".xlsx " serão incluídos nos dados de entrada.

 

Nota: Caso os nomes das planilhas dentro dos arquivos sejam diferentes, em vez de importar um arquivo para depois incluir o caractere curinga, digite o caminho usando o caractere curinga diretamente na caixa de texto “Conectar a um arquivo ou base de dados”.

 

 Resultados:

  • Todos os dados contidos nos arquivos são empilhados, uns sobre os outros
  • Se você deseja ver de qual arquivo os dados vêm, use a opção "Gerar campo com o nome do arquivo" na configuração da ferramenta Dados de Entrada

Pic_4.png

 

Pic_5.png

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ler diferentes planilhas no mesmo arquivo com a ferramenta Entrada Dinâmica

 

Às vezes, tudo parece simples, mas daí você descobre que as planilhas que você precisa ler estão todas dentro de um mesmo arquivo. Nesse caso, você vai precisar usar uma lista de caminhos de arquivo para alimentar uma Entrada Dinâmica.

 

Requisitos:

  • Ter uma ferramenta Dados de Entrada
  • Todos as planilhas devem ter o mesmo esquema, ou seja, o mesmo número de campos, na mesma ordem e com os mesmos tipos de dados
  • Um arquivo para preencher a configuração "Modelo da fonte de dados de entrada" da ferramenta Entrada Dinâmica. Este arquivo SEMPRE terá que estar disponível para a ferramenta basear seu esquema de campos e pode ser qualquer um dos arquivos que você deseja inserir. Ele não será inserido se não estiver na lista de arquivos mencionada anteriormente

Como fazer isso:

1. Uma ferramenta Dados de Entrada pode ser usada para gerar uma lista de nomes de planilhas e fornecer o caminho do arquivo para a pasta de trabalho. Na ferramenta Dados de Entrada, selecione a opção "Importar somente a lista de nomes das planilhas".

Pic_6.png

 

2. Adicione uma ferramenta Entrada Dinâmica e configure-a de forma que ela leia o conteúdo das planilhas. A leitura de várias planilhas é suportada apenas para arquivos .xlsx

Pic_7.png

 

Ler diferentes arquivos com várias planilhas e modelos diferentes usando uma macro de lote

 

Pic_8.png

 

Se você chegar em um ponto em que só recebe mensagens de erro que impedem seus arquivos de serem carregados, então é hora de usar uma macro de lote. As macros são muito úteis para encapsular processos amplos em uma ferramenta e tornar mais fácil para compartilhá-los com mais pessoas.

 

Por que usar uma macro iterativa?

 

Como vimos nos processos anteriores, se usarmos uma ferramenta Dados de Entrada normal, sempre precisamos que os arquivos ou planilhas tenham o mesmo modelo para poderem ser lidos ao mesmo tempo. Se os formatos não corresponderem, isso gera um erro e o conteúdo não será lido.

 

É aqui que entra o poder das macros de processamento em lote. Como é executado um registro por vez, não importa se cada arquivo tem um modelo, número de colunas ou nomes diferentes.

 

Como a leitura é feita uma linha de cada vez, gravando esses resultados um a um, só precisamos no final juntar o conteúdo de cada arquivo usando o comportamento da ferramenta União.

A ferramenta que converte o fluxo em um processo em lote é a Parâmetro de ControlePic_9.png

 

Essa ferramenta informa à macro para ler os registros um por um e escrever o resultado sucessivamente até que todos sejam lidos. O que vai mudar a cada vez que você ler um arquivo será o modelo e como são executados individualmente - evitando os erros.

 

Para ver o conteúdo da macro, clicamos com o botão direito na ferramenta e selecionamos a opção "Abrir macro".

Pic_10.png

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Este é o conteúdo da macro. A lógica que processa os arquivos é inserida em uma única ferramenta, o que também adiciona ordem, clareza e torna nossos fluxos modulares.

Pic_11.png

 

 

 

 

 

 

 

 

 

 

 

 

Com a macro aberta, podemos alterar as suas configurações selecionando no menu superior  Exibir > Interface Designer.

 

Pic_12.png

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Clique no ícone Propriedades Pic_13.png. Se quisermos colocar um ícone personalizado na macro, podemos fazer isso selecionando a opção de "ícone personalizado".

 

Para alterar o comportamento de união dos resultados, selecionamos a opção por nome ou por posição. A diferença é que por nome ele vai empilhar o conteúdo das colunas que têm o mesmo nome e, as que não combinam, serão colocadas no final, enquanto a opção por posição o fará de acordo com a localização das colunas no primeiro arquivo.

 

Confira mais detalhes da operação na ferramenta União.

 

Pic_14.png

 

 

 

 

 

 

 

 

 

 

“Configurar por nome” unirá os campos com os mesmos nomes e “Configurar por posição” unirá o campo 1 do arquivo 1 no topo do campo 1 do arquivo 2, e assim por diante para cada arquivo.

 

Assim que configurar a Interface Designer, você pode salvar a macro e inseri-la em seu fluxo de trabalho (clique com o botão direito na tela Inserir > Macro). Dê uma olhada no exemplo de fluxo de trabalho postado junto com este artigo, pois ele inclui arquivos fictícios e a macro de lote para você ver como o processo funciona.

 

Depois de inserir a macro, adicionamos uma ferramenta Diretório para ler todos os arquivos que precisamos.

Pic_15.png

 

 

 

 

 

 

Esse post foi construído com base nos artigos The Ultimate Input Data Flowchart e Leia arquivos do Excel com flexibilidade.

Comentários
Rótulos