Free Trial

Fórum

JUNÇÃO DE DADOS - DIMINUIÇÃO DAS LINHAS

saresipi
Asteroide

Olá, pessoal. 

 

Estou com uma dúvida, se alguém puder me ajudar, por favor. Fiz a união de várias planilhas e totalizou mais ou menos 41k de linhas:

ALTERYX AGRUPAR.png

 

Logo em seguida, utilizei a ferramenta junção e as linhas diminuíram para 21k, o que pode ter ocorrido? Gostaria de manter as 41k de linhas e apenas agregar nova coluna com a junção... A cada junção que faço os dados diminuem.

ALTERYX AGRUPAR 2.png

 

Alguém poderia ajudar? Muito obrigada!!

 

10 RESPOSTAS 10
kendi
Bólide

Oi @saresipi 

 

O que esta acontecendo é que as junções das bases que você está fazendo não é 'perfeita' há chaves que não está presente nas duas bases, por exemplo digamos que você esteja fazendo a junção pelo campo UF na entrada da esquerda (ancora de entrada L da junção) e também pelo campo UF na entrada da direita (ancora de entrada R da junção), porém na entrada da direita não tem a UF 'SC', então as linhas da base da direita não vai ter junçao com a da direita, então essas linhas não estarão na âncora de saída J, pois não tiveram match .

Se você olhar na saída L da junção vai ver que o restante dos registro vai estar lá.

 

O que você pode fazer é incluir uma 'União' e juntar as saídas J e L da Junção, assim sua base estará completa novamente, porém as saídas terão as colunas adicionadas pela Junção vazias. 

 

Anexei  um fluxo com esse exemplo para ficar mais claro.

 

Abraço!

saresipi
Asteroide

Ola @kendi 

 

Obrigada pela ajuda. A maioria das junções que precisava fazer deu certo! Mas tem uma, que inclusive utilizei a macro que me passou, não está dando certo e eu não faço ideia o que houve. A saída J não possui nada, mas quando faço a junção com outras planilhas, funciona tranquilo em ambas as bases. Fiz um teste no excel com PROCV e funcionou, ou seja, as bases possuem dados em comum.

 

alteryx junçao 2.png

 

Sabe me dizer se aparentemente tem algo de errado? Ou se tem alguma particularidade que desconheço?

 

Muito obrigada pela ajuda de sempre!!

kendi
Bólide

oi @saresipi 

 

Nesse caso essa base de CONSUMO FCC não tem nenhum 'match' com a base principal, de uma olhada nas duas entradas. Coloque uma ferramenta Sumarizar em cada dos fios que estão entrando na Junção (fora dos fios principais)  [UF/SIGLA] e [Referencia] e compare manualmente/visualmente o que cada base tem de diferente nesses campos que não está permitindo o match.

 

kendi
Bólide

oi @saresipi 

acabei de ver no seu print que naentrada da esqueda já tem um sumarizar, faça um no da direita e veja quais são as diferenças de grafia, pontuação, formatação da data, lembre que as colunas chaves das duas entradas tem que ser EXATAMENTE iguais.

Reparei que as colunas chaves da Junção estão como [UF/SIGLA] = [UF/Science], é isso mesmo?

saresipi
Asteroide

Oi @kendi , tudo bem?

 

Deu certo com o sumarizar na outra entrada!! Estou estranhando porque poucos dados na saída J, mas acredito que seja incompatibilidade de dados mesmo. Muito obrigada pela ajuda!

 

Aproveitando o tópico, estou tentando criar uma coluna com ID por código, por exemplo, tenho uma base gigante com diversos códigos em diversas datas, gostaria de fazer um ID por código, ou seja, para cada código gostaria de um número identificador para saber quantos códigos tenho na base. Estou tentando com o Multi Row, mas a contagem não está certa, não sei porquê. Sabe alguma outra forma de fazer isso? Ou algo que aparentemente estou fazendo de errado? Na imagem não da pra ver, mas quando muda a instalação a coluna RowID não muda.

 

Imagem12.png

kendi
Bólide

Oi @saresipi 

A sua formula esta certa, mas voce selecionou no 'Agrupar por' o campo 'Estacao' dessa forma a cada nova estacao o contador (ID) volta pro 1. 

Entao deseleciona o campo 'Estacao' no Agrupar por (e eu aconselharia colocar uma ferramenta Sort/Ordenar antes da ferramenta que voce esta usando, e ordenar pelo campo Estacao)

 

Tem um outra forma de fazer tambem  sumarizando o campo Estacao e colocando um Record ID (nao sei como se chama em portugues) depois do Sumarizar e fazer um Join para incluir o ID na base principal.

Estou mandando um exemplo.

saresipi
Asteroide

Oi @kendi ! Tudo bem?

 

Deu certo da forma que você falou, obrigada!! 😁

 

Agora o problema é outro rs Está dando este erro no output, mas não tem nenhum outro arquivo na pasta. Estou salvando em Acess, sabe o que significa esse erro? Será que pode ser falta de memória?

 

SAIDADEDADOS.png

 

Obrigada pela ajuda de sempre!!

nicolascorreiacolombo
13 - Pulsar
13 - Pulsar

Olá @saresipi  tudo bem?

 

Você, só por testar mesmo, pode tentar criar outro output só pra ver se funciona?

 

Ou tenta verificar se não é o driver:

 install Access Database Engine 2010 64bit.

https://knowledge.alteryx.com/index/s/article/Troubleshooting-Microsoft-Access-read-write-issues-158...

 

Nicolas

saresipi
Asteroide

Oi @nicolascorreiacolombo , tudo bem?

 

Acho que é problema no meu Access mesmo, salvei em csv e deu certo! 

 

Obrigada! 😁

Rótulos