Free Trial

Fórum

SOLUCIONADO

Problema com Join Tool

marcusblackhill
12 - Quasar
12 - Quasar

Amigos do fórum,

Estou com o seguinte problema utilizando a ferramenta Join Tool que tentarei explicar abaixo:

1. o Left input tem 1207 registros
2. o Right input tem 1194 registros
3. Entendo que, em teoria, Left input = (Left output + Join output) = 1207 registros
4. Entendo que, em teoria, Right input = (Right output + Join output) = 1194 registros

Porém, o que encontro como outputs, é:

1. (Left output + Join output) = 1270 registros
2. (Right output + Join output) = 1213 registros
Annotation.png

Sendo assim, tendo 63 registros a mais que o left input e 19 registros a mais que o right input. O join utiliza apenas um campo de referência, mas acredito que independente de chaves utilizadas, os totais deveriam sempre ser iguais.

Já viram esse tipo de situação? Eu que estaria equivocado em algo ou de fato parece ter algum tipo de bug ocorrendo?

 

 

 

4 RESPOSTAS 4
echuong1
Alteryx Alumni (Retired)

Sim, está correto. Você pode ter valores duplicados.

 

Check with a unique tool on the fields you are using in the join. If there are duplicates, you will need to de-duplicate to avoid Cartesian joins.

fmvizcaino
17 - Castor
17 - Castor

Oi @marcusblackhill ,

 

Isso é esperado no join quando as chaves que você está utilizando não são únicas.

Veja o exemplo em anexo.

 

Convido-o também a fazer parte do grupo de usuários brasileiros, lá as respostas em português serão mais facilmente identificadas pelos usuários.

https://community.alteryx.com/t5/Sao-Paulo-BR/gp-p/brazil

 

Abs,

Fernando Vizcaino

carlosteixeira
15 - Aurora
15 - Aurora

Fala meu amigo @marcusblackhill tudo bem?

 

O que deve acontece é o seguinte:

 

Na saída LEFT você só tem o que não existe join entre as entradas L e R

Na saída RIGHT você só tem o que não existe JOIN entre as entradas R e L

Na saída JOIN você só terá os dados que terão JOIN entre as entradas R e L

 

Portanto quando você soma as saídas LEFT + JOIN, ou RIGHT + JOIN a soma deles sempre deverão iguais ou menores que as entradas.

 

Quando elas são maiores o que está acontecendo é que você está tendo o que chamamos de cartesiano.

 

Provavelmente vc tem chaves duplicadas em um dos lados, ou nos dois lados (L e R)

 

Assim eles vão acabar achando mais registros entre eles do que deveriam, pois estão duplicando as informações nas saídas.

 

Espero ter ajudado.

Carlos A Teixeira
FláviaB
Alteryx Community Team
Alteryx Community Team

Obrigada pela ajuda @carlosteixeira.

@marcusmontenegro Parece que você conseguiu resolver o problema. Nos avise se tiver mais alguma dúvida! 😉 

Flávia Brancato
Rótulos