Amigos do fórum,
Estou com o seguinte problema utilizando a ferramenta Join Tool que tentarei explicar abaixo:
1. o Left input tem 1207 registros
2. o Right input tem 1194 registros
3. Entendo que, em teoria, Left input = (Left output + Join output) = 1207 registros
4. Entendo que, em teoria, Right input = (Right output + Join output) = 1194 registros
Porém, o que encontro como outputs, é:
1. (Left output + Join output) = 1270 registros
2. (Right output + Join output) = 1213 registros
Sendo assim, tendo 63 registros a mais que o left input e 19 registros a mais que o right input. O join utiliza apenas um campo de referência, mas acredito que independente de chaves utilizadas, os totais deveriam sempre ser iguais.
Já viram esse tipo de situação? Eu que estaria equivocado em algo ou de fato parece ter algum tipo de bug ocorrendo?
Solucionado! Ir para Solução.
Sim, está correto. Você pode ter valores duplicados.
Check with a unique tool on the fields you are using in the join. If there are duplicates, you will need to de-duplicate to avoid Cartesian joins.
Oi @marcusblackhill ,
Isso é esperado no join quando as chaves que você está utilizando não são únicas.
Veja o exemplo em anexo.
Convido-o também a fazer parte do grupo de usuários brasileiros, lá as respostas em português serão mais facilmente identificadas pelos usuários.
https://community.alteryx.com/t5/Sao-Paulo-BR/gp-p/brazil
Abs,
Fernando Vizcaino
Fala meu amigo @marcusblackhill tudo bem?
O que deve acontece é o seguinte:
Na saída LEFT você só tem o que não existe join entre as entradas L e R
Na saída RIGHT você só tem o que não existe JOIN entre as entradas R e L
Na saída JOIN você só terá os dados que terão JOIN entre as entradas R e L
Portanto quando você soma as saídas LEFT + JOIN, ou RIGHT + JOIN a soma deles sempre deverão iguais ou menores que as entradas.
Quando elas são maiores o que está acontecendo é que você está tendo o que chamamos de cartesiano.
Provavelmente vc tem chaves duplicadas em um dos lados, ou nos dois lados (L e R)
Assim eles vão acabar achando mais registros entre eles do que deveriam, pois estão duplicando as informações nas saídas.
Espero ter ajudado.
Obrigada pela ajuda @carlosteixeira.
@marcusmontenegro Parece que você conseguiu resolver o problema. Nos avise se tiver mais alguma dúvida! 😉