In case you missed the announcement: Alteryx One is here, and so is the Spring Release! Learn more about these new and exciting releases here!

Fórum

Identificar registros duplicados

thiagoangelis
Meteoro

Pessoal,

 

no meu fluxo eu preciso identificar usuários que possuem cep, nome da rua e número duplicados e que o CPF seja diferente. Alguma sugestão de como eu realizar essa análise?

 

Obrigado

10 RESPOSTAS 10
carlosteixeira
15 - Aurora
15 - Aurora
thiagoangelis
Meteoro

Oi Carlos,

 

Obrigado pelo retorno.

 

A única alternativa que eu utilizei até o momento foi a ferramenta Unique e ele trouxe falsos positivos quando eu selecionei os três campos.

carlosteixeira
15 - Aurora
15 - Aurora

Pode compartilhar alguns dados de exemplo com a gente?

Assim podemos ajudar melhor

 

Abraços

Carlos A Teixeira
thiagoangelis
Meteoro

Oi Carlos, bom dia! tudo bem?

 

Eu utilizei a ferramenta unique selecionando os campos cpf, cep, nome da rua e número e em nenhum dos dois resultados eu tive duplicidade que eu espero.

marcusblackhill
12 - Quasar
12 - Quasar

Oi @thiagoangelis !

 

Me desculpa a demora em responder, não sei se já resolveu o problema. Mas chegou a tentar colocar no summarize nessa ordem: CEP -> Nome da Rua -> Número, todos por group by e depois deles, o CPF por count distinct?

 

Assim vc vai identificar quantos CPF diferentes vc tem pra cada endereço, se tiver só 1 em todos é por não ter duplicados nessa sua base.

 

Espero que isso ajude!

FláviaB
Alteryx Community Team
Alteryx Community Team

Oi, @thiagoangelis. Nos avise se conseguiu resolver a sua questão ou se ainda precisa de alguma ajuda. 

Flávia Brancato
marcusblackhill
12 - Quasar
12 - Quasar

Oi @thiagoangelis ! Tudo bem?

 

Se a Unique que o @carlosteixeira ainda não chegou no que precisa, o que também seria minha primeira indicação, tenta usar a summarize, coloca os campos CEP, nome da rua, número  e o CPF por Group by.

 

Espero que ajude!

carlosteixeira
15 - Aurora
15 - Aurora

@thiagoangelis usando a idéia do @marcusblackhill 

Ainda incluiria um count no CPF para saber quantos vc tem duplicados

 

Ficaria assim:

 

carlosteixeira2005_0-1612443223069.png

 

Carlos A Teixeira
thiagoangelis
Meteoro

Carlos e Marcus, obrigado pelas informações.Farei o que o sum e informo vocês. é que eu preciso de todas as outras informações.

 

Agradeço novamente a ajuda.

 

 

Rótulos
Autores com maior número de soluções