Neste caso temos uma de transações comerciais realizadas por diferentes empresas do grupo. Podemos observar que muitos campos “Company” possuem entradas parecidas, podendo ser inferido que são o mesmo campo com formas de digitar diferentes. Queremos padronizar os campos para que essas entradas de digitação diferentes sejam padronizadas.
Primeiro, conectamos a base em uma ferramenta “Fuzy Match”, utilizamos o “Purge Mode” e configuramos conforme a imagem abaixo:
Obs: Dependendo da base, o campo de “Threshold” deverá ser utilizado para testes para que o algoritmo consiga encontrar mais campos com digitação parecida
Podemos encontrar o seguinte resultado:
Conectamos a saída dessa ferramenta em um fluxo com as configurações mostradas abaixo:
A tabela de resultado desse fluxo, deverá ser usado na entrada “R” de uma ferramenta “Find and Replace” junto com a base inicial na entrada “F” para padronização do resultado final.
Pronto! Agora você já sabe como utilizar a ferramenta “Fuzzy Match” para encontrar campos com inputs parecidos e substituí-los por um campo em comum.
Abs,
VS
Você deve ser um usuário registrado para adicionar um comentário aqui. Se você já estiver registrado, faça logon. Se você ainda não estiver registrado, registre-se e faça logon.