Base de conhecimento

Embora a ferramenta Junção seja uma das ferramentas mais usadas no Alteryx, ela também é uma das mais mal compreendidas. Isso é ainda mais verdadeiro se um usuário novo nunca tiver usado junções em qualquer outra plataforma de manipulação de dados ou se estiver unindo grandes tabelas e não estiver monitorando os registros dentro dos campos que estão sendo unidos.   Assim, vou passar por três diferentes casos que você pode encontrar de junção de duas tabelas por um campo em comum e o que esperar em seus resultados. O fluxo de trabalho que vou analisar (anexado neste artigo) é um fluxo de trabalho que criei na versão 10.5 e contém os mesmos elementos visuais ilustrados abaixo.   Caso nº 1: junção por campos em que ambos possuem registros exclusivos   Esse é o caso mais simples e mais fácil de entender. Nesse caso, estamos fazendo a junção pelos campos chamados “Fruit” nas duas entradas. A junção alinhará os registros das tabelas se os registros nos campos “Fruit” corresponderem.   Portanto, a tabela "unida" esperada (saída J) deve ficar assim:   Bastante simples   Caso nº 2: junção por campos em que apenas um possui registros exclusivos   Para esse caso, temos dois registros para "Banana" em nossa entrada à esquerda. Isso significa que o registro com “Banana” na entrada à direita fará correspondência duas vezes e será anexado aos dois registros da entrada à esquerda. Nossa saída deve ficar assim:     Caso nº 3: junção em campos em que ambos possuem registros não exclusivos Esse caso pode ser o mais difícil de entender, mas esperamos que após analisá-lo visualmente e matematicamente, você entenderá porque isso faz sentido e o que você pode fazer para evitar registros indesejados.   Nesse caso, temos dois registros em “Fruit” e ambos contêm “Banana” nas duas tabelas. Aqui acontece o mesmo que no caso acima, exceto que agora acontece duas vezes porque temos dois registros da entrada à direita que fazem correspondência com dois registros da entrada à esquerda. Então, nossa saída terá um total de 4 registros contendo a palavra "Banana".  A saída deve ficar assim:     Analisando matematicamente o Caso nº 3 e o Caso nº 2, você pode entender quantos registros obterá para cada instância de registro multiplicando a quantidade de registros que aparecem nas duas tabelas. No exemplo acima, já que estamos fazendo a junção em “Fruit” e vemos o registro Banana duas vezes nas duas tabelas, você pode pensar em 2 bananas x 2 bananas = 4 bananas.   Se adicionarmos outra linha na nossa entrada à direita, da seguinte forma:   Temos agora 3 x 2, então devemos esperar 6 combinações de registros com “Banana” no campo “Fruit”         Se você fez a junção de duas tabelas e obteve mais registros do que esperava, essa é causa mais provável do problema. Se alguém não entender os casos apresentados acima, isso poderia constranger qualquer banana (trocadilho intencional). Como práticas recomendadas, eu seguiria estes dois passos antes de unir quaisquer tabelas:   1 º : verifique se há registros duplicados nas suas tabelas. Para o caso acima, como temos três duplicatas na nossa entrada à direita, podemos utilizar a ferramenta Exclusivo e nos livrar delas. A saída será exatamente a mesma do Caso nº 2, já que existirá apenas um registro de “Banana” após a ferramenta Exclusivo.   2 º : verifique se fazer a junção por múltiplos campos é a opção mais apropriada. Exemplo: temos a Tabela 1 com dois registros contendo "Banana" em "Fruit" e dois registros contendo "X" em "Store ID", além do "FruitID" que é um identificador para cada fruta em "Fruit".  A Tabela 2 tem os mesmos campos “Fruit” e “Store ID”, mas agora temos um campo “Store employees” associado ao “Store ID”.                                                                     Tabela 1 Tabela 2   Queremos todos esses dados juntos para que tudo fique bem associado.  De forma ideal, deveríamos ter somente quatro registros saindo da nossa junção ao colocar os campos de funcionários da loja (Store employees) e ID da fruta (FruitID) em uma tabela. No entanto, se fizéssemos a junção usando apenas um campo em comum, seja ele "Store ID" ou "Fruit", obteríamos combinações e os dados não seriam alinhados corretamente. Veja abaixo.   Junção em “Fruit”   Nesse caso, obtemos dois registros em que nossos IDs de loja (StoreID) não correspondem.   Junção em “StoreID”   Nesse caso, obtemos dois registros em que nossas frutas (Fruit) não correspondem. Para corrigir isso, configuraremos nossa junção para fazer correspondência em ambos os campos Fruit e StoreID.     Após executar, a tabela "unida" deve ficar assim:   Ao fazer a junção usando múltiplos campos, garantimos que os registros de ambos os campos façam correspondência antes da junção. Uma maneira fácil de entender isso é imaginar que "Fruit" e "StoreID" estão sendo combinados. Agora, de repente, temos registros únicos porque temos Banana X e Banana Y como duas entidades exclusivas e nossa junção se torna uma junção de 1 registro x 1 registro.      
Ver artigo completo
Uma das principais razões pelas quais as pessoas adoram o Alteryx é que ele pode ler um número enorme de diferentes fontes de dados.  Uma limitação é que não é possível ler um documento do Word ou PDF sem uma pequena ajuda de outra fonte.  Por que alguém desejaria fazer isso? Bem, um excelente exemplo seria analisar uma pasta cheia de currículos para pesquisar por um texto específico.  Por que o Alteryx não consegue lê-los de maneira nativa? Esses tipos de arquivo não são formatos de dados padrão, portanto, para lê-los, é preciso primeiro convertê-los em um arquivo de texto sem formatação.  Para a conversão, existe um programa gratuito de código aberto chamado DocToText. Esse programa pode ser executado na linha de comando para converter esses tipos de arquivo em texto sem formatação, os quais o Alteryx pode ler sem problemas. Eu anexei um exemplo a esta postagem.  Esse fluxo de trabalho utiliza uma ferramenta frequentemente subutilizada, a ferramenta Executar comando.  Com a ajuda dessa ferramenta, podemos ler uma lista de arquivos de uma pasta específica, processar as informações em algo que o DocToText possa usar e, em seguida, utilizar a ferramenta Executar comando para converter todos os arquivos para texto sem formatação para utilização posterior.  Incluí no anexo tudo o que você vai precisar (incluindo uma estrutura de pasta que funciona bem com o módulo).  Baixe e extraia o arquivo yxzp anexado, confira o módulo e conte-nos o que você acha! Este exemplo foi atualizado para a versão 10.0. Você observará que o pacote gerará alguns erros de dependência ao extraí-lo. Sem problemas, não haverá erro na execução. Um agradecimento especial a Maureen Wolfson pelo aplicativo base e sugestão! Até a próxima! ~ Chad Siga-me no Twitter! @AlteryxChad
Ver artigo completo
O VLOOKUP é uma das funções mais utilizadas do Excel.  O VLOOKUP pega um valor de pesquisa e encontra esse valor na primeira coluna de um intervalo de pesquisa.  A sintaxe da função é completada especificando o número de coluna para retornar do intervalo.  Em outras palavras, o VLOOKUP é uma junção.  Uma coluna de dados é unida a um intervalo especificado para retornar um conjunto de valores desse intervalo.     Esta postagem tem dois objetivos: 1. Demonstrar como um VLOOKUP pode ser feito utilizando o Alteryx. 2. Demonstrar como fazer um VLOOKUP pode ser ainda mais fácil no Alteryx.    Para fins de argumentação, vamos supor que temos duas planilhas em um arquivo do Excel.  A planilha 1 contém uma lista mestra de dados de vendas.  Os dados são estes:       A planilha 2 contém uma lista selecionada de vendedores com nomes e sobrenomes:     Usando uma função VLOOKUP, queremos pegar a lista de vendedores, fazer a correspondência com os vendedores encontrados na planilha 1 e retornar os dados de vendas para cada vendedor.  Observe que nossa lista de vendedores da planilha 2 tem duas vendedoras chamadas "Angelina".  A planilha 1 tem várias pessoas chamadas "Angelina" e "Michael".  Usar somente o nome não retornará resultados confiáveis com o VLOOKUP.  Além disso, fazer a correspondência no sobrenome - ou até mesmo em uma concatenação de nome e sobrenome - tampouco é sempre confiável.  Existem muitos "Michael Thomas" no mundo e podem existir vários em seu intervalo de dados.  A melhor maneira de completar o nosso VLOOKUP é usar um identificador único para cada vendedor.  Mas, novamente, apenas para fins de argumentação, vamos supor que cada combinação de nome e sobrenome produza um nome/identificador único.    A primeira coisa que precisamos fazer é concatenar nome e sobrenome em um novo campo.     Faremos o mesmo com nossos dados na planilha 2.  Para que VLOOKUPs funcionem corretamente, os dados devem ser ordenados.  No nosso caso, ordenaremos a planilha 1 e a planilha 2 em ordem crescente de "Nome concatenado":     Agora estamos prontos para utilizar nossa função =VLOOKUP:     Funcionou! Vejamos como fazer a mesma coisa no Alteryx.  (Dica: existe mais de uma maneira de fazer isso).   Começaremos importando nossos dados das planilhas 1 e 2:       Assim como no exemplo do Excel, concatenaremos nome e sobrenome em um novo campo.  Para efeitos de clareza, vamos chamar o nome concatenado da planilha 1 de "Nome completo" e da planilha 2 de "Novo nome".  Faremos isso utilizando uma expressão da ferramenta Fórmula:         Por fim, vamos anexar uma ferramenta Encontrar e substituir, onde a planilha 2 é anexada à entrada "F" e a planilha 1 é anexada à "R".       A configuração para a ferramenta Encontrar e substituir fica assim:     Observe que "Sales" (vendas) é selecionado em "Agrupar campo(s) ao registro".  Ao executar o fluxo de trabalho, obtemos os dados de vendas por cada vendedor, exatamente como fizemos no Excel:      Mas existe uma maneira ainda mais simples de fazer um VLOOKUP no Alteryx! Basta unir as duas planilhas com uma ferramenta Junção.       Veja como a ferramenta Junção é configurada:     Unimos nossos dados por Nome e Sobrenome sem ter que concatenar os dois campos primeiro.  Além disso, selecionamos os dados de vendas que desejamos retornar na mesma ferramenta Junção.       O Alteryx tem uma vantagem sobre a função VLOOKUP do Excel.  Vamos supor que você deseja retornar Vendas e Oportunidades.  Com o Alteryx, isso pode ser feito com uma única Junção.  Com o Excel, precisaríamos fazer vários VLOOKUPs.
Ver artigo completo
Rótulos