Free Trial

Base de conhecimento

Este artigo faz parte da série Domínio de Ferramentas, uma compilação de contribuições da Base de Conhecimento para apresentar diversos exemplos para as ferramentas do Designer. Vamos nos aprofundar nos usos da ferramenta Fórmula de Múltiplas Linhas como parte da nossa jornada para dominar o Alteryx Designer:   A ferramenta Fórmula de Múltiplas Linhas funciona de maneira muito semelhante à ferramenta Fórmula normal, mas inclui a capacidade de fazer referência a várias linhas de dados em uma única expressão. Digamos, por exemplo, que alguém estivesse no andar térreo de uma casa e tivesse uma ferramenta Fórmula. Essa pessoa só poderia conversar com outras pessoas que também estivessem no térreo. Se ela tivesse uma ferramenta Fórmula de Múltiplas Linhas, também seria capaz de conversar com as pessoas no andar de cima, no sótão e no porão.       A ferramenta Fórmula de Múltiplas Linhas permite que o usuário atualize um campo existente ou crie um novo. Ambas as opções podem ser muito úteis e há muitos casos de uso para cada uma. Os casos de uso descritos abaixo estão anexados no fluxo de trabalho Fórmula de Múltiplas Linhas.yxmd (salvo na versão 2019.1).     Atualizar campo existente   "Preencher" um campo: Muitas vezes, os dados podem ser organizados de maneira a ficar com uma aparência agradável no Excel, mas que não é realista para se trabalhar no Alteryx. Nesses casos, a melhor opção é "preencher" as colunas que têm valores ausentes.        No caso acima, apenas a primeira pessoa de cada família tem seu sobrenome preenchido. Portanto, gostaríamos de modificar o campo "Família" onde ele apresenta [Null]. Isso pode ser realizado com facilidade da seguinte maneira:   Para trazer variáveis e funções de forma fácil para a caixa de expressão, basta clicar duas vezes sobre elas dentro da guia correspondente na janela de configuração.   Criar novo campo: Criar um identificador exclusivo para cada pessoa no grupo: Agora que os dados estão limpos, queremos adicionar um ID exclusivo para cada pessoa de acordo com a família a que pertence. Para isso, vamos configurar a ferramenta Fórmula de Múltiplas Linhas da seguinte maneira:   Ao criar um novo campo, você pode selecionar de que tipo será. Aqui, Int16 foi escolhido. Observe que estamos agrupando por "Família", pois queremos que o ID seja exclusivo para cada sobrenome, mas ele pode começar de novo para sobrenomes diferentes. Esse novo campo "ID" pode ser utilizado mais tarde como um identificador em ferramentas como Filtrar, Sumarizar e outras.   Fazer cálculos: O que seria de uma ferramenta de múltiplas linhas sem a capacidade de fazer referência a mais do que apenas as linhas diretamente antes ou depois dela? Ao alterar o valor em "Número de linhas", na janela de configuração, é possível aumentar o número de linhas que você pode utilizar em suas expressões.   Neste exemplo, aumentamos o número de linhas para 2. Observe como agora há mais variáveis para selecionar na seção central da janela de configuração. Porque queremos o total acumulado por sobrenome, agrupamos novamente pelo campo "Família".   Esse método pode ser estendido para gerar totais acumulados em vários cenários diferentes, incluindo vendas, contagens de itens e muito mais.    Agora, queremos calcular o valor médio do tempo total de tela por família. Nesta caixa de expressão da ferramenta Fórmula de Múltiplas Linhas, usando a função "average" para calcular a média, escrevemos:    iif([ID]=3,average([Row-2:Tempo total de tela],[Row-1:Tempo total de tela],[Tempo total de tela]),iif([ID]=2,average([Row-1:Tempo total de tela],[Tempo total de tela],[Row+1:Tempo total de tela]),average([Row+2:Tempo total de tela],[Row+1:Tempo total de tela],[Tempo total de tela])))   Isso verifica o valor de ID de cada linha e personaliza a fórmula para gerar uma média utilizando as linhas corretas.    Verificar a diferença em relação ao anterior: Uma configuração para essa ferramenta de que ainda não tratamos é o menu suspenso "Valores para linhas que não existem". Isso indica ao Alteryx o que utilizar quando uma fórmula precisar do valor de uma linha que não existe (daí o nome do menu suspenso). Isso aconteceria, por exemplo, ao calcular um valor para a primeira linha de dados quando a expressão contém uma variável Linha -1 ([Row-1]), ou seja, uma variável que referencia uma linha anterior à primeira linha. O usuário pode escolher o valor dessa linha inexistente.   Neste exemplo, a linha que não existe é definida para a linha válida mais próxima. Dessa forma, quando a fórmula tenta utilizar [Row-1:Tempo total de tela] na linha 1 e percebe que a linha "-1" não existe, a fórmula usa o valor da própria linha 1. Isso resulta na diferença de 0 que você vê na saída (figura mais abaixo).     Uma ferramenta Ordenar foi colocada antes dessa ferramenta Fórmula de Múltiplas Linhas para classificar o tempo total de tela em ordem decrescente. A fórmula acima criou um campo que é a diferença entre o tempo total de tela da linha atual e o tempo total de tela da linha anterior. Isso facilita a visualização de quanto tempo de tela a mais cada pessoa precisa para alcançar a pessoa à sua frente.   Muitas vezes a ferramenta Fórmula de Múltiplas Linhas é utilizada em combinação com a ferramenta Tabela de Referência Cruzada (aprenda mais sobre ela neste artigo do Domínio de Ferramentas). Isso é particularmente útil se você estiver tentando transformar algumas colunas de dados em uma tabela. Um membro da Comunidade Alteryx teve exatamente esse problema e conseguiu resolvê-lo nesta postagem.   A ferramenta Fórmula de Múltiplas Linhas só pode atualizar um campo por instância de ferramenta. Se você deseja atualizar vários campos (e se sentir confortável usando a ferramenta Fórmula de Múltiplas Linhas e a ferramenta Fórmula de Múltiplos Campos), experimente esta macro que foi postada no Alteryx Gallery público.   Para aprender mais sobre as ferramentas citadas neste artigo, assista às lições interativas da nossa Comunidade: Filtrar dados, Sumarizar dados, Ordenar dados e Mudar o layout dos dados.   A esta altura, você já deve ter a proficiência de um expert na ferramenta Fórmula de Múltiplas Linhas! Agora, se você já é um especialista em outras ferramentas do Designer, contribua para o Blog da Comunidade compartilhando suas experiências e nos contando como e para que você usa as nossas ferramentas no seu dia a dia. Se tiver interesse em contribuir com um Blog, envie um email para flavia.brancato@alteryx.com para ter acesso à seção.   Toda segunda-feira vamos trazer uma ferramenta nova para a nossa seleção. Com isso, adoraríamos saber qual é a sua favorita ou qual ferramenta você gostaria de ver aqui na Comunidade na próxima semana. Não esqueça de se inscrever no painel da Base de Conhecimento para ser notificado das novidades!   *Este texto é uma adaptação do artigo original escrito por @Kenda na Comunidade em inglês  
Ver artigo completo
Este artigo faz parte da série Domínio de Ferramentas, uma compilação de contribuições da Base de Conhecimento para apresentar diversos exemplos para as ferramentas do Designer. Vamos nos aprofundar nos usos da ferramenta Tabela de Referência Cruzada como parte da nossa jornada para dominar o Alteryx Designer:   Às vezes você olha para a quantidade enorme de dados à sua frente e se pergunta como poderá organizá-los. Todas as opções parecem exigir uma grande quantidade de trabalho manual e, sendo o profissional em combinação de dados que você é, isso é algo que você não precisa tolerar!   Situações como essa requerem mudanças drásticas. Não existe nada melhor para isso do que a Tabela de Referência Cruzada, uma ferramenta poderosa que possibilita remodelar os seus dados do jeito que você quiser, permitindo abordar o seu problema de um novo ângulo. Neste artigo, vou apresentar alguns casos de uso para mostrar como você pode aproveitar essa ferramenta incrível. Você pode aprender mais sobre as configurações básicas na aula interativa Mudar o layout dos dados. Se quiser acompanhar de perto os fluxos de trabalho mostrados abaixo, abra o arquivo Casos de Uso 19.2.yxzp em anexo.   Caso de uso 1: Facilitar a extração de dados dinâmicos por meio da atribuição de grupos   Os dados? Você recebe uma lista que se parece com o campo "Field_1" abaixo. O PMID é o número identificador (ID) de um artigo médico em um banco de dados. Cada FAU se refere a um autor no artigo. Um artigo pode ter qualquer número de autores.       O objetivo? Uma tabela com números de ID no primeiro campo e colunas correspondentes para autores.       Como? Prepare os dados filtrando e separando o identificador. A terceira coluna acima, "Field_12", mostra os dados utilizáveis. Use uma Fórmula de Múltiplas Linhas para identificar a coluna de ID e as colunas de autor exclusivamente. Nesse caso, cada número de ID é representado por "0" e os autores são contados de zero até que se atinja outro ID. Veja a coluna "Headers" (cabeçalhos). Use outra Fórmula de múltiplas linhas para associar cada grupo de cabeçalhos entre si. Estamos criando basicamente um ID de registro - cada ID de registro identifica um único artigo na base de dados. Veja a coluna "Groups" acima. Tabela de Referência Cruzada! Ao utilizar essas colunas de identificação, você pode girar os seus dados de maneira que cada um dos cabeçalhos crie uma coluna e cada um dos grupos crie uma linha. Veja a janela de configuração na primeira imagem acima.   Caso de uso 2: Realizar cálculos dinamicamente para qualquer quantidade de campos   Os dados? Um punhado de campos numéricos, ilustrados abaixo. Eles são agrupados por categoria (campo "Category") e você adicionou um identificador exclusivo para cada registro (campo "RecordID").       O objetivo? Médias móveis para cada coluna dentro de sua respectiva categoria.       Como? Em vez de gerar uma Fórmula de Múltiplas Linhas para cada coluna, utilize a ferramenta Transpor para passar tudo para uma única coluna. Na seção Colunas-chave, marque “RecordID” e “Category.” Veja a janela de configuração na primeira imagem. O resultado é a saída abaixo. Embora trabalhar com esses dados possa parecer ainda mais difícil agora, isso permite que você calcule a média móvel de uma só vez. Utilize a ferramenta Fórmula de Múltiplas Linhas para calcular uma média. Você pode facilmente evitar selecionar os valores errados utilizando a opção Agrupar por - marque “Category” e “Name”. Defina também a opção Valores para linhas que não existem para a linha válida mais próxima.   Reestruture os dados utilizando a Tabela de Referência Cruzada! (Agrupe por “RecordID”, selecione o campo “Name” para os cabeçalhos e o campo “r3” para os valores.)    Caso de uso 3: Simplificar uma lógica complicada com as metodologias da Tabela de Referência Cruzada   Os dados? Você tem uma lista de todas as combinações possíveis de 5 itens. Para cada combinação, um número de linhas correspondente ao número de itens traz o peso e o valor de cada item - isto é, a combinação 123 está representada três vezes, com informações para o item1, item2 e item3.   O objetivo? Você deseja otimizar a sua seleção de itens para atender a determinados critérios, como peso mínimo e valor máximo.   Como? Utilize uma ferramenta Fórmula para adicionar uma coluna para o peso, conforme mostrado na primeira imagem (coluna "Weight"). Utilize a Tabela de Referência Cruzada com o método "Soma" para encontrar o peso combinado de todos os itens em cada combinação. Usar a coluna "Weight" como cabeçalho agrega todos os valores de "kg" e selecionar a coluna "Combinations" para agrupar os dados cria uma linha para cada combinação. Repita o mesmo procedimento para encontrar os valores ("Value"). Dica de expert: Renomear campos   Uma desvantagem da ferramenta Tabela de Referência Cruzada é que ela não funciona bem com caracteres especiais em cabeçalhos, incluindo espaços. Isso significa que se você tiver um cabeçalho "a a", ele será exibido como "a_a". Sei que isso pode ser um pouco inconveniente, mas quando estávamos desenvolvendo o mecanismo do Alteryx, demos prioridade para a velocidade e eficiência em detrimento da boa aparência dos cabeçalhos. Mas não se preocupe, há uma solução totalmente viável para esse problema (mais de uma, na verdade!), que utiliza uma ferramenta fantástica chamada Renomeação Dinâmica. Geralmente, prefiro fazer isso desta forma (abra o arquivo Dica Renomeação 19.2.yxmd em anexo para ver como isso funciona na prática):       A esta altura, você já deve ter a proficiência de um expert na ferramenta Tabela de Referência Cruzada! Agora, se você já é um especialista em outras ferramentas do Designer, contribua para o Blog da Comunidade compartilhando suas experiências e nos contando como e para que você usa as nossas ferramentas no seu dia a dia. Se tiver interesse em contribuir com um Blog, envie um email para flavia.brancato@alteryx.com para ter acesso à seção.   Toda segunda-feira vamos trazer uma ferramenta nova para a nossa seleção. Com isso, adoraríamos saber qual é a sua favorita ou qual ferramenta você gostaria de ver aqui na Comunidade na próxima semana. Não esqueça de se inscrever no painel da Base de Conhecimento para ser notificado das novidades! *Este texto é uma adaptação do artigo original escrito por @AlexKo na Comunidade em inglês
Ver artigo completo
Um grande componente da combinação de dados é a aplicação de processos matemáticos ou transformacionais a subconjuntos de dados.  Geralmente, isso exige isolar os dados que estão em conformidade com determinados critérios que você definiu:   "Só quero sinalizar as SKUs para produtos cujo custo for inferior a 10 dólares" “Clientes com idade entre 25-40 anos devem ser classificados como Grupo A, 41-65 anos como Grupo B e de mais de 66 anos como Grupo C” "Categorize transações como dia útil ou fim de semana" "Se um produto for Vermelho, renomeie para R (Red). Se for Azul, renomeie para B (Blue). Se for amarelo, para Y (Yellow). Se for Verde, para G (Green). Caso contrário, renomeie para Outro (Other)" Alguma dessas situações lhe parece familiar? Se for assim, um bom ponto de partida para começar a transformar seus dados é com as funções condicionais da ferramenta Fórmula (Figura 1).  As funções condicionais criam expressões que permitem aplicar processos aos dados que satisfizerem as condições definidas por você.     Não importa se você vem do mundo do SQL, Excel, R ou outro programa de dados que esteja tornando sua vida mais difícil do que deveria ser, o conceito de Expressão condicional permanece o mesmo: se uma condição é ou não verdadeira, então aplique um processo ou resultado.  Caso contrário, aplique um processo ou resultado diferente.  Essa lógica pode ter o formato de um entre quatro tipos diferentes de expressões:   1) Uma instrução IF tradicional pode ser uma ferramenta poderosa para a transformação de dados. Estruturalmente, o Alteryx exige quatro cláusulas distintas para aplicar esse tipo de lógica aos dados:   IF uma condição (não) for verdadeira THEN aplique a Função A ELSE aplique a Função B ENDIF   Ou seja, SE uma condição for (ou não for) verdadeira, ENTÃO aplique uma função, SENÃO aplique uma outra função, FIM DA INSTRUÇÃO. Usando a primeira situação (SKUs e Preços) como exemplo, a instrução IF nos permite determinar quais produtos serão sinalizados para análise posterior:         2) Uma instrução IF aninhada permite que múltiplas condições sejam definidas, essencialmente formando uma cadeia de instruções lógicas, ou seja, usando instruções lógicas repetidas semelhantes em uma única instrução IF. Embora a documentação forneça um exemplo com três condições definidas, isso não representa, de forma alguma, um limite no número de critérios que podem ser definidos.  Contanto que a sintaxe correta seja utilizada, muitas outras condições podem ser definidas!   Considere a segunda situação (grupos de clientes por idade).  Ao continuar com a sintaxe correta, quatro grupos (A, B, C e Outros) são criados como resultado da instrução aninhada.  Ao trabalhar com instruções aninhadas, pode ser útil dividir cada cláusula em uma nova linha na Caixa de expressão, como mostra o exemplo abaixo.     3) Embora as instruções IF em linha (IIF) empreguem uma lógica semelhante às instruções IF, avaliando uma condição como "verdadeira" ou "falsa", elas diferem sintaticamente. As expressões IIF exigem três componentes, cada um separado por uma vírgula: uma expressão booleana para avaliar, o resultado “Verdadeiro” e o resultado “Falso”.  Os resultados Verdadeiro e Falso têm suporte não apenas para texto, mas também para operações matemáticas.  No caso da terceira situação, em que um registro só pode ser classificado como um de dois tipos (Dia útil ou Fim de semana), uma declaração IIF categoriza efetivamente os dados conforme uma lógica de teste que analisa se o valor da coluna dos dias [Day] não é sábado (Sat) ou domingo (Sun).  O resultado Verdadeiro dessa instrução retorna "Weekday" (dia útil); o resultado Falso, "Weekend" (fim de semana).          4) A função Switch da ferramenta Fórmula é excepcional! Ela é parte ferramenta Localizar e substituir, parte IF aninhada, parte instrução CASE do SQL... é super útil! Essa expressão avalia múltiplas condições para atribuir um resultado designado.  Se nenhuma condição for atendida, será definido um valor padrão (Value).  A função Switch oferece algumas vantagens sobre funcionalidades semelhantes no Alteryx.  Primeiro, ela garante grande parte da flexibilidade de uma instrução IF aninhada sem a necessidade repetir IFs, THENs, ELSEIFs... etc.     Segundo, ela pode cumprir uma função semelhante à da ferramenta Encontrar e substituir sem ter que criar uma segunda instância de todos os dados que você deseja localizar e os dados correspondentes usados para substituí-los.  Um método mais rápido e com menos chance para erros de digitação? Tô dentro!       Observação: os tipos de operadores que podem ser usados em uma expressão dependem do tipo de dados do campo de saída.  Se a saída for uma cadeia de caracteres (String ou outro tipo de texto), o resultado exige aspas (simples ou dupla) ao redor.  Observe como cada um dos nomes dos grupos 'A', 'B' ou 'C', por exemplo, está envolvido por aspas simples dentro da Caixa de expressão.  Campos numéricos, por outro lado, não exigem que o resultado seja escrito entre aspas.        *O fluxo de trabalho em anexo é compatível com o Alteryx Designer v10.0 e superior.      #
Ver artigo completo
Pergunta Como removo os espaços em branco dos meus dados? Socorro! Resposta Existem algumas situações diferentes envolvendo espaços em branco, mas o esquema abaixo (da amostra da v10.6 em anexo, Remove Whitespace.yxmd) inclui todas elas:   A maioria das abordagens utiliza a função trim() da ferramenta Fórmula, que, sem um segundo argumento, tem como padrão cortar espaços em branco de sequências de caracteres. A partir da versão v10.5 do Designer também é possível utilizar a ferramenta Limpeza de dados para limpar seus campos! Aprenda aqui.
Ver artigo completo
Embora a ferramenta Junção seja uma das ferramentas mais usadas no Alteryx, ela também é uma das mais mal compreendidas. Isso é ainda mais verdadeiro se um usuário novo nunca tiver usado junções em qualquer outra plataforma de manipulação de dados ou se estiver unindo grandes tabelas e não estiver monitorando os registros dentro dos campos que estão sendo unidos.   Assim, vou passar por três diferentes casos que você pode encontrar de junção de duas tabelas por um campo em comum e o que esperar em seus resultados. O fluxo de trabalho que vou analisar (anexado neste artigo) é um fluxo de trabalho que criei na versão 10.5 e contém os mesmos elementos visuais ilustrados abaixo.   Caso nº 1: junção por campos em que ambos possuem registros exclusivos   Esse é o caso mais simples e mais fácil de entender. Nesse caso, estamos fazendo a junção pelos campos chamados “Fruit” nas duas entradas. A junção alinhará os registros das tabelas se os registros nos campos “Fruit” corresponderem.   Portanto, a tabela "unida" esperada (saída J) deve ficar assim:   Bastante simples   Caso nº 2: junção por campos em que apenas um possui registros exclusivos   Para esse caso, temos dois registros para "Banana" em nossa entrada à esquerda. Isso significa que o registro com “Banana” na entrada à direita fará correspondência duas vezes e será anexado aos dois registros da entrada à esquerda. Nossa saída deve ficar assim:     Caso nº 3: junção em campos em que ambos possuem registros não exclusivos Esse caso pode ser o mais difícil de entender, mas esperamos que após analisá-lo visualmente e matematicamente, você entenderá porque isso faz sentido e o que você pode fazer para evitar registros indesejados.   Nesse caso, temos dois registros em “Fruit” e ambos contêm “Banana” nas duas tabelas. Aqui acontece o mesmo que no caso acima, exceto que agora acontece duas vezes porque temos dois registros da entrada à direita que fazem correspondência com dois registros da entrada à esquerda. Então, nossa saída terá um total de 4 registros contendo a palavra "Banana".  A saída deve ficar assim:     Analisando matematicamente o Caso nº 3 e o Caso nº 2, você pode entender quantos registros obterá para cada instância de registro multiplicando a quantidade de registros que aparecem nas duas tabelas. No exemplo acima, já que estamos fazendo a junção em “Fruit” e vemos o registro Banana duas vezes nas duas tabelas, você pode pensar em 2 bananas x 2 bananas = 4 bananas.   Se adicionarmos outra linha na nossa entrada à direita, da seguinte forma:   Temos agora 3 x 2, então devemos esperar 6 combinações de registros com “Banana” no campo “Fruit”         Se você fez a junção de duas tabelas e obteve mais registros do que esperava, essa é causa mais provável do problema. Se alguém não entender os casos apresentados acima, isso poderia constranger qualquer banana (trocadilho intencional). Como práticas recomendadas, eu seguiria estes dois passos antes de unir quaisquer tabelas:   1 º : verifique se há registros duplicados nas suas tabelas. Para o caso acima, como temos três duplicatas na nossa entrada à direita, podemos utilizar a ferramenta Exclusivo e nos livrar delas. A saída será exatamente a mesma do Caso nº 2, já que existirá apenas um registro de “Banana” após a ferramenta Exclusivo.   2 º : verifique se fazer a junção por múltiplos campos é a opção mais apropriada. Exemplo: temos a Tabela 1 com dois registros contendo "Banana" em "Fruit" e dois registros contendo "X" em "Store ID", além do "FruitID" que é um identificador para cada fruta em "Fruit".  A Tabela 2 tem os mesmos campos “Fruit” e “Store ID”, mas agora temos um campo “Store employees” associado ao “Store ID”.                                                                     Tabela 1 Tabela 2   Queremos todos esses dados juntos para que tudo fique bem associado.  De forma ideal, deveríamos ter somente quatro registros saindo da nossa junção ao colocar os campos de funcionários da loja (Store employees) e ID da fruta (FruitID) em uma tabela. No entanto, se fizéssemos a junção usando apenas um campo em comum, seja ele "Store ID" ou "Fruit", obteríamos combinações e os dados não seriam alinhados corretamente. Veja abaixo.   Junção em “Fruit”   Nesse caso, obtemos dois registros em que nossos IDs de loja (StoreID) não correspondem.   Junção em “StoreID”   Nesse caso, obtemos dois registros em que nossas frutas (Fruit) não correspondem. Para corrigir isso, configuraremos nossa junção para fazer correspondência em ambos os campos Fruit e StoreID.     Após executar, a tabela "unida" deve ficar assim:   Ao fazer a junção usando múltiplos campos, garantimos que os registros de ambos os campos façam correspondência antes da junção. Uma maneira fácil de entender isso é imaginar que "Fruit" e "StoreID" estão sendo combinados. Agora, de repente, temos registros únicos porque temos Banana X e Banana Y como duas entidades exclusivas e nossa junção se torna uma junção de 1 registro x 1 registro.      
Ver artigo completo
Rótulos