pegado do visme.com
Pegado do giphy.com
Depois de atribuir tipos de dados ricos, podemos criar novas características a partir dos dados.
Este processo é semelhante ao que fazemos quando criamos novas variáveis manualmente, temos que calculá-las ou usar instruções SQL complexas para fazer isso. No Alteryx, é automático; Um exemplo de uma característica que costumamos criar é a idade, já que temos a data de nascimento, calculamos a idade das pessoas. Outro exemplo são as compras médias de cada cliente. Precisamos fazer essas variáveis manualmente, a vantagem é que o Alteryx faz isso por nós.
Esta ferramenta requer que os dados sejam normalizados, com a terceira forma normal é suficiente.
Na terceira forma normal, sempre que possível, não deve haver repetições em uma tabela. Se houver, uma tabela adicional deve ser criada, atribuída a um campo de ID e referenciada à tabela principal por aquele ID para eliminar a redundância nos dados.
Por exemplo, suponha que temos uma tabela que contém uma lista de clientes e seus endereços com rua, bairro, delegação, CEP e estado.
Para alterar esta tabela para a terceira forma normal, primeiro você deve criar uma nova tabela que contenha apenas as delegações e adicionar um ID a cada uma. Na tabela original de clientes, apenas o ID da delegação correspondente é adicionado. Desta forma, ambas as tabelas serão relacionadas pelo campo-chave que compartilham e a redundância nos dados será evitada.
O bloco analítico de geração de características permite estabelecer relações entre os dados contidos em tabelas independentes que se encontram na terceira forma normal.
Clique na tabela principal da aba de gerenciar relações.
Selecione a chave primária associada à tabela.
Associar uma chave em uma tabela pai a uma chave em uma tabela filho cria novas características com base nessa relação.
Em seguida, clique na guia Gerenciar primitivas. As primitivas são funções.
Existem muitas funções aqui, até 5 podem ser selecionadas. Isso ocorre porque esse bloco analítico cria novas características com base nas funções escolhidas e pode ter crescimento exponencial.
Esses novos recursos serão aproveitados na construção de modelos com aprendizado de máquina.
No próximo artigo, detalharei a ferramenta de aprendizado de máquina automatizado.
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.