Blog

Insights e ideias das mentes mais brilhantes em análise de dados.
Garabujo7
Alteryx
Alteryx

pegado do visme.compegado do visme.com

 

 

 

pegado do visme.compegado do visme.com

 

Engenharia de recursos

 

A engenharia de recursos é a criação de novas variáveis a partir das variáveis atuais. Faz parte da preparação de dados, mas também é comumente usado no aprendizado de máquina.

 

Uma nova variável é criada com base no conhecimento do negócio, intuição e experiência técnica, geralmente é um processo complexo. Na maioria dos casos, é um processo manual, por isso é demorado e requer conhecimento de SQL e programação.

 

Normalmente, dados esparsos são extraídos de vários sistemas e tabelas e usados para procedimentos de aprendizado de máquina. Portanto, é necessário integrá-los em uma única tabela.

 

É por isso que no Alteryx Designer versão 2021.1 quatro novas ferramentas analíticas foram incorporadas à aba de aprendizado de máquina para economizar tempo e simplificar o processo.

 

 

  • Tipos de recursos

 

  • Geração de recursos

 

  • AutoML (aprendizado de máquina automatizado)

 

  • Saúde dos dados

 

Garabujo7_0-1628203112071.png

 

 

A recomendação é usar esses novos blocos de construção para simplificar o processo, agregar valor ao negócio e criar modelos de aprendizado de máquina de alta qualidade.

 

Começarei com o primeiro bloco analítico neste artigo e publicarei os três restantes em outros artigos.

 

 

Garabujo7_1-1628203127984.png

 

 

Tipos de recursos

 

Para aumentar a eficácia de um modelo analítico, é possível enriquecer os dados que serão utilizados com mais informações, para isso utilizaremos este bloco analítico que também é muito fácil de configurar.

 

Se mostra o nome de cada característica, o tipo de dados e você pode selecionar o tipo de dados enriquecidos que podem ser adicionados a eles e o tipo de saída que criará.

 

Garabujo7_2-1628203150187.png

 

 

A recomendação é usar a detecção automática para facilitar. Desta forma, o processo de adição do tipo de dado enriquecido será realizado automaticamente.

 

A seguir está a lista de todos os tipos de dados ricos existentes. Com esses tipos de dados enriquecidos, o modelo terá mais informações ao treinar e poderá dar melhores resultados.

 

Por exemplo, se o tipo de dado for data, com o tipo enriquecido podemos estabelecer que essa data é o nascimento da pessoa ou um delta de atualização e com essa informação os dados ficam mais bem explicados.

 

 

Garabujo7_3-1628203177962.png

 

 

No próximo artigo falarei sobre a seguinte ferramenta: Geração de características.

 

No último artigo, incluirei o exemplo de fluxo que usei. 

 

 

Rótulos