- Inscrever-se no RSS Feed
- Marcar como novo
- Marcar como lido
- Marcar como favorito
- Inscrever-se
- Versão para impressão
- Notificar o moderador
- Inscrever-se no RSS Feed
- Marcar como novo
- Marcar como lido
- Marcar como favorito
- Inscrever-se
- Versão para impressão
- Notificar o moderador
pegado do visme.com
pegado do visme.com
Engenharia de recursos
A engenharia de recursos é a criação de novas variáveis a partir das variáveis atuais. Faz parte da preparação de dados, mas também é comumente usado no aprendizado de máquina.
Uma nova variável é criada com base no conhecimento do negócio, intuição e experiência técnica, geralmente é um processo complexo. Na maioria dos casos, é um processo manual, por isso é demorado e requer conhecimento de SQL e programação.
Normalmente, dados esparsos são extraídos de vários sistemas e tabelas e usados para procedimentos de aprendizado de máquina. Portanto, é necessário integrá-los em uma única tabela.
É por isso que no Alteryx Designer versão 2021.1 quatro novas ferramentas analíticas foram incorporadas à aba de aprendizado de máquina para economizar tempo e simplificar o processo.
- Tipos de recursos
- Geração de recursos
- AutoML (aprendizado de máquina automatizado)
- Saúde dos dados
A recomendação é usar esses novos blocos de construção para simplificar o processo, agregar valor ao negócio e criar modelos de aprendizado de máquina de alta qualidade.
Começarei com o primeiro bloco analítico neste artigo e publicarei os três restantes em outros artigos.
Tipos de recursos
Para aumentar a eficácia de um modelo analítico, é possível enriquecer os dados que serão utilizados com mais informações, para isso utilizaremos este bloco analítico que também é muito fácil de configurar.
Se mostra o nome de cada característica, o tipo de dados e você pode selecionar o tipo de dados enriquecidos que podem ser adicionados a eles e o tipo de saída que criará.
A recomendação é usar a detecção automática para facilitar. Desta forma, o processo de adição do tipo de dado enriquecido será realizado automaticamente.
A seguir está a lista de todos os tipos de dados ricos existentes. Com esses tipos de dados enriquecidos, o modelo terá mais informações ao treinar e poderá dar melhores resultados.
Por exemplo, se o tipo de dado for data, com o tipo enriquecido podemos estabelecer que essa data é o nascimento da pessoa ou um delta de atualização e com essa informação os dados ficam mais bem explicados.
No próximo artigo falarei sobre a seguinte ferramenta: Geração de características.
No último artigo, incluirei o exemplo de fluxo que usei.
Você deve ser um usuário registrado para adicionar um comentário aqui. Se você já estiver registrado, faça logon. Se você ainda não estiver registrado, registre-se e faça logon.