Free Trial

Blog

Insights e ideias das mentes mais brilhantes em análise de dados.
Garabujo7
Alteryx
Alteryx

Pegado do giphy.comPegado do giphy.com

 

Depois de criar e treinar nosso modelo para identificar tópicos dentro dos dados que temos, a próxima etapa é usar esse modelo treinado para atribuir tópicos a novos dados que recebemos e, assim, evitar executar todo o processo de preparação e treinamento novamente. consumiria mais tempo e recursos.

 

 

 

Garabujo7_5-1629738115891.png

 

 

A imagem acima é o processo completo de identificação do tópico.

 

Como podemos torná-lo mais eficiente?

 

Exportar modelo treinado

 

* A versão 2021.2 do Intelligence Suite incluiu a capacidade de exportar o modelo de classificação de tópicos treinados.

 

Assim que tivermos um modelo que atenda às nossas necessidades, podemos exportá-lo e usá-lo para atribuir tópicos a novas informações.

 

A primeira etapa para fazer isso é colocar uma saída de dados na âncora M do bloco analítico Modelagem de Tópicos.

 

 

 

Garabujo7_1-1629737994955.png

 

 

 

Lá, selecionamos o formato de saída como Banco de dados Alteryx (* .yxdb). Desta forma, o modelo treinado será exportado e podemos usá-lo para atribuir tópicos com base nos dados que usamos para treiná-lo.

 

Com o modelo treinado, podemos usá-lo em um novo fluxo.

 

Garabujo7_2-1629738018106.png

 

 

Colocamos os novos dados que queremos classificar e o modelo que exportamos.

 

* É importante que os campos que usaremos tenham exatamente os mesmos nomes do modelo que treinamos originalmente.

 

Para se qualificar, usaremos o bloco de previsão analítica encontrado na guia Aprendizado de Máquina.

 

 

Garabujo7_3-1629738034438.png

 

 

 

Conectamos o modelo treinado à entrada M (modelo) e os dados à entrada (D).

 

É importante adicionar o pré-processamento de texto primeiro para preparar os dados corretamente.

 

 

 

Garabujo7_4-1629738057156.png

 

 

E é isso, ao executar o fluxo ele vai atribuir um tópico a cada dado.

 

Desta forma, otimizaremos o tempo de execução e podemos utilizá-lo para categorizar novos dados facilmente.

 

 

 

Pegado do giphy.comPegado do giphy.com

 

Rótulos