Depois de criar e treinar nosso modelo para identificar tópicos dentro dos dados que temos, a próxima etapa é usar esse modelo treinado para atribuir tópicos a novos dados que recebemos e, assim, evitar executar todo o processo de preparação e treinamento novamente. consumiria mais tempo e recursos.
A imagem acima é o processo completo de identificação do tópico.
Como podemos torná-lo mais eficiente?
* A versão 2021.2 do Intelligence Suite incluiu a capacidade de exportar o modelo de classificação de tópicos treinados.
Assim que tivermos um modelo que atenda às nossas necessidades, podemos exportá-lo e usá-lo para atribuir tópicos a novas informações.
A primeira etapa para fazer isso é colocar uma saída de dados na âncora M do bloco analítico Modelagem de Tópicos.
Lá, selecionamos o formato de saída como Banco de dados Alteryx (* .yxdb). Desta forma, o modelo treinado será exportado e podemos usá-lo para atribuir tópicos com base nos dados que usamos para treiná-lo.
Com o modelo treinado, podemos usá-lo em um novo fluxo.
Colocamos os novos dados que queremos classificar e o modelo que exportamos.
* É importante que os campos que usaremos tenham exatamente os mesmos nomes do modelo que treinamos originalmente.
Para se qualificar, usaremos o bloco de previsão analítica encontrado na guia Aprendizado de Máquina.
Conectamos o modelo treinado à entrada M (modelo) e os dados à entrada (D).
É importante adicionar o pré-processamento de texto primeiro para preparar os dados corretamente.
E é isso, ao executar o fluxo ele vai atribuir um tópico a cada dado.
Desta forma, otimizaremos o tempo de execução e podemos utilizá-lo para categorizar novos dados facilmente.
Você deve ser um usuário registrado para adicionar um comentário aqui. Se você já estiver registrado, faça logon. Se você ainda não estiver registrado, registre-se e faça logon.