Una vez que creamos y entrenamos nuestro modelo para identificar tópicos dentro de los datos que tenemos, el siguiente paso es usar ese modelo entrenado para asignar tópicos a nuevos datos que recibamos y así evitaríamos correr todo el proceso de preparación y entrenamiento de nuevo, lo que consumiría más tiempo y recursos.
La imagen de arriba es el proceso completo de identificación de tópicos.
¿Cómo podemos hacerlo más eficiente?
* En la versión 2021.2 de Intelligence Suite se incluyó la capacidad para exportar el modelo de clasificación de tópicos entrenado.
Una vez que tenemos un modelo que satisface nuestras necesidades, podemos exportarlo y usarlo para asignar tópicos a nueva información.
El primer paso para hacerlo es colocar una salida de datos en el ancla M del bloque analítico Modelado de Tópicos.
Ahí seleccionamos el formato de salida como Alteryx Database (*.yxdb). De está forma el modelo entrenado se exportará y lo podremos usar para asignar tópicos con base en los datos que usamos para entrenarlo.
Teniendo el modelo entrenado, lo podemos usar en un nuevo flujo.
Colocamos los nuevos datos que queremos clasificar y el modelo que exportamos.
* Es importante que los campos que vamos a usar tengan exactamente los mismos nombres que en el modelo que entrenamos originalmente.
Para calificar utilizaremos el bloque analítico de predicción que se encuentra en la pestaña Aprendizaje Automático.
Conectamos el modelo entrenado a la entrada M (modelo) y los datos a la entrada (D).
Es importante agregar antes un preprocesamiento de texto para preparar los datos correctamente.
Y eso es todo, al ejecutar el flujo le asignará un tópico a cada dato.
Así optimizaremos el tiempo de ejecución y lo podemos usarlo para categorizar nuevos datos fácilmente.
Debe ser un usuario registrado para añadir un comentario aquí. Si ya está registrado, inicie sesión. Si todavía no está registrado, hágalo e inicie sesión.