Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

Blog

Visiones e ideas de las mentes más brillantes en el campo del análisis.
Garabujo7
Alteryx
Alteryx

Tomado de giphy.comTomado de giphy.com

 

Tomada de visme.comTomada de visme.com

 

 

Una vez que creamos y entrenamos nuestro modelo para identificar tópicos dentro de los datos que tenemos, el siguiente paso es usar ese modelo entrenado para asignar tópicos a nuevos datos que recibamos y así evitaríamos correr todo el proceso de preparación y entrenamiento de nuevo, lo que consumiría más tiempo y recursos.

 

Garabujo7_0-1628630131368.png

 

 

La imagen de arriba es el proceso completo de identificación de tópicos.

 

¿Cómo podemos hacerlo más eficiente?

 

Exportar modelo entrenado

 

 

* En la versión 2021.2 de Intelligence Suite se incluyó la capacidad para exportar el modelo de clasificación de tópicos entrenado.

 

Una vez que tenemos un modelo que satisface nuestras necesidades, podemos exportarlo y usarlo para asignar tópicos a nueva información.

 

El primer paso para hacerlo es colocar una salida de datos en el ancla M del bloque analítico Modelado de Tópicos.

 

 

 

Garabujo7_3-1628630277149.png

 

 

Ahí seleccionamos el formato de salida como Alteryx Database (*.yxdb). De está forma el modelo entrenado se exportará y lo podremos usar para asignar tópicos con base en los datos que usamos para entrenarlo.

 

Teniendo el modelo entrenado, lo podemos usar en un nuevo flujo.

 

Garabujo7_4-1628630300424.png

 

 

Colocamos los nuevos datos que queremos clasificar y el modelo que exportamos.

 

* Es importante que los campos que vamos a usar tengan exactamente los mismos nombres que en el modelo que entrenamos originalmente.

 

Para calificar utilizaremos el bloque analítico de predicción que se encuentra en la pestaña Aprendizaje Automático.

 

 

Garabujo7_5-1628630324611.png

 

 

Conectamos el modelo entrenado a la entrada M (modelo) y los datos a la entrada (D).

 

Es importante agregar antes un preprocesamiento de texto para preparar los datos correctamente.

 

 

Garabujo7_6-1628630335734.png

 

 

Y eso es todo, al ejecutar el flujo le asignará un tópico a cada dato.

 

Así optimizaremos el tiempo de ejecución y lo podemos usarlo para categorizar nuevos datos fácilmente.

 

 

 

Tomado de giphy.comTomado de giphy.com

Etiquetas