En esta última parte, nos enfocaremos en el resultado, entender los resultados del modelo para explicarlo y ponerlo en producción para que comience a generar valor de inmediato.
Una vez que seleccionamos los parámetros de nuestros modelos, los entrenamos. En mi caso, seleccione un ensamble de modelos.
Una vez que fueron estimados, pasamos a la sección de Auto Model para ver los resultados generales de los modelos.
Lo primero que revisamos es la lista de modelos y su posición de acuerdo a las métricas que dio.
La plataforma tiene disponibles 10 técnicas de aprendizaje automático para generar los modelos. Esto es una enorme ventaja porque no dependemos sólo de un modelo. Además, buscará la mejor combinación de variables y parámetros que dé los mejores resultados de forma automática. Así nos enfocaremos en analizar los resultados en lugar de trabajar en crear y configurar los modelos.
Estos son algunos de los modelos que entrenó, con la métrica que seleccionamos.
El modelo que la plataforma recomienda es el siguiente:
Si queremos cambiar la métrica de evaluación, podemos hacerlo y la clasificación de los modelos cambiará.
Cuando pasamos a la Evaluación del Modelo, que es la parte más relevante del proceso, podemos ver los resultados generales.
Aquí nos presenta el desempeño del modelo en la validación cruzada, el conjunto de datos reservado y el tamaño de la muestra que se usó para el entrenamiento del modelo.
También nos presenta el pipeline analítico que se uso para crear cada modelo, con todos los pasos que siguió.
Aquí es donde podemos observar que el modelo realiza automáticamente la imputación de las variables. Dependiendo del conjunto de datos, también puede realizar otras acciones automáticamente como, el tratamiento de valores atípicos o de variables objetivo desbalanceadas.
Aquí comenzamos a revisar las métricas, podemos ver las de cada uno de los modelos que fueron creados.
Nos muestra el resultado de la validación cruzada y los datos retenidos.
La matriz de confusión presenta la capacidad del modelo para predecir correctamente cada una de las categorías y la cantidad de errores que cometió, tanto en conteo como en porcentaje del total.
En la curva ROC vemos la diferencia entre el azar o no tomar ninguna acción y el valor que traería la aplicación del modelo.
En este caso nos da un área bajo la curva (AUC) de 93% lo cual es un buen resultado en conjunto con el de la matriz de confusión, que muestran que el modelo está siendo efectivo a la hora de predecir la variable objetivo sin memorizar los datos ni generalizar en exceso.
Dentro de la parte de hallazgos, podemos ver la importancia de las características tanto en listado con las principales y en gráfico.
Aquí encontramos también variables artificiales que fueron creadas por la plataforma de forma automática con el proceso de Ingeniería de Características.
En este caso la número 3, 10 y 16 son artificiales. La primera es precio promedio por cuarto, el logaritmo natural de los días de anticipación en que se hizo la reserva y el logaritmo natural del número de adultos en la reserva.
Para entender mejor cuál es la influencia que tiene cada variable de forma individual en el resultado, usamos la dependencia parcial.
Seleccionamos cada una de las variables más importantes y analizamos la gráfica para ver cómo el cambio en los valores modifica el resultado. Lo interesante es que podemos ver cada una de las características de forma independiente y entender su influjo.
Para continuar con el análisis de los resultados, la plataforma nos permite crear escenarios what-if. Utilizando alguno de los registros o escogiendo uno al azar, podemos ver la influencia que los cambios en las principales características tienen para el resultado de la predicción.
Así podemos tomar decisiones respecto a los datos que tenemos y buscar enfocarnos en detalles específicos de algunos de ellos, de acuerdo con su influencia para el resultado.
Podemos comparar los resultados de acuerdo con la distribución de cada una de las variables, para observar su posible efecto. Con esto podemos pensar fácilmente en implementar cambios para la captura de información o la mejor forma de usar la que tenemos disponible.
Si requieres revisar con mayor detalle o discutir con el resto de tu equipo los gráficos de la plataforma. Está parte te permite exportarlos, ya sea en Power Point, listas para presentarlas o el conjunto de imágenes en un Zip.
Para calificar nuevos datos mediante el modelo entrenado, podemos hacerlo directamente en la plataforma. Ya sea subiendo un archivo o usando uno que esté en el administrador de activos.
El último paso es la exportación del modelo campeón entrenado, para poderlo implementar en producción por medio de Alteryx Designer o Alteryx Server para que pueda ser calendarizado y llamado a través de API’s.
En este artículo revisamos una parte de la plataforma Alteryx en la nube, que nos permite crear modelos de aprendizaje automático fácilmente para resolver retos de negocio de forma sistemática y enfocándonos en los resultados más que en el proceso y los detalles para crearlos.
No sólo podemos crear modelos, la integración de la plataforma de Alteryx nos permite preparar, unificar y limpiar los datos, además de hacer la calificación y ponerlos en producción para que se ejecuten automáticamente o a través de llamados a las API’s con el servidor de Alteryx.
En lo que respecta al reto de negocio que usamos, el beneficio sería que ahora, siendo un usuario sin experiencia en ciencia de datos, pero con un amplio conocimiento del negocio, puedo capitalizarlo y crear un modelo que ayude a identificar a los clientes que mantendrán sus reservaciones para reducir costos y poder planear anticipadamente la demanda.
Un beneficio adicional es que, usando las características más importantes identificadas por el modelo, más su dependencia parcial y las simulaciones, es posible diseñar nuevas estrategias para atraer clientes o crear promociones alineadas con esas variables.
Con esos resultados y sin usar código ni programación, dentro de la misma plataforma podremos poner el modelo en producción para comenzar a ver beneficios al negocio rápidamente, acelerando el tiempo que toma generar valor con la solución.
Fue un recorrido largo, pero quería mostrarles esta nueva funcionalidad con un ejemplo real de inicio a fin, para que conocieran el proceso, la facilidad de uso y, sobre todo, la orientación a los resultados de negocio más que en la especialización del usuario.
Debe ser un usuario registrado para añadir un comentario aquí. Si ya está registrado, inicie sesión. Si todavía no está registrado, hágalo e inicie sesión.