Free Trial

Blog

Visiones e ideas de las mentes más brillantes en el campo del análisis.
Garabujo7
Alteryx
Alteryx

 

 

 

Tomado de giphy.comTomado de giphy.com

 

 

La ingeniería de características es la creación de nuevas variables a partir de variables actuales. Es parte de la preparación de datos, pero también se usa comúnmente en el aprendizaje automático.

 

Se crea una nueva variable basada en el conocimiento del negocio, la intuición, y la experiencia técnica, normalmente es un proceso complejo. En la mayoría de los casos, es un proceso manual, por lo que lleva mucho tiempo y se necesitan conocimientos de SQL y programación.

 

Usualmente, se extraen datos dispersos de varios sistemas y tablas, y se utilizan para los procedimientos de aprendizaje automático. Por ello es necesario integrarlos en una sola tabla.

 

Es por eso que en la versión 2021.1 de Alteryx Designer se incorporaron cuatro nuevos bloques analíticos en la pestaña de aprendizaje automático, para ahorrar tiempo y simplificar el proceso.

 

  • Tipos de características

 

  • Generación de características

 

  • AutoML (Aprendizaje automático automatizado)

 

  • Salud de los datos

 

Garabujo7_0-1628025143421.png

 

 

La recomendación es utilizar estos nuevos bloques para simplificar el proceso, agregar valor al negocio y crear modelos de aprendizaje automático de alta calidad.

 

Comenzaré con el primer bloque analítico en este artículo y publicaré los 3 restantes en otros artículos.

 

 

Garabujo7_1-1628025164808.png

 

 

Tipos de características.

 

Para aumentar la efectividad de un modelo analítico, es posible enriquecer los datos que se utilizaran con más información, para eso utilizaremos este bloque analítico que además se configura de forma muy sencilla.

 

Se muestra el nombre de cada característica, el tipo de datos y se puede seleccionar el tipo de dato enriquecido que se le puede agregar y el tipo de salida que creara.

 

 

Garabujo7_2-1628025188174.png

 

 

La recomendación es usar la detección automática para hacerlo de la forma más sencilla. De esta forma el proceso de agregar el tipo de dato enriquecido se realizará automáticamente.

 

A continuación, se muestra la lista de todos los tipos de datos enriquecidos existentes. Con estos tipos de datos enriquecidos el modelo tendrá más información a la hora entrenar y tendrá la capacidad de dar mejores resultados.

 

Por ejemplo, si el tipo de dato es fecha, con el tipo enriquecido podemos establecer que esa fecha es el nacimiento de la persona o un delta y con esta información se explica mejor el dato.

 

Garabujo7_3-1628025213345.png

 

 

En el siguiente artículo hablaré del siguiente bloque analítico: Generación de características.

 

En el último artículo incluiré el flujo de ejemplo que usé.

 

Etiquetas