Free Trial

Blog

Visiones e ideas de las mentes más brillantes en el campo del análisis.
Garabujo7
Alteryx
Alteryx

 

 

 

 

 

 

Tomada de visme.comTomada de visme.comTomado de giphy.comTomado de giphy.com

 

Generación de características

 

Garabujo7_0-1628026452032.png

 

Después de asignar tipos de datos enriquecidos, podemos crear nuevas características a partir de los datos.

 

Este proceso es similar a lo que hacemos cuando creamos nuevas variables de forma manual, las tenemos que calcular o utilizar complejos enunciados de SQL para hacerlo. En Alteryx es automático; un ejemplo de una característica que solemos crear es la edad, dado que tenemos la fecha de nacimiento, calculamos la edad de las personas. Otro ejemplo es el promedio de compras de cada cliente. Estas variables las tenemos que hacer manualmente, la ventaja es que Alteryx lo hace por nosotros.

 

Este bloque analítico requiere que los datos se encuentren normalizados, con la tercera forma normal es suficiente.

 

Tercera forma normal

 

En la tercera forma normal, en los datos que sea posible no debe haber repetidos en una tabla. Si los hay, se debe crear una tabla adicional, asignarle un campo ID y referenciarla con la tabla principal mediante ese ID para eliminar redundancia en los datos.

 

Por ejemplo, supongamos que tenemos una tabla que contiene una lista clientes y tiene sus direcciones con calle, colonia, delegación, CP, y estado.

Para cambiar esta tabla a la tercera forma normal, primero hay que crear una nueva tabla que contenga solamente las delegaciones y se le agrega un ID a cada uno. En la tabla original de clientes se le agrega solamente el ID de la delegación que corresponde. De esa forma ambas tablas se relacionarán por el campo llave que comparten y se evitará la redundancia en los datos.

 

 

Garabujo7_1-1628026476771.png

 

 

El bloque analítico de generación de características permite establecer relaciones entre los datos contenidos en tablas independientes que estén en la tercera forma normal.

 

Clic en la tabla principal en la pestaña administración de relaciones.

 

Seleccionar la llave principal asociada con la tabla.

 

Asociar una clave en una tabla principal con una clave en una tabla secundaria crea nuevas características basadas en esa relación.

 

 

Garabujo7_2-1628026510361.png

 

 

Luego, se hace clic en la pestaña administrar primitivas. Las primitivas son funciones.

 

Aquí hay muchas funciones, se pueden seleccionar hasta 5 solamente. Esto porque este bloque analítico crea nuevas características basadas en las funciones elegidas y pueden tener un crecimiento exponencial.

 

Estas nuevas funciones se aprovecharán en la creación de los modelos con aprendizaje automático.

 

Garabujo7_3-1628026529817.png

 

 

En el siguiente artículo detallaré el bloque analítico de aprendizaje automático automatizado.

 

 

Etiquetas