Después de asignar tipos de datos enriquecidos, podemos crear nuevas características a partir de los datos.
Este proceso es similar a lo que hacemos cuando creamos nuevas variables de forma manual, las tenemos que calcular o utilizar complejos enunciados de SQL para hacerlo. En Alteryx es automático; un ejemplo de una característica que solemos crear es la edad, dado que tenemos la fecha de nacimiento, calculamos la edad de las personas. Otro ejemplo es el promedio de compras de cada cliente. Estas variables las tenemos que hacer manualmente, la ventaja es que Alteryx lo hace por nosotros.
Este bloque analítico requiere que los datos se encuentren normalizados, con la tercera forma normal es suficiente.
En la tercera forma normal, en los datos que sea posible no debe haber repetidos en una tabla. Si los hay, se debe crear una tabla adicional, asignarle un campo ID y referenciarla con la tabla principal mediante ese ID para eliminar redundancia en los datos.
Por ejemplo, supongamos que tenemos una tabla que contiene una lista clientes y tiene sus direcciones con calle, colonia, delegación, CP, y estado.
Para cambiar esta tabla a la tercera forma normal, primero hay que crear una nueva tabla que contenga solamente las delegaciones y se le agrega un ID a cada uno. En la tabla original de clientes se le agrega solamente el ID de la delegación que corresponde. De esa forma ambas tablas se relacionarán por el campo llave que comparten y se evitará la redundancia en los datos.
El bloque analítico de generación de características permite establecer relaciones entre los datos contenidos en tablas independientes que estén en la tercera forma normal.
Clic en la tabla principal en la pestaña administración de relaciones.
Seleccionar la llave principal asociada con la tabla.
Asociar una clave en una tabla principal con una clave en una tabla secundaria crea nuevas características basadas en esa relación.
Luego, se hace clic en la pestaña administrar primitivas. Las primitivas son funciones.
Aquí hay muchas funciones, se pueden seleccionar hasta 5 solamente. Esto porque este bloque analítico crea nuevas características basadas en las funciones elegidas y pueden tener un crecimiento exponencial.
Estas nuevas funciones se aprovecharán en la creación de los modelos con aprendizaje automático.
En el siguiente artículo detallaré el bloque analítico de aprendizaje automático automatizado.
Debe ser un usuario registrado para añadir un comentario aquí. Si ya está registrado, inicie sesión. Si todavía no está registrado, hágalo e inicie sesión.