Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

Foro

RESUELTAS

Distribución de base

Kike
Meteoro

 

Hola a todos,

 

¿Cómo puedo hacer una distribución de una base, es decir quiero generar una columna nueva con 2 posibles valores, True or False por ejemplo pero que toda mi base sea distribuida, quiero que el 35% sea true y el 65% false pero que la distribución tome todos los valores, ejemplo no quiero solo del total de la base sino por ejemplo también distribuir cuidad, edad, genero…

Espero explicarme, en R la función se llama “Sample” y lo que hace es hacer la distribución total de la base con toda su granularidad

Excelente día para todos

6 RESPUESTAS 6
FláviaB
Alteryx Community Team
Alteryx Community Team

Gracias por la pregunta, @Kike. Quizás nuestros amigos en la comunidad puedan ayudarlo. @Aguisande , @Thableaus ¿tendrían alguna sugerencia o consejo para esta pregunta?

Flávia Brancato
Aguisande
15 - Aurora
15 - Aurora

Hola @Kike 

El approach que yo tomaría es utilizar la función sample() en una herramienta de R directamente (también podría ser DataFrame.sample o Series.sample en Python).

No conozco un método en Alteryx que pueda hacer exactamente esto por tí.

Saludos

Kike
Meteoro

Graicas por tu respuesta @Aguisande 

 

Si es lo que hago, corro una parte en alteryx y despues lo meto a R, que fue la solución más rapida que encontre cuando lo necesitaba, pero como tengo un poco de tiempo queria ver si lo podia hacer todo desde aca, aprovechando el mensaje; que tan bueno es cuando metes el codigo de R en las rutinas? lo has hecho? creo que comenzare a ver esa opción de correr codigo tanto de Python como de R

Aguisande
15 - Aurora
15 - Aurora

Hola @Kike 

Para contestar tu pregunta, sí, he utilizado mucho código de R en Alteryx y me ha funcionado muy bien (aunque si me preguntas hoy, buscaría resolverlo con Python, por un tema de performance general, básicamente determinada por Python vs. R).

Por otro lado, me siento más cómodo con la integración con Python (a veces se me ha complicado incluir paquetes específicos de R para que funcionen bien, y sobre todo en Alteryx Server)

 

Creo que definitivamente se puede resolver el caso de uso de sampling-oversampling con herramientas propias de Alteryx (pero creo que sería un proceso que no vale el tiempo invertido).

Saludos

Kike
Meteoro
Seguiré tu consejo me iré con Pyhon

Saludos,
enrique
FláviaB
Alteryx Community Team
Alteryx Community Team

Muchas gracias por tu ayuda @Aguisande! @Kike, estoy feliz de que fuimos capaces de ayudarte! De hecho, esta es una gran oportunidad para aceptar la respuesta como una solución. Simplemente presione el botón "Aceptar como solución" debajo de la respuesta¡Al hacer esto, está ayudando a otros miembros a encontrar respuestas a sus propias preguntas de manera fácil y rápida! 😉 

Flávia Brancato
Etiquetas