Distribución de base
- Suscribirse a un feed RSS
- Marcar tema como nuevo
- Marcar tema como leído
- Flotar este Tema para el usuario actual
- Favorito
- Suscribir
- Silenciar
- Página de impresión sencilla
- Marcar como nuevo
- Favorito
- Suscribir
- Silenciar
- Suscribirse a un feed RSS
- Resaltar
- Imprimir
- Notificar al moderador
Hola a todos,
¿Cómo puedo hacer una distribución de una base, es decir quiero generar una columna nueva con 2 posibles valores, True or False por ejemplo pero que toda mi base sea distribuida, quiero que el 35% sea true y el 65% false pero que la distribución tome todos los valores, ejemplo no quiero solo del total de la base sino por ejemplo también distribuir cuidad, edad, genero…
Espero explicarme, en R la función se llama “Sample” y lo que hace es hacer la distribución total de la base con toda su granularidad
Excelente día para todos
¡Resuelto! Ir a solución.
- Marcar como nuevo
- Favorito
- Suscribir
- Silenciar
- Suscribirse a un feed RSS
- Resaltar
- Imprimir
- Notificar al moderador
Gracias por la pregunta, @Kike. Quizás nuestros amigos en la comunidad puedan ayudarlo. @Aguisande , @Thableaus ¿tendrían alguna sugerencia o consejo para esta pregunta?
- Marcar como nuevo
- Favorito
- Suscribir
- Silenciar
- Suscribirse a un feed RSS
- Resaltar
- Imprimir
- Notificar al moderador
Hola @Kike
El approach que yo tomaría es utilizar la función sample() en una herramienta de R directamente (también podría ser DataFrame.sample o Series.sample en Python).
No conozco un método en Alteryx que pueda hacer exactamente esto por tí.
Saludos
- Marcar como nuevo
- Favorito
- Suscribir
- Silenciar
- Suscribirse a un feed RSS
- Resaltar
- Imprimir
- Notificar al moderador
Graicas por tu respuesta @Aguisande
Si es lo que hago, corro una parte en alteryx y despues lo meto a R, que fue la solución más rapida que encontre cuando lo necesitaba, pero como tengo un poco de tiempo queria ver si lo podia hacer todo desde aca, aprovechando el mensaje; que tan bueno es cuando metes el codigo de R en las rutinas? lo has hecho? creo que comenzare a ver esa opción de correr codigo tanto de Python como de R
- Marcar como nuevo
- Favorito
- Suscribir
- Silenciar
- Suscribirse a un feed RSS
- Resaltar
- Imprimir
- Notificar al moderador
Hola @Kike
Para contestar tu pregunta, sí, he utilizado mucho código de R en Alteryx y me ha funcionado muy bien (aunque si me preguntas hoy, buscaría resolverlo con Python, por un tema de performance general, básicamente determinada por Python vs. R).
Por otro lado, me siento más cómodo con la integración con Python (a veces se me ha complicado incluir paquetes específicos de R para que funcionen bien, y sobre todo en Alteryx Server)
Creo que definitivamente se puede resolver el caso de uso de sampling-oversampling con herramientas propias de Alteryx (pero creo que sería un proceso que no vale el tiempo invertido).
Saludos
- Marcar como nuevo
- Favorito
- Suscribir
- Silenciar
- Suscribirse a un feed RSS
- Resaltar
- Imprimir
- Notificar al moderador
Saludos,
enrique
- Marcar como nuevo
- Favorito
- Suscribir
- Silenciar
- Suscribirse a un feed RSS
- Resaltar
- Imprimir
- Notificar al moderador
Muchas gracias por tu ayuda @Aguisande! @Kike, estoy feliz de que fuimos capaces de ayudarte! De hecho, esta es una gran oportunidad para aceptar la respuesta como una solución. Simplemente presione el botón "Aceptar como solución" debajo de la respuesta¡Al hacer esto, está ayudando a otros miembros a encontrar respuestas a sus propias preguntas de manera fácil y rápida! 😉