Hola comunidad, excelente tarde.
Estoy intentando obtener el porcentaje acumulado de cada categoria (oficina_ventas) por mes (fecha_reparto) en mi data set . Es decir, el porcentaje debe ir aumentando día a día, pero al cambiar de mes o cuando se integre una categoria nueva, las variables que permiten calcular el porcentaje deben reiniciarse.
Para obtener este porcentaje se requiere dividir el campo covertura_3c(running total)/no_clientes (total de categoria por mes), por lo que estoy utilizando el step Running Total en la columna cobertura_3c, agrupando las columnas que me permitan obtener la suma de cada registro por categoria, generando la columna RunTot_cobertura_3c. Este valor es el númerador que debe divdirse entre el total de la columna no_clientes, el problema con esta columna es que requiero el ultimo valor del running total en todos los registros de ese mes y esa categoria.
Por ahora se tiene lo siguiente:
y el resultado esperado deberia ser algo similar a lo siguiente:
oficina_ventas | fecha_venta | covertura_3c | RunTot_covertura_3c | no_clientes | RunTot_no_clientes | porcentaje |
A | 04/01/2021 | 2 | 2 | 10 | 25 | 0.08 |
A | 04/02/2021 | 3 | 5 | 8 | 25 | 0.2 |
A | 04/03/2021 | 2 | 7 | 7 | 25 | .28 |
B | 05/01/2021 | 1 | 1 | 3 | 7 | .14 |
B | 05/02/2022 | 2 | 3 | 4 | 7 | .42 |
Como mencione, estos running total deben reiniciarse cada que cambie el mes (fecha_venta) o se integre una nueva categoria (oficina_ventas).
¿Tienen alguna idea de como poder hacerlo? Saludos, amigos.
PD: Adjunto workflow y archivo input.
hola @xkid_dup_602
El running total no está agrupando por ningún valor, por eso no "resetea" en cada cambio.
Esto genera un "reset" por cada [Year]