Que tal comunidad, yo por acá nuevamente. Mantengo una consulta, la presente es la busqueda del dato máximo para un conjunto igual de datos pero de salidad variables, ejemplo para los 7 días de la semana se considera semana 1, 2, 3.. etc para cada unos de estos días se tienen salida diferentes, pero deseo cambiar la salida por el máximo obtenido esa semana.
Muestro ejemplo:
agradezco su colaboración mientras me encuentro trabajando en ello.
¡Resuelto! Ir a solución.
Hola,
puede usar un Summarize, agrupando por semana y tomando el máximo obtenido en la semana.
Así:
Entrada - su campo que se encontrará el máximo debe ser numérico.
ajustes del Summarize
Saida:
Espero haber respondido a tu duda. Cualquier cosa envíe más detalles o el conjunto de datos para que lo resolvamos.
Vale creo que me falto algo a lo que dices, si probe ello pero ahora requiero por ejemplo que en todos los 47 diga el valor máximo es 89 asi que seria replicar lo mismo solo que con el valor máximo como sálida
Hola @aden08 .
Puede usar la herramienta SORT e informar el campo de semana creciente y el campo máximo descendente.
Espero haber ayudado!
Para compartir con la comunidad la solución que me permitio continuar. Primero hacer lo mencionado por los colaboradores arriba.
Luego me funciono un join restrictivo entre dateyear and dateweek
Para obtener la repetición que deseaba por fecha. Espero ayude y si tenian una solución más simple compartirla. saludos
Algo particular que pueden ver son los Sort utilizados antes y despues del summarize, por alguna razón se me desordena y no e visto porque, si alguno sabe se lo agradecería.
Hola @aden08
Antes del Summarize no es necesario hacer un Sort, sólo te agrega overhead de procesamiento.
Adicionalmente, puede que tengas habilitado AMP, que al hacer muti threading, procesa registros de a paquetes.
Para ver más acerca de AMP: https://help.alteryx.com/20221/designer/alteryx-amp-engine
Me recomienda desahabilitarlo? Dado que por ejemplo este flujo lo trabaje en otro servidor, al trabajarlo en mi pc empece a tener errores dado que mucho lo hago con un record ID para joins y demás y si eso se me desordena no me daban los resultados. Puede ser esa la razón de mi problema menciona?
Puede ser que ese sea el problema.
Si utilizas RecordIDs para Joins, lo más probable es que revisando el workflow haya una mejor forma de lograrlos y no sea el mejor método.
Si el volumen de datos que estás leyendo no es alto (me refiero al orden de los cientos de millones de registros), tal vez lo mejor sea deshabilitarlo.
De otra manera, tendrías que revisar toda la lógica para optimizar esa necesidad de RecordIDs.