Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

Blog - Deutsch

Erkenntnisse und Ideen von den besten Analytics-Experten.
RolandSchubert
16 - Nebula
16 - Nebula

Wenn es darum geht, Datensätze in Gruppen einzuteilen, denkt man ja oft an "Predictive Grouping" (z.B. Clusteranalyse). Aber manchmal (eigentlich sogar meistens) ist es viel einfacher - man will nur Produkte nach ihrem Umsatz einteilen, Lieferanten nach Einhaltung von Lieferterminen gruppieren oder Kunden entsprechend ihrer Zahlungsmoral - es gibt einfach ein (oder mehrere) Kriterien, die über die Zugehörigkeit zu einer Gruppe entscheiden.

 

In einem einfachen Beispiel könnten etwa die folgenden Daten vorliegen:

 

RolandSchubert_0-1667225277684.png

 

Um hier Gruppen zu bilden, kann man natürlich mit einem FORMULA Tool arbeiten und ein entsprechendes IF-Konstrukt verwenden:

 

Man könnte auch eine Abfolge von FILTER Tools nutzen, die nacheinander die jeweilige Gruppe herausfiltern:

 

 

 

 

P03.png 

In beiden Fällen muss die Grenze der einzelnen Gruppen jeweils festgelegt und in die Bedingung eingebaut werden. Diese Werte gelten immer und unabhängig von den angelieferten Daten - in vielen Fällen ist das ja durchaus richtig. 

 

Oft passt aber diese Logik nicht so richtig. Wenn die Produkte nach ihren kumulierten Umsätzen eingeteilt werden sollen, müssten jeden Monat die Grenzwerte angepasst werden - nicht so richtig schön.

 

Aber es gibt ja auch noch das TILE Tool - und damit wird die Einteilung viel einfacher und flexibler.

 

Natürlich kann man auch hier "manuell" einteilen und die jeweiligen Grenzwerte angeben:

 

P04.png

Die einzelnen Datensätze erhalten eine Gruppennummer (Tile_Num), zudem werden sie durchnummeriert, allerdings unabhängig von den Datenwerten, sondern ausschließlich nach der Reihenfolge in der Tabelle. 

 

P05.png

 

Aber Vorsicht: Beim TILE Tool wird jeweils die Obergrenze einer Gruppe angegeben - d.h. es gilt bei Einstellung "manual" immer ein "<="! Es gibt keine Möglichkeit, diesen Operator zu verändern!

 

 

Richtig interessant wird es aber, wenn wir uns die anderen Möglichkeiten anschauen, die das TILE Tool bietet. Neben der manuellen Gruppierung sind nämlichnoch einige weitere Optionen vorgesehen:

 

Equal Sum:

 

Die Datensätze werden in eine vorgegebene Anzahl von Gruppen eingeteilt, so dass die Summe der Werte in den einzelnen Gruppen identisch ist. Dabei kann vorher sortiert werden (immer aufsteigend), es muss aber nicht.

 

Das Ergebnis kann beispielsweise im Stil einer ABC-Analyse die Bedeutung der einzelnen Produkte für den Gesamtumsatz zeigen; jede der Gruppen hat die gleiche Summe Revenue, allerdings braucht dazu Gruppe 1 nur zwei, Gruppe 5 dagegen sieben Produkte.

 

P06.png

 

Ohne eine Sortierung wird übrigens in der angelieferten Reihenfolge summiert - hier hat das Ergebnis nichts mit den Größenverhältnissen in der Tabelle zu tun, sondern mit der (zufälligen) Reihenfolge.

 

Equal Records: 

 

Bei der Option "Equal Records" werden dagegen einfach gleich große Gruppen gebildet - unabhängig von den Werten. Ohne Sortierung werden die Datensätze nach ihrer Reihenfolge eingeordnet, mit Sortierung werden Gruppen gleicher Größe gebildet, die aber jeweils Datensätze mit den hohen und niedrigen Werten zusanmmenfassen:

 

P07.png

 

 

 

Smart Tile:

 

Besonders interessant finde ich die Option "Smart Tile" - hier werden die Datensätze nach der Standardabweichung eingeteilt, die Gruppierung hängt also wesentlich von der Struktur der angelieferten Daten ab. 

 

Datenwerte, die innerhalb von +/- der Standardabweichung liegen, werden der Gruppe "0" zugeordnet, zwischen +/- Standardabweichung und +/- 2 * Standardabweichung den Gruppen "-1" und "1", entsprechend setzt es sich dann fort. Hier steht also vorher weder die Anzahl noch die Größe der einzelnen Gruppen fest. 

 

P08.png

 

Natürlich muss die Art der Gruppierung jeweils entsprechend dem Einsatzgebiet gewählt werden, allerdings dürften tatsächlich die meisten in der Praxis vorkommenden Fälle abgedeckt sein.

 

 

 

Weitere Tipps Tuesday Beiträge

Dieser Eintrag ist Teil der Tipps Tuesday-Serie, alle Einträge dieser Serie findest du in unserem Index aufgelistet.

Beschriftungen