Free Trial

Blog - Deutsch

Erkenntnisse und Ideen von den besten Analytics-Experten.
RolandSchubert
16 - Nebula
16 - Nebula

Alteryx bietet insgesamt fast 300 Tools. Einige davon findet man in fast jedem Workflow; Input Data, Select, Join, Summarize oder Filter kommen beinahe immer zum Einsatz. An eine Reihe anderen Tools denkt jeder Anwender mehr oder weniger automatisch, wenn es um bestimmte Aufgabenstellungen geht – sie sind dann gewissermaßen die „intuitive Lösung“.

 

Ziemlich viele Tools bleiben dagegen oft unbeachtet und werden kaum genutzt, obwohl sie vielleicht im konkreten Fall die Lösung eines Problems stark vereinfachen und viel überflüssige Arbeit vermeiden können. Und wenn es um die Vermeidung nicht notwendiger Arbeit geht, bin ich auf jeden Fall dabei!

 

Eines dieser Tools will ich heute kurz vorstellen: das Make Columns Tool, dessen Aufgabe es ist, Datenzeilen in Spalten zu übertragen. Moment - Zeilen in Spalten? Gibt es da nicht das Cross Tab Tool? Stimmt, gibt es. Allerdings bringt das Make Columns Tool einige Besonderheiten mit, die in bestimmten Fällen (natürlich nicht immer!) sehr hilfreich sind – so kann man etwa die Anzahl Spalten und die Anordnung angeben, die jeweils gebraucht wird.

 

Welche konkreten Anwendungsfälle gibt es nun für das Tool? An einigen Beispielen möchte ich das gern zeigen.

 

Starten wir mal ganz einfach …

 

Daten werden ja mitunter in sehr „interessanter“ Form geliefert. Etwa gibt es die Variante, dass die einzelnen Werte in Zeilengruppen geliefert werden. Konkret könnte das etwa so aussehen:

 

P001.png

 

Die Datei enthält die Spieler der Mannschaft des SC Paderborn 07 aus der Saison 2020/21 und listet jeweils die Rückennummer, den Namen, die Position, das Geburtsdatum, das Ende der Vertragslaufzeit und den aktuellen Marktwert auf (Quelle: transfermarkt.de). Es sind also jeweils 6 Datensätze, die zu einem Spieler gehören.

 

Die einzelnen Informationen sollen in Spalten übertragen werden, so dass es je Spieler einer Datensatz mit den entsprechenden 6 Spalten gibt. Dabei soll die jeweils erste Zeile jeder Gruppe von Datensätzen in die erste Spalte, die zweite Zeile in die zweite Spalte und so weiter. Klar, das kann man auch mit dem Cross-Tab Tool lösen, aber da müssen erst mal Spalten- und Zeilen-Ids hinzugefügt werden. Beim Make Column Tool gibt man nun einfach die Anzahl der Spalten an, die ausgegeben werden sollen, und entscheidet sich für die passende „Transferlogik“. Dabei hat man die Auswahl zwischen horizontal und vertikal. In unserem Beispiel brauchen wir „horizontal“ – das bedeutet, Zeilen werden in Spalten pivotiert, bis die angegebene Anzahl Spalten erreicht ist (hier 6), danach geht es mit einer neuen Zeile weiter.

 

P002.jpg

 

Also: Die Zeilen 1-6 der Input-Tabelle werden zu Spalten 1-6 von Zeile 1 der Output-Tabelle, Zeilen 7-12 werden wieder zu den Spalten 1-6, aber von Zeile 2 – entsprechend geht es weiter.  

 

Möglicherweise wollen wir aber auch für jeden Spieler eine Spalte erzeugen, also die Zeilen 1-6 in Spalte 1 übertragen, die Zeilen 7-12 in Spalte 2 und so weiter. Auch das lässt sich mit einem Cross-Tab Tool (und ein bisschen Vorarbeit) lösen, aber mit Make Column geht es viel einfacher:

 

P003.jpg

 

Die Anzahl Spalten ist jetzt die Anzahl Spieler, zudem entscheiden wir uns für „Arrange Vertically“ – mit dieser Konfiguration werden unsere Daten entsprechend umgesetzt. Ganz allgemein wird bei dieser Variante die Anzahl Datensätze durch die Anzahl der Spalten geteilt, die wir erzeugen wollen, gegebenenfalls wird das Ergebnis auf die nächste ganze Zahl aufgerundet. Dieser Wert gibt uns die Anzahl Datensätze, die in Spalte 1 übertragen werden – mit dem dann folgenden Datensatz und wieder der gleichen Anzahl geht es in Spalte 2 weiter. Die letzte Spalte bekommt dann die verbliebenen Datensätze, das können auch ein paar weniger sein.

So lassen sich ganz einfach aus Zeilen Spalten erzeugen – in der Praxis werden es vermutlich eher Bestellungen, Artikelinformationen oder Personaldaten sein, die so aufbereitet werden müssen.

 

Aber das war noch nicht alles …

 

 Wenn etwa die Mitarbeiter nach Kostenstelle aufgelistet werden sollen, aber maximal zehn Spalten zur Verfügung stehen, muss einerseits nach der vorgegebenen Spaltenzahl ein „Zeilenumbruch“ stattfinden, andererseits aber auch gruppiert werden. Dabei kann für eine Kostenstelle eine Zeile genügen, für andere Kostenstellen sind mehrere Zeilen erforderlich.  Auch das können wir mit dem Make Columns Tool erledigen – und als Beispiel müssen wieder Fußballmannschaften herhalten, diesmal der Vfl Wolfsburg und der SC Freiburg aus der Saison 2010/11 (Quelle erneut transfermarkt.de).

 

Diesmal nutzen wir auch die Option „Grouping Fields“ und wählen hier das entsprechende Feld aus. Die Spaltenzahl und die Orientierung horizontal/vertikal werden wie vorher genutzt. Zusätzlich zu der Umsetzung von Zeilen in Spalten wird hier jetzt noch gruppiert – und natürlich können auch mehrere Felder für die Gruppenbildung verwendet werden.

 

P004.jpg

 

Die Daten lassen sich so sehr einfach in die entsprechende Form bringen. Natürlich gibt es für das Make Columns Tool nicht so viele Anwendungsfälle wie etwa für das Cross-Tab Tool, aber im Falle einen entsprechenden Aufgabenstellung kann man seinen Workflow deutlich vereinfachen.

 

Ach übrigens – die Dokumentation zum Make Columns Tool beginnt mit den Worten, dass es sich um ein Labor-Tool handelt, das noch nicht in der Produktion eingesetzt werden sollte. Davon sollte man sich nicht unbedingt abschrecken lassen, es einfach mal zu probieren. Ich nutze das Tool regelmäßig, größere Probleme habe ich bislang nicht beobachtet.

 

Falls übrigens jemanden interessiert, warum ich ausgerechnet Paderborn, Freiburg und Wolfsburg als Beispiele benutze – die Auswahl war tatsächlich mehr oder weniger zufällig. 

 

 

Weitere Tipps Tuesday Beiträge

Dieser Eintrag ist Teil der Tipps Tuesday-Serie, alle Einträge dieser Serie findest du in unserem Index aufgelistet.

 

Beschriftungen