Free Trial

Blog - Deutsch

Erkenntnisse und Ideen von den besten Analytics-Experten.
RolandSchubert
16 - Nebula
16 - Nebula

Jede Gesellschaft liefert ihre Abschlussdaten in einer Datei, die Niederlassungen schicken uns die Umsatzdaten des letzten Monats jeweils als Excel-Tabelle.  Und jetzt? 

 

In Excel würden wir jetzt vermutlich nacheinander die einzelnen Dateien öffnen, den Inhalt markieren, kopieren und in eine zusätzliche Datei hintereinander einfügen. In Alteryx würden wir die Dateien im Idealfall einfach gemeinsam importieren - wie das geht, hat @grossal in der letzten Woche hier schon gezeigt. Aber manchmal geht das leider nicht. Und für diesen Fall haben wir natürlich ein Tool zur Verfügung. Und mit diesem Tool können wir auch gleich einige typische Probleme lösen, die bei dieser Form der Datenbereitstellung nicht so ganz selten auftreten.

 

Also - wir haben drei Dateien, die etwa so aussehen:

 

P001.jpg 

 

Diese drei Dateien importieren wir jeweils mit einem Input Data Tool und wollen sie jetzt zusammenführen.  Dazu nutzen wir hier das Union Tool aus der Join Toolpalette. Manchmal kommt es hier zu Verwechslungen mit dem Join Tool - das verbindet Spalten aus zwei Tabellen, während das Union Tool Zeilen hinzufügt.

 

P002.jpg

 

 

Mit dem Union Tool können wir gleich alle drei Eingangsdateien verbinden, die dann einfach hintereinander gehängt werden (der Input-Anchor des Tools zeigt, dass hier mehrere Verbindungen hergestellt werden können). 

 

P003.jpg

 

Die einzelnen Spalten werden dabei standardmäßig nach ihrem Namen zugeordnet. In unserem Beispiel haben wir in allen drei Dateien die Spalten "KndNr", "Artikel", "Menge" und "Umsatz", das passt also wunderbar. Aber - was passiert unter Garantie, wenn Daten mit Excel geliefert werden? Irgendjemand kommt auf den Gedanken, eine der Spaltenüberschriften zu verändern. Oder die Reihenfolge wird verändert,  es werden Spalten hinzugefügt, vielleicht ist es auch eine Kombination von allem.  Falls wir zum Beispiel Exporte aus SAP zusammenführen müssen, ist es oft nicht besser ... da wird gern mal ein zusätzliches Feld mit aufgenommen (oder auch entfernt).

 

Nehmen wir einfach mal an, einer unserer "Datenlieferanten" ist auf den Gedanken gekommen, statt "KndNr" wäre die Überschrift "Kundennummer" doch viel sinnvoller. 

 

P006.jpg

 

Unsere schöne Standardlogik, die Felder über den Namen zuzuordnen, passt jetzt natürlich nicht mehr. Aber dafür haben wir eine einfache Lösung. 

 

P007.jpg

 

Die Konfiguration des Union Tools bietet neben der Einstellung "Auto Config by Name" nämlich auch "Auto Config by Position" an. Jetzt werden einfach die Felder entsprechend ihrer Reihenfolge übernommen, damit landet der Inhalt von Spalte "A" (um einmal die Excel-Logik zu verwenden) immer im ersten Feld, egal, wie die Überschrift aussieht. Damit verbinden wir die Daten übrigens genau so, wie wir es in Excel mit der oben beschriebenen COPY-PASTE-Methode machen würden.

 

Aber was machen wir, wenn jemand auf die Idee kommt, dass es doch nicht schaden kann, zusätzlich noch den Stückpreis mitzuliefern?

 

P005.jpg

 

Jetzt passen weder Namen noch Reihenfolge. Dafür gibt es dann die dritte Variante: manuelle Konfiguration.

 

P004.jpg

 

Mit dieser Varianten können wir jedes einzelne Feld für jede einzelne Verbindung gezielt zuordnen.

 

P008.jpg

 

Um ein Feld jetzt an die "richtige" Position zu befördern, markieren wir es und benuzten die Pfeilbuttons:

 

P009.jpg

 

Hier wird das Feld [KndNr] aus Verbindung #2 um eine Position nach links geschoben - fünf weitere Klicks, und das Feld ist da angemommen, wo es hingehört. Achtung: mit dem Verschieben [KndNr] aus Spalte 6 in Spalte 5 wird der bisherige Inhalt der Spalte nach rechts geschoben - und das passiert anschließend noch mehrfach:

 

P010.jpg

 

Hier sind also einige Aufräumarbeiten angesagt, die Felder, die verschoben wurden, um Platz zu schaffen, müssen dann wieder an die richtige Position geschoben werden. Am Ende sieht es aber dann so aus, wie wir es brauchen:

 

P011.jpg

 

Bei der manuellen Konfiguration können wir zusätzlich noch die Option "Non Blocking - Metainfo will not change" wählen. 

 

P015.jpg

 

Wenn jetzt irgendjemand weitere Änderungen an den gelieferten Dateien vornimmt (oft ist die manuelle Konfiguration ja eine Reaktion darauf, dass Dateien nicht einheitlich gepflegt/geliefert werden), dann wird der Workflow mit einer Fehlermeldung abgebrochen. Wenn also etwa in einer Datei der Feldname "KndNr" in "KdNr" geändert wird, ist das Resultat diese Fehlermeldung:

 

P016.jpg

 

Eigentlich sinnvoll - wenn ich schon manuell konfiguriere, sollte ich mitbekommen, wenn sich etwas ändert!  Falls die Option nicht gewählt wird, würde eine Warnung erscheinen (die ich auch gern mal übersehe) und "KdNr" wird zu einem eigenen Feld.

 

Bei den beiden "Auto Config" Optionen haben wir die Wahl, wie wir im Fall von Abweichungen verfahren wollen und was mit Feldern passieren soll, die nicht übereinstimmen.

 

P013.jpg

 

Wir können in diesem Fall eine Warnung ausgeben lassen, die Verarbeitung aber fortsetzen, mit einer Fehlermeldung abbrechen um dann etwa manuell zu konfigurieren oder die Abweichung einfach ignorieren (das ist vermutlich nur in Ausnahmefällen sinnvoll).  

 

Wenn die Verarbeitung fortgesetzt wird,  würden bei "Auto Config by Name" [KndNr] und  [Kundennummer] in zwei verschiedenen Feldern landen! 

 

Es besteht auch die Möglichkeit, nur gemeinsame Felder auszugeben - in diesem Fall wären nur noch [Menge] und [Umsatz] übrig, alle Felder, die nicht in allen Tabellen vorhanden sind, werden ausgeschlossen.

 

 Für die manuelle Konfiguration gibt es diese Möglichkeit übrigens nicht - dabei werden immer alle Felder ausgeben!

 

Manchmal ist es ja auch wichtig, dass bei der Ausgabe eine bestimmte Reihenfolge eingehalten wird (z.B. die Daten aus den Tabellen 1 , 2 und 3 in genau dieser Reihenfolge bleiben. In diesem Fall können wir auch das festlegen. Die Option "Output Order" gibt uns die Möglichkeit, hier ganz genau zu steuern.

 

P014.jpg

 

Das Join Toool ist also eigentlich auf alle Fälle vorbereitet, wenn es darum geht, Daten aus verschiedene Quellen zusammenführen - wenig überrschend, dass es so oft in den "Favoriten" auftaucht.

 

 

 

Weitere Tipps Tuesday Beiträge

Dieser Eintrag ist Teil der Tipps Tuesday-Serie, alle Einträge dieser Serie findest du in unserem Index aufgelistet.

 

 

 

 

 

Beschriftungen