Nach einem Input Data Tool landet bei mir meistens ein Browse Tool auf dem Canvas, um einen prüfenden Blick auf die Daten zu werfen und zu schauen, ob vielleicht vor allen weiteren Schritten ein Teil der Datensätze ausgeschlossen werden sollte. Möglicherweise müssen auch die Daten bereinigt oder sortiert werden. Seit Version 2021.2 können wir die entsprechenden Tools (Filter, Sort, Data Cleansing) direkt aus dem Browse Tool erstellen lassen., also Tools inaktiv erzeugen - wir sehen dabei gewissermaßen schon im Voraus, was wir nach Ausführung der Tools bekommen.
Wie das geht, schauen wir uns an einem Beispiel an.
Um sich einen ersten Eindruck zu verschaffen, bietet das Browse Tool eine Menge Möglichkeiten.
1. Wahlweise können wir uns Daten und Metadaten anschauen:
2. Der farbige Balken unter demFeldnamen gibt uns einen ersten Überblick über die Datenqualität:
3. Die Auswahl einer Spalte (= eines Feldes) gibt uns detailliertere Informationen zu Feldinhalt, Verteilung der Daten usw.:
Daraus lassen sich dann Rückschlüsse ableiten, was mit den Daten noch passieren soll - zum Beispiel, welche Datensätze wir im weiteren Workflow nicht mehr verwenden wollen. Im Fallbeispiel wollen wirvielleicht nur die Daten mit Salesperson ID 1-9 auswerten. An sich ganz einfach - ein Filter Tool hinzufügen, mit dem Input Data Tool verbinden und die entsprechend Bedingung eintragen. Es geht aber noch einfacher. Beim Klick auf die Spalte, für die eine Auswahlbedingung eingefügt werden soll, zeigen drei Punkte am rechten Rand des Spaltenkopfs an, dass ein Kontextmenü zur Verfügung steht, ein weiterer Klick auf diese drei Punkte öffnet es.
Angeboten werden dann die Optionen "Data Cleanse", "Filter" und "Sort". Hier interessiert uns "Filter" - und je nach Feldtyp stehen dann die auch im Flter Tool unter "Basic Filter" verfügbaren Vergleichsoperatoren, also z.B. = (gleich), != (ungleich) oder <= (kleiner oder gleich), aber auch IS NULL.
Eine Ausnahme gibt es (leider) bei Feldern vom Typ Date, Time oder DateTime - hier beschränkt sich die Auswahl auf IS NULL und IS NOT NULL - da bietet das Filter Toll eindeutig mehr Auswahl:
Abgesehen von dieser Ausnahme können aber alle möglichen einfachen Bedingungen gesetzt werden. Nach der Bestätigung mit "Apply" (einfach RETURN reicht hier nicht!!!) wird die Bedingung sofort angewendet und das Browse Tool zeigt nur noch die Datensätze an, die die Bedingung erfüllen. Außerdem tauchen nun zwei zusätzliche Icons auf, mit denen die Bedingung entweder verworfen oder in ein entsprechendes Tool umgewandelt wird.
Bestätigt man die Bedingung, wird der Workflow um ein zusätzliches Tool erweitert, das den gesetzten Filter als Bedingung enthält.
Wenn für mehrere Spalten Filter gesetzt und danach bestätigt werden, erzeugt das Browse Tool trotzdem nur ein Filter Tool mit verknüpften Bedingungen.
Aber - außer der Option "Filter" gab es da doch noch "Data Cleanse" und "Sort". Grundsätzlich funktioniert es hier genauso. Wählen wir zusätzlich dem Filter noch eine Sortierung für eine oder mehrere Spalten und lassen schließlich noch eine Bereinigung für eine Spalte ausführen (etwa NULL ersetzen), dann werden - unabhängig von der Reihenfolge, in der wir die einzelnen Schritte im Browse Tool vollzogen haben - drei Tools in den Workflow eingefügt: Data Cleansing - Sort - Filter. Die Konfiguration bildet jeweils genau das ab, was im Browse Tool eingestellt wurde - nach den Ausführung wird also genau das herauskommen, was das Browse Tool anzeigt.
Das ist möglicherweise nicht die performanceoptimale Lösung (Data Cleansing ist recht zeitintensiv und würde besser erst nach dem Filter eingesetzt), aber eine Grundlage, die noch weiter bearbeitet werden kann, steht schon mal zur Verfügung.
Weitere Tipps Tuesday Beiträge
Dieser Eintrag ist Teil der Tipps Tuesday-Serie, alle Einträge dieser Serie findest du in unserem Index aufgelistet.
Sie müssen ein registrierter Benutzer sein, um hier einen Kommentar hinzuzufügen. Wenn Sie sich bereits registriert haben, melden Sie sich bitte an. Wenn Sie sich noch nicht registriert haben, führen Sie bitte eine Registrierung durch und melden Sie sich an.