Knowledge Base

Lernen Sie von den Profis.

0 Antworten 1055 Anzeigen 3 Kudos

0 Antworten 1585 Anzeigen 1 Kudos

Frage Woher weiß ich, wann ich die Tools Join (Verknüpfen) bzw. Union (Zusammenführen) verwenden sollte? Antwort Diese Frage erreicht uns recht häufig. Wie sollten Sie vorgehen, wenn Sie zwei Datensätze zu einem größeren Datensatz kombinieren möchten? Alteryx enthält zwei einfache Tools für diesen Vorgang, je nachdem was Sie erreichen möchten: das Verknüpfen Tool und das Zusammenführen Tool. Was ist also der Unterschied zwischen diesen Tools? Das Verknüpfen Tool generiert eine breitere Datei, fügt also Felder zu Ihren Daten hinzu oder kombiniert Ihre Eingaben horizontal. Verwenden Sie dieses Tool, um Informationen zu Ihren vorhandenen Datensätzen hinzuzufügen. Angenommen, Sie haben eine Liste von Kunden mit der ID des Geschäfts, in dem diese Kunden einkaufen, und dazu eine separate Liste der Standorte der Geschäfte. Wenn Sie die Geschäftsinformationen mit den Kundeninformationen kombinieren möchten, sollten Sie ein Verknüpfen-Tool über das Feld „Store ID“ verwenden. Dabei werden die Geschäfte in jedem Datensatz zu den Kunden zugeordnet, und Ihre Kundendatei enthält jetzt auch die Informationen für die Geschäfte. Dieser Vorgang kann je nach Struktur Ihrer Datensätze zu doppelt vorhandenen Einträgen führen, daher sollten Sie Ihre Daten überprüfen. Das Zusammenführung-Tool macht Ihre Datei länger, fügt also Einträge zu Ihren Daten hinzu oder kombiniert Ihre Eingaben vertikal. Verwenden Sie dieses Tool, um zwei Dateien übereinander zu stapeln. Angenommen, Sie haben eine Liste von Kunden aus den einzelnen Regionen Ihrer Vertriebsabteilung und möchten eine einzige Masterdatei erhalten. Die Dateien der einzelnen Regionen haben jeweils dieselben Felder. Mit dem Zusammenführung-Tool können Sie Ihre Datensätze anhand von Feldnamen ausrichten (entweder automatisch oder manuell, falls kleine Abweichungen vorliegen) und erhalten eine Masterdatei mit einheitlichen Feldern. Das angehängte Beispiel (erstellt in Alteryx Designer 11.3) veranschaulicht den Unterschied!

0 Antworten 1907 Anzeigen 2 Kudos

Frage Wie kann ich eine kartesische Verknüpfung für meine Daten ausführen? Antwort Eine kartesische Verknüpfung, auch bekannt als kartesisches Produkt, ist eine Verknüpfung aller Zeilen in einer Tabelle mit allen Zeilen in einer anderen Tabelle. Wenn Tabelle A beispielsweise 100 Zeilen hat und mit Tabelle B verknüpft wird, die 1.000 Zeilen hat, dann ergibt die kartesische Verknüpfung insgesamt 100.000 Zeilen. Diese Art von Verknüpfung ist hilfreich, wenn Sie einen Datensatz benötigen, der alle Kombinationen aus zwei oder mehr Tabellen enthält. Sie können weitere Anhängen-Tools verwenden, um zusätzliche Elemente zur Verknüpfung hinzuzufügen. Verbinden Sie dazu einfach die Ausgabe des ersten Anhängen-Tools mit der Zieleingabe eines zweiten Anhängen-Tools, und die dritte Tabelle mit der Quelleingabe des zweiten Anhängen-Tools. Setzen Sie diese Konfiguration für alle weiteren benötigten Tabellen fort. Im untenstehenden Beispiel brauchte ein Autohändler eine Liste mit allen Kombinationen aus Modell, Außenfarbe, Innenfarbe und optionalen Paketen. Hier sehen Sie eine kartesische Verknüpfung aus allen vier Tabellen: Die Tabellen enthalten die folgenden Daten: Hier sehen Sie einen Auszug aus den Ergebnissen für den oben gezeigten Workflow: Wichtig Das Anhängen-Tool gibt standardmäßig einen Fehler aus, wenn mehr als 16 Instanzen verwenden werden, um zu verhindern, dass der Benutzer versehentlich übermäßig große Datensätze produziert. Falls Ihre Daten aus mehr als 16 Elementen bestehen, können Sie diese Einstellung wie unten gezeigt für alle Anhängen-Tools ändern: Dieser Workflow wurde in 10.6 erstellt und ist angehängt. Vielen Dank!

0 Antworten 835 Anzeigen 1 Kudos

VLOOKUP ist eine der meistverwendeten Funktionen in Excel. VLOOKUP nimmt einen Suchwert entgegen und sucht nach diesem Wert in der ersten Spalte in einem Suchbereich. Vervollständigen Sie die Syntax der Funktion, indem Sie die Spaltennummer angeben, die aus dem Bereich zurückgegeben werden soll. VLOOKUP ist also eine Verknüpfung. Eine Spalte mit Daten wird mit einem bestimmten Bereich verknüpft, um eine Reihe von Werten aus diesem Bereich zurückzugeben. Dieser Beitrag verfolgt zwei Ziele: 1. Vorführung von VLOOKUP mit Alteryx. 2. Vorführung einer Vereinfachung von VLOOKUP in Alteryx. Angenommen wir haben eine Excel-Datei mit zwei Arbeitsblättern. Blatt 1 enthält eine Masterliste mit Vertriebsdaten. Die Daten sehen wie folgt aus: Blatt 2 enthält eine Auswahlliste mit Vertriebsmitarbeitern und deren Vor- und Nachnamen: Wir werden eine VLOOKUP-Funktion verwenden, um die Liste der Vertriebsmitarbeiter einzulesen, mit den Personen aus Blatt 1 abzugleichen und die Verkaufsdaten für die einzelnen Vertriebsmitarbeiter zurückzugeben. Beachten Sie, dass unsere Liste der Personen in Blatt 2 zwei Personen mit dem Namen „Angelina“ enthält. Blatt 1 enthält mehrere Personen mit den Namen „Angelina“ und „Michael“. Wenn wir also nur den Vornamen verwenden, erhalten wir keine zuverlässigen Ergebnisse mit VLOOKUP. Ein Abgleich nach Nachnamen, oder sogar eine Verkettung von Vor- und Nachname ist auch nicht immer garantiert zuverlässig. Es gibt eine Menge „Michael Thomas“ auf der Welt, und möglicherweise mehr als einen in Ihren Daten. Daher vervollständigen wir unser VLOOKUP, indem wir jedem Vertriebsmitarbeiter einen eindeutigen Bezeichner zuweisen. Lassen Sie uns jedoch nur als Gedankenspiel annehmen, dass die Kombination aus Vor- und Nachname einen eindeutigen Namen/Bezeichner ergibt. Als Erstes verketten wir also Vor- und Nachname in einem neuen Feld. Anschließend wiederholen wir den Vorgang mit unseren Daten in Blatt 2. VLOOKUPs benötigen sortierte Daten, um korrekte Ergebnisse zu liefern. In diesem Fall sortieren wir die Blätter 1 und 2 in aufsteigende Reihenfolge nach „Concatenated Name“ (Verketteter Name): Jetzt können wir endlich unsere „=VLOOKUP“-Funktion verwenden: Es hat funktioniert! Ich werde Ihnen jetzt zeigen, wie Sie dasselbe in Alteryx erreichen. (Tipp: es gibt mehr als einen Weg). Zunächst importieren wir unsere Daten aus den Blättern 1 und 2. Wie auch im Excel-Beispiel verketten wir Vor- und Nachname in einem neuen Feld. Lassen Sie uns den verketteten Namen in Blatt 1 zur besseren Lesbarkeit als „Full Name“ (Vollständiger Name) und in Blatt 2 als „New Name“ (Neuer Name) benennen. Dazu verwenden wir einen Ausdruck für das Formula Tool: Zuletzt fügen wir ein Tool „Suchen Ersetzen“ ein und verbinden Blatt 2 mit dem „F“-Eingang für „Suchen Ersetzen“ und Blatt 1 mit dem „R“. Die Konfiguration für „Suchen Ersetzen“ sieht wie folgt aus: Beachten Sie, dass „Sales“ (Verkäufe) unter „Feld(er) an Datensatz anhängen“ ausgewählt ist. Wenn wir den Workflow ausführen, erhalten wir die Daten nach Vertriebsmitarbeiter, genau wie in Excel: In Alteryx gibt es jedoch einen einfacheren Weg, VLOOKUPs auszuführen! Wir können die beiden Blätter mit einem Join Tool verknüpfen. Sehen Sie sich die Konfiguration der Verknüpfung an: Wir haben unsere Daten nach Vor- und Nachname verknüpft, ohne die beiden Felder zunächst zu verketten. Außerdem haben wir die Vertriebsdaten, die wir erhalten möchten, im gleichen Join Tool ausgewählt. Alteryx bietet einen weiteren Vorteil gegenüber der VLOOKUP-Funktion in Excel. Angenommen, Sie möchten Verkäufe und Opportunities zurückgeben. In Alteryx reicht dafür eine einzige Verknüpfung. In Excel müssen Sie mehrere VLOOKUPs ausführen.

0 Antworten 1312 Anzeigen 1 Kudos

Das Tool „Verknüpfen“ ist mit Sicherheit eines der meistverwendeten Tools in Alteryx; es wird jedoch auch häufig falsch verstanden. Dies gilt umso mehr, wenn neue Benutzer noch nie mit Verknüpfungen in anderen Datenbearbeitungsplattformen gearbeitet haben oder wenn sie große Tabellen verknüpfen und nicht auf die Datensätze in den Feldern achten, über die sie verknüpfen. Ich möchte daher drei verschiedene Arten besprechen, um zwei Tabellen über ein gemeinsames Feld zu verknüpfen, und auf die zu erwartenden Ergebnisse eingehen. Der Workflow in diesem Beispiel (an diesen Artikel angehängt) wurde in 10.5 erstellt und enthält die unten gezeigten grafischen Elemente. 1. Fall: Verknüpfen über Felder, die jeweils eindeutige Datensätze enthalten Dies ist der einfachste und am leichtesten verständliche Fall. In diesem Fall verknüpfen wir über die Felder mit dem Namen „Fruit“ (Obst) in beiden Eingaben. Beim Verknüpfen werden die Einträge in beiden Tabellen aneinander ausgerichtet, wenn die Einträge in den Feldern „Fruit“ (Obst) übereinstimmen. Die verknüpfte Tabelle (J Output) sollte also wie folgt aussehen: Sehr überschaubar 2. Fall: Verknüpfen über Felder, von denen nur eines eindeutige Datensätze enthält In diesem Fall haben wir zwei Einträge für „Banana“ (Banane) in unserer linken Eingabe. Der Eintrag mit „Banana“ (Banane) in der rechten Eingabe ergibt also zwei Übereinstimmungen und wird an beide Einträge aus der linken Eingabe angefügt. Unsere Ausgabe sollte wie folgt aussehen: 3. Fall: Verknüpfen über zwei Felder mit nicht-eindeutigen Datensätzen Dieser Fall ist etwas komplizierter, aber nach einer grafischen und mathematischen Betrachtung verstehen Sie hoffentlich die Logik und können sich vor unerwünschten Datensätzen schützen. In diesem Fall haben wir zwei Einträge in „Fruit“ (Obst), die „Banana“ (Banane) in beiden Tabellen enthalten. Hier geschieht dasselbe wie im obigen Fall, allerdings zweimal, da wir zwei Datensätze von der rechten Eingabe haben, die mit zwei Datensätzen aus der linken Eingabe übereinstimmen. Unsere Ausgabe enthält also insgesamt 4 Einträge mit dem Wort „Banana“ (Banane). Die Ausgabe sollte wie folgt aussehen: Wenn wir uns den 3. Fall und den 2. Fall aus mathematischer Perspektive ansehen, können Sie die Gesamtzahl der Datensätze pro Instanz ermitteln, indem Sie die Anzahlen der Datensätze aus beiden Tabellen miteinander multiplizieren. Da wir im obigen Beispiel nach „Fruit“ (Obst) verknüpfen und den Eintrag für Bananen in beiden Tabellen sehen, können Sie sich den Vorgang vorstellen als 2 Bananen x 2 Bananen = 4 Bananen. Angenommen, wir fügen in unserer rechten Eingabe eine weitere Zeile hinzu: Jetzt haben wir 3 x 2 und sollten also 6 Kombinationen von Einträgen mit „Banana“ (Banane) im Feld „Fruit“ (Obst) erhalten. Falls Sie zwei Tabellen verknüpft haben und mehr Datensätze als erwartet erhalten, dann ist dies die wahrscheinlichste Ursache für Ihr Problem. Diese Beispiele veranschaulichen die gezeigten Anwendungsfälle. Als Best Practice empfehle ich die beiden folgenden Schritte vor dem Verknüpfen von Tabellen: 1. : Überprüfen Sie Ihre Tabellen auf doppelt vorhandene Datensätze. Im obigen Fall haben wir drei Duplikate aus der rechten Eingabe und können das Tool „Einmalig“ verwenden, um diese Duplikate zu eliminieren. Wir erhalten exakt dieselbe Ausgabe wie im 2. Fall, da nach dem Tool „Einmalig“ nur noch ein Eintrag mit „Banana“ (Banane) übrig ist. 2. : Überprüfen Sie, ob es sinnvoller wäre, über mehrere Felder zu verknüpfen. Beispiel: Wir haben Tabelle 1 mit zwei Einträgen, die „Banana“ (Banane) als „Fruit“ (Obst) enthalten und zwei Einträge mit „x“ als „Store ID“ (Geschäfts-ID) und einer „FruitID“ (Obst-ID), die dem Obst entspricht. Tabelle 2 enthält ebenfalls die Felder „Fruit“ (Obst) und „Store ID“ (Geschäfts-ID), sowie ein Feld „Store Employees“ (Geschäftsmitarbeiter), das zusammen mit der „Store ID“ funktioniert. Tabelle 1 Tabelle 2 Wir möchten alle Daten zusammenführen, um sie in Paaren zusammenfassen zu können. Im Idealfall sollte unsere Verknüpfung nur vier Einträge ergeben, da wir die „Store Employees“ (Geschäftsmitarbeiter) und „FruitID“ (Obst-ID) in einer Tabelle erhalten möchten. Wenn wir jedoch nur über ein gemeinsames Feld verknüpfen, egal ob „Store ID“ (Geschäfts-ID) oder „Fruit“ (Obst), erhalten wir Kombinationen, und die Daten werden nicht korrekt ausgerichtet. Siehe unten. Verknüpfen nach „Fruit“ (Obst) In diesem Fall erhalten wir zwei Einträge, wenn unsere Geschäfts-IDs nicht übereinstimmen. Verknüpfen nach „StoreID“ (Geschäfts-ID) In diesem Fall erhalten wir zwei Einträge mit nicht übereinstimmenden Obstsorten. Wir müssen unsere Verknüpfung also so konfigurieren, dass über die Felder „Fruit“ (Obst) und „Store ID“ (Geschäfts-ID) verknüpft wird. Nach der Ausführung sollte die verknüpfte Tabelle wie folgt aussehen: Vor dem Verknüpfen über mehrere Felder müssen wir sicherstellen, dass die Datensätze aus beiden Feldern übereinstimmen. Stellen Sie sich vor, dass die Felder „Fruit“ (Obst) und „Store ID“ (Geschäfts-ID) zusammengeführt werden. Plötzlich haben wir eindeutige Einträge, da wir Banane X und Banane Y als eindeutige Entitäten behandeln und jeden Eintrag mit jedem Eintrag verknüpfen.

0 Antworten 1226 Anzeigen 1 Kudos

Frage Woher weiß ich, ob ich ein Join- oder ein Union-Werkzeug verwenden soll? Antwort Dies ist eine ziemlich häufige Frage. Sie haben zwei Datensätze und müssen sie zu einem größeren Datensatz kombinieren, wissen aber nicht wie Sie da vorgehen sollen? Alteryx hat zwei Werkzeuge, das Join- und das Union-Werkzeug, die dies sehr einfach machen, je nachdem, was Sie erreichen möchten. Was jedoch ist der Unterschied zwischen beiden Werkzeugen? Das Join-Werkzeug wird Ihre Daten verbreitern. Dies bedeutet, dass es Ihre Daten um zusätzliche Felder horizontal erweitert. Sie sollten dieses Tool verwenden, um weitere Informationen zu bereits vorhandenen Datensätzen hinzuzufügen. Zum Beispiel haben Sie vielleicht eine Liste von Kunden mit der ID der Geschäfte, in denen sie einkaufen, und eine separate Liste der Geschäftsstandorte. Wenn Sie die Geschäftsinformationen zu den Kundeninformationen hinzufügen möchten, müssen Sie eine Verknüpfung basierend auf dem Feld Geschäfts-ID durchführen. Als Resultat werden Sie Daten zu Geschäfts-ID, Geschäftsstandort sowie Kundendaten in einem Datensatz haben. Beachten Sie, dass dies zu Doppeleinträgen führen kann, je nachdem wie ihre Datensätze aufgebaut sind. Es ist daher empfohlen den resultierenden Datensatz zu überprüfen. Das Union-Werkzeug macht Ihre Datei länger, das heißt, es fügt Datensätze zu Ihren bestehenden Daten vertikal hinzu. Es werden keine neuen Felder, aber neue Werte hinzugefügt. Zum Beispiel haben Sie für jede Region Ihrer Vertriebsorganisation eine eigene Kundenliste. Allerdings möchten Sie diese Daten in einer einzigen Stammkunden-Datei haben. Alle Ihre Region-Dateien haben genau die gleichen Felder. Das Union-Tool kombiniert ihre Datensätze auf der Grundlage der Feldnamen (entweder automatisch oder Sie können es manuell tun, wenn es leichte Variationen in den Feldnamen gibt). Werfen Sie doch einen Blick auf das angehängte Beispiel (erstellt in Alteryx Designer 2018.4). Es zeigt den Unterschied zwischen den beiden Werkzeugen.

0 Antworten 883 Anzeigen 1 Kudos

Knowledge Base

Full Outer Join und was ich bei gleichen Spaltennamen beachten muss

Tool Mastery Serie | Mehrere verknüpfen

Vergleich: Verknüpfen und Zusammenführung

Kartesische Verknüpfung/Kartesisches Produkt

Alteryx für Excel-Benutzer: VLOOKUPs in Alteryx

Funktionsweise des Tools „Verknüpfen“, und warum Sie möglicherweise mehr Daten erhalten als erwartet

Join vs Union Werkzeug