Free Trial

Knowledge Base

Lernen Sie von den Profis.
Dieser Artikel gehört zu unserer Tool Mastery Serie, einer Zusammenstellung von Beiträgen in der Wissensdatenbank mit verschiedenen Arbeitsbeispielen für Designer-Tools. Er befasst sich mit der Nutzung des Fuzzy-Übereinstimmungs-Tools auf unserem Weg, den Umgang mit Alteryx Designer zu erlernen.   Ähnlich wie bei der Excel-Fuzzy-Suche vereinfacht das Fuzzy-Übereinstimmungs-Tool (Anwendungsbeispiel hier) die Suche nach nicht exakten Übereinstimmungen in Ihren Daten. Durch Spezifizieren von Ähnlichkeit-Schwellenwerten, Anwenden unterschiedlicher Übereinstimmungs-Algorithmen sowie Angabe weiterer Konfigurationsoptionen können Sie das Tool so anpassen, dass es am besten zu Ihrem Datensatz passt. Aufgrund der umfangreichen Anpassungsmöglichkeiten des Tools empfehlen wir, dass Sie sich unsere einleitenden  und weiterführenden Live-Schulungsvideos ansehen, wenn das Tool in komplexeren Anwendungen eingesetzt werden soll. Weiterhin ergänzen unsere häufig gestellten Fragen und die Tipps und Tricks zum Thema Fuzzy-Übereinstimmung die Informationen zur Nutzung des Tools!   Im Leben sind nur wenige Dinge schwarz und weiß. Wir finden überall Grauzonen und ihre Grenzen können verschwimmen. Gleiches gilt für Daten – insbesondere, wenn sie von Menschen eingegeben werden. Aus diesem Grund haben wir das Fuzzy-Übereinstimmungs-Tool entwickelt. Wenn Ihre Daten nicht klar sind, können Sie dennoch eine Wertschöpfung aus Ihren Datensätzen erzielen, indem Sie diese mit etwas vergleichen, das etwas stärker standardisiert ist. Dies kann bei Folgendem hilfreich sein:   Bereinigen (Duplikatentfernung) eines einzelnen Datensatzes von doppelten Einträgen (siehe Fuzzy Match.yxmd im Anhang):     Zusammenführen zweier Datensätze und Bestimmen redundanter Datensätze (siehe Fuzzy Match.yxmd im Anhang): Hinweis: Es wird dringend empfohlen, zunächst eine Bereinigung (Duplikatentfernung) jedes Ihrer zusammenzuführenden Datensätze vorzunehmen, bevor Sie diese im Zusammenführungsmodus nutzen, um alle redundanten Übereinstimmungen zu entfernen – dies bewirkt eine erhebliche Beschleunigung des Abgleichs.     Durchführen von Zeichenfolgenvergleichen, Bereinigungen und Schlüsselwortabgleichen   Diese Techniken unterstützen Sie bei der Identifizierung ähnlicher Namen, Adressen, Telefonnummern und selbst falsch geschriebener Wörter in Ihren Daten und ermöglichen exakte Analysen nicht exakter Zeichenfolgen.   Wenn Sie mit Namen arbeiten, lesen Sie bitte unseren Leitfaden für Nickname-Fuzzy-Übereinstimmungen. Wenn Sie den Übereinstimmungs-Schwellenwert so weit lockern müssen, dass manche Zeichenfolgen-Übereinstimmungen nicht korrekt erkannt werden, während andere keine weiteren Ergebnisse mehr liefern, versuchen Sie, den Abgleich mit einem anderen Fuzzy-Übereinstimmungs-Tool lediglich für die Zeichenfolgen mit dem niedrigeren Schwellenwert durchzuführen, die Sie hinzufügen möchten, und führen Sie diese wieder mit dem abgeglichenen Datensatz zusammen.   Nun sollten Sie über Expertenkenntnisse für die Nutzung des Fuzzy-Übereinstimmungs-Tools verfügen! Falls Sie einen Anwendungsfall kennen, den wir ausgelassen haben, können Sie gerne nachstehend einen Kommentar hinterlassen!    Sehen Sie sich schon als Tool-Meister? Schreiben Sie uns an Stephanie.jansen@alteryx.com, wenn Sie Ihre kreativen Tool-Anwendungsbeispiele in einem Artikel der Tool Mastery Serie vorstellen möchten.   Haben Sie noch Fragen? Die deutsche Community ist hier, um sie im Forum zu beantworten.    Wenn Sie alle Designer-Tools beherrschen möchten, abonnieren Sie unsere E-Mail-Benachrichtigungen.   *Dieser Beitrag wurde von @MattD geschrieben.  
Vollständigen Artikel anzeigen
Dieser Artikel ist Teil der Tool Master Series, einer Zusammenstellung von Beiträgen in der Wissensdatenbank mit verschiedenen Arbeitsbeispielen für die Designer-Tools. Dieser Artikel befasst sich mit der Nutzung des Tools „Kreuztabelle“ auf unserem Weg zur Beherrschung des Alteryx Designers:   Manchmal stehen Sie vor einem unsortierten Haufen von Daten und fragen sich, wie Sie diese Daten jemals in eine brauchbare Form bringen sollen. Sämtliche Optionen bedeuten erhebliche manuelle Arbeit, und als faul- ähm, ich meine natürlich als Datenverbindungsexperte widerstrebt Ihnen diese Aussicht.   In einer solchen Situation ist es manchmal sinnvoll, neue Wege zu gehen. Dafür gibt es kein besseres Tool als die leistungsstarken Kreuztabelle, mit der Sie Ihre Daten nach Herzenslust umformen können, um Ihr Problem aus einem neuen Blickwinkel zu betrachten. In diesem Artikel bespreche ich einige Anwendungsfälle, um die Vorteile dieses herausragenden Tools zu demonstrieren.   Anwendungsfall 1: Einfachere Extraktion von dynamischen Daten durch Zuweisung von Gruppen   Die Daten? Sie erhalten eine Liste, die wie das unten gezeigte Field_1 aussieht. Die PMID verweist auf eine ID-Nummer für Artikel aus einem medizinischen Journal in einer Datenbank. Jeder FAU ist ein Autor des Artikels. Jeder Artikel kann eine beliebige Anzahl an Autoren haben.     Das Ziel? Eine Tabelle mit ID-Nummern im ersten Feld und Spalten für die jeweiligen Autoren.     Wie? Bereiten Sie die Daten vor, indem Sie den Bezeichner herausfiltern und entfernen. Die dritte Spalte in der Abbildung oben, „Field_12“, enthält die nutzbaren Daten. Verwenden Sie eine mehrzeilige Formel, um die ID-Spalte und die Autorenspalten eindeutig zu identifizieren. In diesem Fall wird jede ID-Nummer durch „0“ dargestellt, und die Autoren werden hochgezählt, bis die nächste ID gefunden wird. Sehen Sie sich die Spalte „Headers“ an. Verwenden Sie eine weitere mehrzeilige Formel, um die einzelnen Header-Gruppen einander zuzuordnen. Dies ist im Grunde eine RecordID, die einen einzelnen Artikel in der Datenbank darstellt. Sehen Sie sich die Spalte „Gruppen“ in der obigen Abbildung an. Auftritt Kreuztabelle! Mit diesen Bezeichnerspalten können Sie Ihre Daten so verschieben, dass für jeden Header eine Spalte und für jede Gruppe eine Zeile erstellt wird. Sehen Sie sich das Konfigurationsfenster in der ersten Abbildung oben an.   Anwendungsfall 2: Dynamische Berechnungen für eine beliebige Anzahl von Feldern   Die Daten? Eine Handvoll numerischer Felder, siehe unten. Die Felder sind nach einem Kategoriefeld gruppiert, und Sie haben ein eindeutiges RecordID-Feld hinzugefügt.     Das Ziel? Gleitender Durchschnitt für jede einzelne Spalte innerhalb der jeweiligen Kategorie.     Wie? Anstatt eine mehrzeilige Formel für jede Spalte zu schreiben, fassen Sie alle Daten mit einer Umstellung in einer einzigen Spalte zusammen und fügen die Schlüsselfelder „RecordID“ und „HP Category“ hinzu. Sehen Sie sich das Konfigurationsfenster in der ersten Abbildung an. Unten sehen Sie die entsprechende Ausgabe. Obwohl diese Ansicht auf den ersten Blick zwar komplizierter aussieht, können Sie den gleitenden Durchschnitt in einem eleganten Durchlauf berechnen. Verwenden Sie ein mehrzeiliges Tool, um einen Durchschnitt zu berechnen. Mit der Option Gruppieren nach können Sie sich davor schützen, falsche Werte auszuwählen: deaktivieren Sie „HP Category“ und „Name“. Legen Sie unter Werte für nicht vorhandene Zeilen den Wert der nächsten gültigen Zeile fest. Restrukturieren Sie die Daten mit einer Kreuztabelle (Group by “RecordID”, Header “Name”, Data “r3”)   Anwendungsfall 3: Vereinfachung komplexer Daten mit Kreuztabellen   Die Daten? Sie haben eine Liste der möglichen Kombinationen von 5 Elementen. Für jede Kombination wird eine Zeile pro Artikel mit Gewicht und Wert des Artikels angezeigt: Die Kombination 123 wird dreimal dargestellt, mit den Informationen für Artikel1, Artikel2 und Artikel3.     Das Ziel? Sie möchten Ihre Auswahl der Artikel nach bestimmten Kriterien optimieren, wie etwa minimales Gewicht und maximaler Wert.          Wie? Verwenden Sie ein Formel-Tool, um eine Spalte für „Weight“ hinzuzufügen, wie in der ersten Abbildung gezeigt. Verwenden Sie die Kreuztabelle mit der „Sum“-Methode, um das kombinierte Gewicht aller Artikel für jede Kombination zu ermitteln. Der „Weight“-Header gruppiert alle „kg“-Werte miteinander, und die Gruppierung nach „Combinations“ ergibt eine Zeile pro Kombination. Wiederholen Sie diesen Vorgang für „Value“ ($).  Experten-Tipp: Felder umbenennen     Das Kreuztabellen-Tool hat den Nachteil, dass es nicht besonders gut mit Sonderzeichen in Feld-Headern umgehen kann, inklusive Leerzeichen. Dies bedeutet, dass der Feld-Header „a a“ im Ergebnis als „a_a“ abgebildet wird. Dies mag manchmal unpraktisch sein, aber bei der Entwicklung der Alteryx Engine haben wir mehr auf Geschwindigkeit und Effizienz als auf das Erscheinungsbild der Header geachtet. Machen Sie sich keine Sorgen, denn dieses Problem hat eine praktische Lösung (eigentlich sogar mehrere Lösungen!), die ein fantastisches Tool mit dem Namen Dynamisch umbenennen verwendet. Normalerweise gehe ich wie folgt vor:     Beachten Sie das Alteryx-Ergänzungspaket für die in diesen Anwendungsfällen gezeigten Workflows. Beim Extrahieren der Inhalte wird eventuell ein Fehler angezeigt, der sich jedoch nicht auf die Ausführung des Workflows auswirkt.   Inzwischen sollten Sie das Kreuztabellen-Tool im Schlaf beherrschen! Schreiben Sie uns unten in den Kommentaren, falls Ihnen ein Anwendungsfall einfällt, den wir ausgelassen haben! Haben Sie das Tool schon gemeistert? Schreiben Sie uns an community@alteryx.com, falls Sie Ihre kreative Nutzung des Tools in einem Artikel zur Tool-Beherrschung präsentieren möchten.   Lesen Sie unsere neuesten Tool-Beiträge jeden Dienstag, indem Sie Alteryx auf Twitter folgen! Abonnieren Sie unsere E-Mail-Benachrichtigungen, um Experteninformationen zu allen Designer-Tools zu erhalten.
Vollständigen Artikel anzeigen
Beschriftungen