Dieser Artikel gehört zu unserer Tool Mastery Serie, einer Zusammenstellung von Beiträgen in der Wissensdatenbank mit verschiedenen Arbeitsbeispielen für Designer-Tools. Er befasst sich mit der Nutzung des Fuzzy-Übereinstimmungs-Tools auf unserem Weg, den Umgang mit Alteryx Designer zu erlernen.
Ähnlich wie bei der Excel-Fuzzy-Suche vereinfacht das Fuzzy-Übereinstimmungs-Tool (Anwendungsbeispiel hier) die Suche nach nicht exakten Übereinstimmungen in Ihren Daten. Durch Spezifizieren von Ähnlichkeit-Schwellenwerten, Anwenden unterschiedlicher Übereinstimmungs-Algorithmen sowie Angabe weiterer Konfigurationsoptionen können Sie das Tool so anpassen, dass es am besten zu Ihrem Datensatz passt. Aufgrund der umfangreichen Anpassungsmöglichkeiten des Tools empfehlen wir, dass Sie sich unsere einleitenden und weiterführenden Live-Schulungsvideos ansehen, wenn das Tool in komplexeren Anwendungen eingesetzt werden soll. Weiterhin ergänzen unsere häufig gestellten Fragen und die Tipps und Tricks zum Thema Fuzzy-Übereinstimmung die Informationen zur Nutzung des Tools!
Im Leben sind nur wenige Dinge schwarz und weiß. Wir finden überall Grauzonen und ihre Grenzen können verschwimmen. Gleiches gilt für Daten – insbesondere, wenn sie von Menschen eingegeben werden. Aus diesem Grund haben wir das Fuzzy-Übereinstimmungs-Tool entwickelt. Wenn Ihre Daten nicht klar sind, können Sie dennoch eine Wertschöpfung aus Ihren Datensätzen erzielen, indem Sie diese mit etwas vergleichen, das etwas stärker standardisiert ist. Dies kann bei Folgendem hilfreich sein:
Bereinigen (Duplikatentfernung) eines einzelnen Datensatzes von doppelten Einträgen (siehe Fuzzy Match.yxmd im Anhang):
Zusammenführen zweier Datensätze und Bestimmen redundanter Datensätze (siehe Fuzzy Match.yxmd im Anhang):
Hinweis: Es wird dringend empfohlen, zunächst eine Bereinigung (Duplikatentfernung) jedes Ihrer zusammenzuführenden Datensätze vorzunehmen, bevor Sie diese im Zusammenführungsmodus nutzen, um alle redundanten Übereinstimmungen zu entfernen – dies bewirkt eine erhebliche Beschleunigung des Abgleichs.
Durchführen von Zeichenfolgenvergleichen, Bereinigungen und Schlüsselwortabgleichen
Diese Techniken unterstützen Sie bei der Identifizierung ähnlicher Namen, Adressen, Telefonnummern und selbst falsch geschriebener Wörter in Ihren Daten und ermöglichen exakte Analysen nicht exakter Zeichenfolgen.
Wenn Sie mit Namen arbeiten, lesen Sie bitte unseren Leitfaden für Nickname-Fuzzy-Übereinstimmungen. Wenn Sie den Übereinstimmungs-Schwellenwert so weit lockern müssen, dass manche Zeichenfolgen-Übereinstimmungen nicht korrekt erkannt werden, während andere keine weiteren Ergebnisse mehr liefern, versuchen Sie, den Abgleich mit einem anderen Fuzzy-Übereinstimmungs-Tool lediglich für die Zeichenfolgen mit dem niedrigeren Schwellenwert durchzuführen, die Sie hinzufügen möchten, und führen Sie diese wieder mit dem abgeglichenen Datensatz zusammen.
Nun sollten Sie über Expertenkenntnisse für die Nutzung des Fuzzy-Übereinstimmungs-Tools verfügen! Falls Sie einen Anwendungsfall kennen, den wir ausgelassen haben, können Sie gerne nachstehend einen Kommentar hinterlassen!
Sehen Sie sich schon als Tool-Meister? Schreiben Sie uns an Stephanie.jansen@alteryx.com, wenn Sie Ihre kreativen Tool-Anwendungsbeispiele in einem Artikel der Tool Mastery Serie vorstellen möchten.
Haben Sie noch Fragen? Die deutsche Community ist hier, um sie im Forum zu beantworten.
Wenn Sie alle Designer-Tools beherrschen möchten, abonnieren Sie unsere E-Mail-Benachrichtigungen.
*Dieser Beitrag wurde von @MattD geschrieben.
Vollständigen Artikel anzeigen