Free Trial

Blog - Deutsch

Erkenntnisse und Ideen von den besten Analytics-Experten.
StephV
Alteryx Alumni (Retired)

Nachdem wir Ihr Feedback gehört haben, wurde uns eines klar: Ein Citizen Data Scientist ist nicht eine Person in einer bestimmten beruflichen Rolle und mit bestimmten Fähigkeiten, sondern umfasst ein Vielzahl von Rollen mit unterschiedlichen Analyseanforderungen und Wissensniveaus. Um den Anforderungen jeder Rolle gerecht zu werden, in der Sie möglicherweise tätig sind, freue ich mich, ankündigen zu können, dass wir das Intelligence Suite Toolset für Machine Learning um vier neue Tools erweitern: Data Health, AutoML, Feature Types und Build Features. Drei davon – AutoML, Feature Types und Build Features – haben wir mithilfe der Data-Science-Bibliotheken unserer Innovation Labs entwickelt. Sie können das Potenzial dieser Open-Source Python-Pakete in einem Alteryx-Workflow jetzt voll ausschöpfen. Das vierte ist ein neues Tool, mit dem Sie vor dem Training Ihres Modells schnell herausfinden können, wie gut Ihre Daten sind.

 

Data Health

Ganz gleich, ob Sie gerade erst angefangen haben, sich als Citizen Data Science zu engagieren, oder Ihre Machine-Learning-Pipeline optimieren möchten: Das Data Health-Tool ist genau das Richtige für Sie.  Mit dem Data Health-Tool können Sie den Zustand Ihrer Daten für die Prognosemodellierung überprüfen.

StephJ_0-1612868807070.png

 

Das Tool gibt Ihnen einen Einblick in Ihren Datensatz, indem es sich auf sechs Metriken konzentriert: fehlende Werte, Einmaligkeit, Datendichte, unäre Felder (wie IDs) und Ausreißer. Auf diese Weise können Sie Probleme mit Ihren Daten beheben und auf Anhieb ein optimales Modell erstellen. Die Konfiguration ist einfach: Sie brauchen lediglich auszuwählen, ob Sie die Ergebnisse auf einer normalisierten Skala (0–1) oder einer Prozentskala (0–100 %) ausgeben möchten. Das Tool liefert dann die Bewertungen auf Grundlage der sechs Metriken. Würden Sie gerne mehr erfahren? Passende Hilfe-Dokumente finden Sie hier.

 

 

 

StephJ_1-1612868807084.png

 

Feature Types und Build Features

Wenn Sie bereits über etwas mehr Erfahrung verfügen (bereits mit der Nutzung von Assisted Modeling vertraut sind) und Ihre Datentypen anreichern oder neue Features generieren möchten, verwenden Sie die Tools Feature Types und Build Features, um Ihre Modelle zu optimieren. 

 

StephJ_2-1612868807085.png

 

Das Tool Feature Types erkennt erweiterte Datentypen. Erweiterte Datentypen sind eigentlich nur schicke Versionen regulärer Datentypen. So würde beispielsweise eine fünfstellige Zahl im Basisdatentyp als numerisch charakterisiert werden. Im erweiterten Datentyp jedoch könnte sie als US-Postleitzahl erkannt werden. Standardmäßig erkennt das Feature Types-Tool  automatisch erweiterte Typen des Datenfelds, wenn Sie den Workflow ausführen. Sie können den automatisch erkannten Typ überschreiben, indem Sie den Datentyp in der Spalte Change Type angeben.

 

Das Feature Types-Tool  ist eine erforderliche Eingabe im Build Features-Tool  für ein effektives Feature-Engineering und eine optionale Eingabe für das Data Health-Tool  zur Verbesserung der Berichtsausgabe.

 

 

StephJ_3-1612868807086.png

Das Tool Build Features erstellt automatisch neue Features aus Ihren vorhandenen Daten. Auf diese Weise können Sie Ihre Daten so formatieren, dass das Machine-Learning-Modell sie analysieren kann, was die Wahrscheinlichkeit erhöht, dass das Machine-Learning-Modell aussagekräftige Muster findet. Es hilft, indem es Variablen aufdeckt, die Sie möglicherweise nicht berücksichtigt (oder priorisiert) haben. Sie können beispielsweise eine Spalte für „Geburtsdatum“ in neue Features wie „Alter“ oder „Geburtsmonat“ umwandeln.

 

 

StephJ_4-1612868807095.png

 

StephJ_5-1612868807096.png

 

Auto ML

Wenn Sie sichergestellt haben, dass Ihre Daten fehlerfrei sind, und mit der Modellierung fortfahren, sollten Sie Ihren Workflow für das Modelltraining in Alteryx Analytics Hub oder Server planen. Alle Machine-Learning-Tools der Intelligence Suite funktionieren hervorragend in Hub- und Server-gehosteten Workflows, und einen Modelltrainings-Workflow so zu planen, dass das Modell regelmäßig neu trainiert wird, ist eine hervorragende Möglichkeit, um die optimale Leistung Ihres Modells zu gewährleisten.

 

Was aber, wenn Sie davon ausgehen, dass sich Ihre Trainingsdaten im Laufe der Zeit stark ändern werden? In diesem Fall möchten Sie vielleicht die Flexibilität haben, Ihren Modellalgorithmus automatisch zu aktualisieren, damit er optimal zu Ihren neuesten Trainingsdaten passt (z. B. mit einem Wechsel von einem Random-Forest-Modell zu einem XGBoost-Modell), anstatt sich auf den Algorithmus festzulegen, den Sie bei der ersten Erstellung des Workflows für das Modelltraining ausgewählt haben (z. B. immer ein Random-Forest-Modell anzupassen).

 

Falls das so ist, haben wir ein Tool für Sie, das so einfach anzuwenden ist, wie Assisted Modeling, und perfekt für diese Situation geeignet ist. Mit dem AutoML-Tool können Sie ein Modell ohne die Popup-Benutzeroberfläche des Assisted Modeling trainieren, und es wählt auf intelligente Weise den am besten geeigneten Algorithmus für Sie aus. Obwohl das AutoML-Tool nicht über die gleiche Benutzerführung verfügt wie das Assisted Modeling, bietet es doch die gleiche Leistungsfähigkeit wie die  EvalML-Automodellierungs-Bibliothek in einem einzigen, eigenständigen Alteryx-Tool. Um das AutoML-Tool zu nutzen, wählen Sie einfach Ihre Zielvariable aus. Von dort aus wird die Machine-Learning-Methode automatisch auf Grundlage der Modellschätzung konfiguriert. Sie können sie jedoch jederzeit überschreiben, indem Sie die Machine-Learning-Methode manuell auswählen.

 

Dieses Tool kann auch nützlich sein, wenn Sie ein sehr fortgeschrittener Benutzer sind, der schnell effektive Machine-Learning-Modelle direkt in einem Workflow erstellen oder Analyse-Apps erstellen möchte, die bei jedem Durchlauf ein neues trainiertes Modell auswählen.

 

Probieren Sie es selbst aus

Das Data Science Innovation-Team  hat hart daran gearbeitet, die Entwicklungen von FeatureLab in die Alteryx Intelligence Suite zu integrieren. Sie können das Starter-Kit für die Intelligence Suite jetzt herunterladen und die vorgefertigten Vorlagen mit Musterdaten, Workflows und Anwendungsbeispielen erkunden. Diese neuen Tools sind mit einer Alteryx Intelligence Suite-Lizenz in Designer Version 2021.1 verfügbar (Wenden Sie sich an Ihren Kundenbetreuer!) und bieten Muster-Workflows (Hilfe > Muster-Workflows > Lernen Sie ein Modell nach dem anderen), um Ihnen den Einstieg zu erleichtern. In diesem Beitrag finden Sie außerdem ein detailliertes Beispiel zur Verwendung der neuen Tools.

 

 

*Der Beitrag "Automated Feature Engineering with Alteryx Intelligence Suite" wurde in Community Blog veröffentlicht und von  @sprakasam geschrieben.

Beschriftungen