Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

Blog - Deutsch

Erkenntnisse und Ideen von den besten Analytics-Experten.
grossal
15 - Aurora
15 - Aurora

Häufig kommt in Gesprächen das Thema-Datenqualität auf; doch wie stellt man diese sicher? Das Data-Health Tool ist eine einfache Möglichkeit dies zu erreichen. Der heutige Tuesday Tipp stellt dir das Tool genauer vor.

 

Das Data-Health Tool ist Teil der Intelligence Suite und daher den meisten Nutzern unbekannt. Solltest du es einmal ausprobieren wollen, so findest du weiter unten einen Link zur 30-tätigen Testversion.

 

Wie wird das Tool verwendet?

Das Tool kann und sollte direkt nach dem Einlesen der Daten verwendet werden um die Qualität so früh wie möglich im Prozess korrigieren zu können.

grossal_0-1655032663653.png

 

 

Welche Einstellungen gibt es?

Im Grunde muss man gar nichts einstellen, da es nur zwei Kleinigkeiten gibt, welche man anpassen kann. Zum einen ob die Score-Scala von 0-100 gehen soll oder von 0-1, sowie die Möglichkeit die Empfehlungen basierend auf dem Score zu treffen.

grossal_1-1655032798264.png

 

 

Was bekommen wir als Output?

Zunächst einmal sollte man immer einen Blick mit einem Browse-Tool auf das Ergebnis des R-Ankers werfen. Hier erhalten wir einen Report, welcher eine schnelle und gute Übersicht über die Qualität bietet. 

 

R-Anker

 

grossal_2-1655032916874.png

 

grossal_3-1655032926952.png

 

Zunächst einmal bietet eine Tachometer-Grafik einen guten Überblick über das Gesamtbild der Daten. In den nächsten drei Grafiken geht es dann ins Detail (siehe Screenshots).

 

Der S-Anker

Der S-Anker beinhaltet detailliertere Statistiken und Empfehlungen um die Datenqualität zu verbessern. Abhängig vom Datentyp werden dabei unterschiedliche Kriterien zur Last gelegt.

 

grossal_4-1655033144916.png

 

 

Der O-Anker

Zu guter Letzt gibt es den O-Anker welche Outlier (deutsch: Sonderfälle / Ausnahmen) enthält. Aus Outlier bezeichnet man Werte die statistisch stark vom Standard abweichen. Diese sollten in Analysen häufig außen vorgelassen werden, damit sie die Ergebnis nicht verfälschen. Wieso? Nehmen wir einmal an, dass Elon Musk oder Bill Gates ein Haus in einem 100 Seelen Dorf kaufen würden. So wäre das durchschnittliche Vermögen plötzlich bei hunderten Millionen Euro, aber in Wirklichkeit ist jeder nur Normalverdiener. Es wäre daher sinnvoll diese auszuklammern oder einzeln genauer zu untersuchen. Als Ergebnis erhalten wir daher eine detaillierte Auflistung als Outlier.

 

grossal_5-1655033534067.png

 

 

Wie kann ich die Intelligence testen?

Am einfachsten lässt sich das ganze über das Trial / die Testversion ausprobieren. Dadurch kann man dieses und viele weitere Tools kostenlos für 30 Tage testen. Das Trial findet ihr hier.

 

Weitere Tipps Tuesday Beiträge

Dieser Eintrag ist Teil der Tipps Tuesday-Serie, alle Einträge dieser Serie findest du in unserem Index aufgelistet.

Beschriftungen