Häufig kommt in Gesprächen das Thema-Datenqualität auf; doch wie stellt man diese sicher? Das Data-Health Tool ist eine einfache Möglichkeit dies zu erreichen. Der heutige Tuesday Tipp stellt dir das Tool genauer vor.
Das Data-Health Tool ist Teil der Intelligence Suite und daher den meisten Nutzern unbekannt. Solltest du es einmal ausprobieren wollen, so findest du weiter unten einen Link zur 30-tätigen Testversion.
Wie wird das Tool verwendet?
Das Tool kann und sollte direkt nach dem Einlesen der Daten verwendet werden um die Qualität so früh wie möglich im Prozess korrigieren zu können.
Welche Einstellungen gibt es?
Im Grunde muss man gar nichts einstellen, da es nur zwei Kleinigkeiten gibt, welche man anpassen kann. Zum einen ob die Score-Scala von 0-100 gehen soll oder von 0-1, sowie die Möglichkeit die Empfehlungen basierend auf dem Score zu treffen.
Was bekommen wir als Output?
Zunächst einmal sollte man immer einen Blick mit einem Browse-Tool auf das Ergebnis des R-Ankers werfen. Hier erhalten wir einen Report, welcher eine schnelle und gute Übersicht über die Qualität bietet.
R-Anker
Zunächst einmal bietet eine Tachometer-Grafik einen guten Überblick über das Gesamtbild der Daten. In den nächsten drei Grafiken geht es dann ins Detail (siehe Screenshots).
Der S-Anker
Der S-Anker beinhaltet detailliertere Statistiken und Empfehlungen um die Datenqualität zu verbessern. Abhängig vom Datentyp werden dabei unterschiedliche Kriterien zur Last gelegt.
Der O-Anker
Zu guter Letzt gibt es den O-Anker welche Outlier (deutsch: Sonderfälle / Ausnahmen) enthält. Aus Outlier bezeichnet man Werte die statistisch stark vom Standard abweichen. Diese sollten in Analysen häufig außen vorgelassen werden, damit sie die Ergebnis nicht verfälschen. Wieso? Nehmen wir einmal an, dass Elon Musk oder Bill Gates ein Haus in einem 100 Seelen Dorf kaufen würden. So wäre das durchschnittliche Vermögen plötzlich bei hunderten Millionen Euro, aber in Wirklichkeit ist jeder nur Normalverdiener. Es wäre daher sinnvoll diese auszuklammern oder einzeln genauer zu untersuchen. Als Ergebnis erhalten wir daher eine detaillierte Auflistung als Outlier.
Wie kann ich die Intelligence testen?
Am einfachsten lässt sich das ganze über das Trial / die Testversion ausprobieren. Dadurch kann man dieses und viele weitere Tools kostenlos für 30 Tage testen. Das Trial findet ihr hier.
Weitere Tipps Tuesday Beiträge
Dieser Eintrag ist Teil der Tipps Tuesday-Serie, alle Einträge dieser Serie findest du in unserem Index aufgelistet.
Debe ser un usuario registrado para añadir un comentario aquí. Si ya está registrado, inicie sesión. Si todavía no está registrado, hágalo e inicie sesión.
Asunto | Me gusta |
---|---|
1 |