Free Trial

Blog - Deutsch

Erkenntnisse und Ideen von den besten Analytics-Experten.
grossal
15 - Aurora
15 - Aurora

Dieser Beitrag ist Teil einer fünfteiligen Serie, in welcher ich die Hauptbestandteile meines Workflow-Bauens behandeln werde. Die Serie folgt dabei einem meiner Projekte, welches ich am Ende auch anhängen und in der Public Gallery veröffentlichen werde. Die einzelnen Beiträge enthalten dabei immer einen allgemeinen und einen am Projekt angelehnten Teil.

 

  • Teil 1: Die Vorgehensweise
  • Teil 2: Idee, Plan und erster Prototyp
  • Teil 3: Mit Problemen umgehen
  • Teil 4: Workflow aufräumen
  • Teil 5: Das Ergebnis

 

Mit Problemen umgehen

Früher oder später stoßen wir eigentlich in jedem Projekt auf Probleme und das ist in meinen Augen per-se nichts Schlechtes. Projekte ohne Herausforderungen werden auf Dauer langweilig. Natürlich spricht nichts gegen ein entspanntes Projekt hier und da, aber am Ende des Tages suchen wir doch die Herausforderung, um besser werden zu können oder wie Alteryx es sagen würden "The Thrill to solve".

 

In Alteryx gibt es verschiedenste Möglichkeiten mit Problemen umzugehen – abhängig von der Art der Probleme. Ich unterscheide dabei gerne zwischen zwei Arten von Problemen:

 

1) Unter Wissenslücken fallen für mich alle Probleme, bei denen ich einfach nicht weiß, wie ich das Problem lösen soll.

 

2) Technische Problem dagegen sind Probleme, bei denen ich weiß, wie es gehen müsste, es aber nicht wie gewünscht funktioniert und meine Daten nicht so aussehen, wie sie es eigentlich sollten. 

 

 

Wissenslücken

Ich stelle, die vielleicht etwas gewagte Behauptung auf, dass weder ein Alteryx-ACE noch kompetenteste Alteryx-Mitarbeiter alle Tools, mit all ihren Stärken und Schwächen in ihrer Gänze kennt. Alteryx bietet eine enorme Bandbreite an Tools aus sehr verschiedenen Bereichen an. Die meisten von uns spezialisieren sich im Laufe der Zeit auf ein paar Bereiche, die sie häufig brauchen und benötigen. Und das ist auch gar nicht schlimm. Warum sollte man jeden Trick und jeden Kniff der Geodaten-Tools können, wenn man nie im Leben damit arbeitet?

 

Was mache ich nun also am besten, wenn ich nicht weiß, wie ich ein Problem lösen kann? Die Antwort ist simple: Fragen, Fragen und Fragen! Aber wen? Wo? Wie?

 

1) Kollegen

Meine erste Anlaufstelle sind eigentlich immer Kollegen. Es ist viel leichter mit einem Kollegen mal kurz gemeinsam auf einen Workflow zu schauen und darüber zu sprechen, was man eigentlich erreichen will, als das ganze im Netz zu suchen. Wichtig ist aber auch: Eine gute Erklärung, was die Ausgangssituation ist und wo man eigentlich hin will, hilft ungemein. Selbst wenn Kollegen einem nicht helfen können, so wissen sie oft, wonach man suchen muss oder wie das entsprechende Tool heißen müsste. Mit dem Tool-Namen kann man dann bspw. die Beispiele im Designer, der Tool-Masterserie oder Lernserien durchsuchen.

 

2) Community durchsuchen 

Wenn einem die Kollegen nicht weiterhelfen können oder man vielleicht als einziger in der Firma mit Alteryx arbeitet, hilft oft ein Blick in die Community. Viele der Fragen wurden bereits gestellt und von anderen beantwortet. Dies kann man auf mehrere Art und Weisen machen, unter anderem über die Suche im Designer.

 

grossal_0-1589104134629.png

 

Ich persönliche bevorzuge aus Bequemlichkeit aber oft den Weg über den Browser und tippe "Alteryx [Suchbegriff]" in Google ein. Meist ist bereits unter den ersten 3 Treffern bei Google die gewünschte Lösung dabei. Oft besteht hier auch der Trick darin, die Suche auf Englisch einzugeben, da die englische Community schon viel länger existiert.

 

Wie finde ich den englischen Namen eines Tools? In der neuesten Version (2020.1) geht das ganz einfach:

grossal_1-1589104302268.png

 

Sobald die Sprache umgestellt ist, werden alle Tool-Namen auf Englisch angezeigt, so dass man diese leicht in seine Suchanfrage mit aufnehmen kann.

 

Technische Probleme

 

Technische Problemen können zwar teils auch mit 2) behoben werden, benötigen aber viel öfter eigentlich 3). 

 

3) Community selbst befragen

Ist das eigene Problem zu spezifisch oder man findet einfach keinen Beitrag dazu, so gibt es immer noch die Möglichkeit, selbst einen Post in der (deutschen) Community zu machen und Hilfe zu erfragen. Scheue dich nicht davor, ich habe bis jetzt nur freundliche und hilfsbereite Menschen in der Community getroffen.

 

Damit Andere die eigenen Probleme möglichst gut und schnell lösen können, sollte man ein paar Sachen beachten:

 

a) Beispiel-Daten anhängen

Sollte es möglich sein, dann hängt ein paar Beispiel Daten an. Sollte dies nicht möglich aufgrund des Datenschutzes sein, so genügen in den meisten Fällen auch schon Pseudo-Daten, welche die Struktur der Daten abbilden.

 

b) Struktur der Lösung anhängen/darstellen

Daten sprechen viel deutlicher als Worte. Beispiel und Lösungsformat (wie es auch in den Weekly-Challenges der Fall ist) helfen meist am besten, die Probleme zu lösen. Das könnte bspw. so aussehen:

 

 

2020-05-12 21-33-16.png

 

Bei Excel-Problemen kann es auch häufig sinnvoll sein, die Excel-Tabelle selbst anzuhängen. Die meisten Alteryx-User haben schon mit Excel gearbeitet und können dadurch noch leichter nachvollziehen, was du meintest und wie dein Problem gelöst werden könnte.

 

c) Workflow/Screenshots anhängen

In einigen Fällen steht man auch vor der Frage "Warum sehen meine Daten nach dem Tool nicht so aus wie erwartet". In diesen Fällen kann es oft auch sinnvoll sein, den Workflow oder Screenshots anzuhängen. Diese ermöglichen es, einen guten Einblick in die Konfigurationen zu bekommen.

 

d) Gute Beschreibung

Zu guter Letzt hilft natürlich auch eine gute Beschreibung bei der Lösung enorm. Denkt dabei am besten daran, dass die anderen euren Workflow/ euer Problem nicht so gut wie ihr kennen und beschreibt euer Problem dementsprechend genau.

 

Eine weitere Möglichkeit wäre auch das Virtual Solution Center, bei dem ihr direkt mit einem Alteryx Solution Engineer Kontakt aufnehmen könnt.

 

 

Über welche Probleme bin ich im konkreten Projekt gestoßen und wie habe ich sie gelöst?

 

1) Vielfaches Herunterladen

Nachdem es im Prototyp eigentlich hervorragend funktionierte, merkte ich schnell, dass ich beim mehrfachen ausführen in Probleme lief und plötzlich keine Daten mehr zurückbekam. Plötzlich war die Rede von einem HTTP: 500 "Internal Server Error".

 

grossal_0-1589105505132.png

 

Ich habe dies daher kurzerhand in Google eingegeben: 

 

Frage_88_.png

Bereits der erste Google-Treffer liefert einen Post, in dem jemand genau das gleiche Problem hatte. Warum tritt das Problem auf? Webseiten wollen sich natürlich vor Bots und massenhaften Anfragen schützen und ignorieren daher Bots gerne. Die Lösung: Der Webseite vorgaukeln wir wären kein Bot indem wir einen User-Agent hinzufügen:

 

 

2020-05-10 12-24-54.png

 

2) Geiz beim Datentyp

Ich geize oft bei der Länge von Strings beim Festlegen des Datentyps. Werden die Texte dann plötzlich doch etwas länger, so werden sie abgeschnitten. Meist passiert das auch nicht im ursprünglichen Feld, sondern wenn ich mit einer Formel noch einen paar Worte oder eine Information hinzufüge. Obwohl ich im konkreten Fall 128 Zeichen spendiert hatte, wurden einige Beispiele scheinbar länger, so dass sie abgeschnitten wurden. Wichtig ist in solchen Fällen vor allem, dass man bemerkt, dass der Text abgeschnitten wird, da dies beim stichprobenartigem Testen oft gar nicht auffällt. Ich arbeite aktuell noch daran, mir meinen Geiz etwas abzugewöhnen und immer 2-3 höhere 2er Potenzen zu verwenden.

 

 

3) Probleme mit den Daten

Dies sind bei Projekten meist die kompliziertesten Probleme. Warum fehlen einige Werte? Warum klappt die Formel zu Datenextraktion nach 200 erfolgreichen Konvertierung bei der 201ten nicht mehr? Weil die zugrundeliegenden Daten sich geändert haben.

 

Warum? Das weiß wohl nur Alteryx, aber bei allen Posts die älter als 1 Monat sind, wird ein anderes Datums-Format verwendet.

 

grossal_0-1589106982104.png

 

Während bei Posts im letzten Monat darunterliegend ein einzelnes Datumsfeld existiert, so sind es bei älteren Posts zwei Felder, so dass die Extraktion fehlschlägt. Nach einer Erweiterung meiner Formel funktionieren nun auch diese Datumsangaben.

 

4) Probleme mit den Daten II

Ein weiteres Problem bemerkte ich beim Überprüfen der Summe der ermittelten Likes und Lösungen. Während die Likes 1:1 mit denen auf der Webseite übereinstimmten, so zeigten mir die Lösungen plötzlich mehr. Um das Problem zu verstehen, muss man verstehen wie ich "Lösungen" ermittle:

 

grossal_1-1589107207360.png

 

Während der Haken im rechten oberen Eck indiziert, dass ein Post allgemein eine Lösung hat, so indiziert der Haken links neben dem Post-Titel, dass dieser Beitrag eine Lösung ist. Anfangs hatte ich auch hier einen ähnlichen Fehler, wie zuvor beim Datum, erwartet und habe dann speziell die ältesten Lösungen analysiert. Das Ergebnis war Ernüchterung: Auch hier ist alles wie immer. Nach dem manuellen Überprüfen von allen Posts stand ich vor dem Problem: Alle Posts die einen grünen Haken haben, werden auch bei mir als Lösung erkannt und trotzdem stimmen die Zahlen nicht überein. In solchen Fällen sollte man zurück zur ursprünglichen Annahme kehren und diese war: Alle Posts sind mit diesen Haken markiert.

 

Genau darin lag der Fehler. Meine unterbewusste Annahme war: Die Seiten "Neueste Beiträge" und "Meine Akzeptierten Lösungen" unterscheiden sich nur in der Hinsicht, dass letztere nur eine "verkleinerte Version" sind.

grossal_0-1589107620238.png

 
 
 
 

grossal_4-1589107634001.png

 

Gewissermaßen stimmt das auch. Bei einem Abgleich kam aber auch heraus, dass Posts, welche ich selbst stellte und gelöst wurden, bei neuesten Beiträgen ebenfalls mit dem kleinen Haken vor dem Titel markiert werden, obwohl diese nicht von mir gelöst wurden, sondern von Anderen. Solche Fehler später zu beheben ist schwierig und nervenaufreibend. Konkret hat es mich fast einen halben Tag, zahlreiche Flüche und jede menge Nerven gekostet, um diesen Fehler zu beheben. 

 

Das Beste an diesem Fehler war wohl, dass ich ihn durch das Kriterium "messbar" von SMART (siehe vorheriger Artikel) zumindest erkannt habe und er nicht unter dem Radar durchgelaufen ist. Ein besserer und genauerer Plan hätte vermutlich auch diesen Fehler verhindern können. Der Plan hätte schließlich beinhalten können, dass alle Posts und Lösungen von zwei verschiedenen Seiten gecrawlt werden müssen. Erst recht, wenn man bedenkt, dass ich vorher wusste, dass es eine extra Sektion mit reinen Lösungsposts gibt. Die intuitive Annahme, dass diese in beiden Bereichen immer korrekt enthalten sind, wurde mir zum Verhängnis.

 

Wir werden Fehler nie vollständig verhindern können, aber wir können lernen damit umzugehen. Ich hoffe dir hat dieser Artikel und meine Vorgehensweise ein wenig dabei geholfen.

 

Autor: Alexander Groß

Bei Fragen könnt ihr mich gerne hier in der Community oder auf LinkedIn kontaktieren.

Beschriftungen