Free Trial

Blog - Deutsch

Erkenntnisse und Ideen von den besten Analytics-Experten.
RolandSchubert
16 - Nebula
16 - Nebula

Das Sort Tool wird in vielen Workflows gebraucht. Vielleicht sollen die Artikel mit dem höchsten (oder auch niederigsten) Umsatz ausgewählt werden - da muss natürlich zuerst mal sortiert werden. Vielleicht müssen auch Daten in die richtige Reihenfolge gebracht werden, um ein Multi-Row Formula Tool richtig anwenden zu können. Oder aber es geht schlichtweg darum, eine Kundenliste nach den Namen der Kunden zu sortieren. Und es ist ja auch ganz einfach, das Sort Tool anzuwenden: 

 

P002.jpg

 

Der Input Anchor wird einfach mit dem Tool verbunden, das die Daten liefert, die sortiert werden sollen, dann müssen nur noch das Feld/die Felder gewählt werden, nach dem/denen sortiert weden soll, und schließlich ist die Richtung vorzugeben (aufsteigend oder absteigend). Wenn mehrere Felder gewählt werden, kann übrigens die Sortierreihenfolge  für jedes Feld individuell festgelegt werden. Fertig! 

 

Na ja, nicht ganz fertig. Denn es gibt da ja noch diese Zeile über den Auswahlboxen, in der  standardmäßig "Use Dictionary Order" und die jeweilig eingestellte Sprache ausgewählt ist.

P003.jpg

 

In dem meisten Fällen passt der Standard ganz gut, aber manchmal eben doch nicht. Also schauen wir uns die Einstellungen und ihre Auswirkungen mal genauer an.  

 

 

Dictionary Order - ja oder nein?

 

Zunächst einmal können wir entscheiden, ob die sogenannte "Dictionary Order" verwendet werden soll. Unter "Dictionary Order", also "Wörterbuch-Reihenfolge", kann man sich ja vielleicht etwas  vorstellen. Aber, was ist eigentlich die Alternative?

 

Wenn die Dictionary-Order-Option nicht gwählt ist, wird nach Unicode sortiert, Dann wird auch die Sprachauswahl, die sonst zur Verfügung steht, deaktiviert.

 

P08.jpg

 

Die Sortierreihenfolge wird dann von folgender Tabelle abgeleitet:

 

P04.jpg

 

Beim Vergleich von zwei Zeichenfolgen (etwa "ABC" und "abc"), die sortiert werden sollen, wird für die entsprechenden Zeichen (hier also "A" und "a", "B" und "b" usw.) geprüft, in welcher Reihenfolge sie in der Tabelle auftauchen - dabei wird zuerst auf die Zeile, dann auf die Spalte geschaut. Im Beispiel kommt "A" vor "a", also wäre bereits nach dem ersten Zeichen entschieden: "ABC" wird vor "abc" einsortiert (wenn für die Spalte "ascending" gewählt wurde). 

 

Schauen wir uns dazu ein Beispiel an.

 

P05.jpg

 

Die Großbuchstaben (ausgenommen Umlaute wie etwa "Ä")  rücken an den Anfang, dahinter reihen sich Kleinbuchstaben ein, Umlaut (wieder zuerst Groß- dann Kleinbuchstaben) folgen danach.

 

Was passiert aber, wenn die Liste nicht nur Texte, sondern auch Zahlen beinhaltet? Schauen wir uns auch das einmal an:

 

P06.jpg

 

In der Unicode-Tabelle finden wir die Ziffern vor den Buchstaben, also werden diese Zeilen entsprechend einsortiert. Etwas verwirrend ist vielleicht auf den ersten Blick, dass hier "1111" von "121" kommt - intuitiv sortiert man Zahlen ja doch immer nach ihrer Größe.  Wenn man allerdings die Zeichenfolgen betrachtet, ist klärt es sich auf, beim Vergleich der einzelnen Zeichen von links nach rechts entscheidet die "2" die Sortierung.

 

Wichtig: Ein Feld, das nur Zahlen enthält, aber einen String-Datentyp hat, wird auch nach dieser Logik sortiert. Für alle numerischen Datentypen gilt das natürlich nicht!

 

 

Und wenn Dictionary Order gewählt wird?

 

Schalten wir nun die Dictionary Order wieder ein,  wird das Sprachauswahl-Feld wieder aktiviert - wir haben jetzt also nicht mehr eine einheitliche, international gültige Reihenfolge, sondern folgen den Besonderheiten der gewählten Sprache; dabei wird zusätzlich auf landesspezifische Regelungen Rücksicht genommen.

 

P07.jpg 

 

Mitunter stehen zusätzlich noch weitere Varianten zur Verfügung.; für Deutschland gibt es etwa noch zwei Versionen - "Dictionary" und "Phone Book (DIN)". Natürlich ist auch die "Dictionary"-Variante streng nach DIN geregelt, auch wenn es nicht explizit so bezeichnet ist, aber im Detail unterscheiden sich die beiden Versionen ein wenig (und auch geringfügig von anderen Formen, wie etwa German (Austria)).

 

Sortieren wir unsere Beispieldaten mit der Einstellung "Dictionary", so erhalten wir das folgende Ergebnis:

 

P09.jpg

 

Sieht schon etwas anders aus. Auffällig ist, dass hier nicht grundlegend zwischen Groß- und Kleinschreibung unterschieden wird, sondern die Buchstaben als solche über die Sortierung entscheiden; dabei stehen die Kleinbuchstaben jeweils vorn. Die Umlaute folgen dabei auf den entsprechenden Grundbuchstaben, während "ß" in der Reihenfolge vor dem "s" eingeordnet wird.

 

Die Unterschiede zur "Phone Book" Sortierung sind relativ gering, aber nicht unwesentlich. Hier werden nämlich "ae" und "ä" sowie alle anderen entsprechenden Kombinationen gleichgesetzt - für unterschiedliche Schreibweisen, zum Beispiel in einen Kundenliste, die aus verschiedenen Quellen gespeist wird, kann diese Sortierung auch ihre Vorteile haben:

 

P10.jpg

 

Generell kommt es also immer auf den jeweiligen Zweck der Sortierung an, entsprechend sollte die Reihenfolge gewählt werden. In vielen Fällen wird sicherlich der Standard genügen, aber manchmal wird eine andere Einstellung notwendig sein. 

 

Apropos Standard: Den kann man über die "Localization" einstellen. Zusätzlich zur Sprachauswahl finden wir hier auch die "Localization Settings" und können dort die "Default Sort Method" wählen, im Sort Tool aber natürlich immer noch anpassen.

 

P11.jpg

 

 

 

 

Weitere Tipps Tuesday Beiträge

Dieser Eintrag ist Teil der Tipps Tuesday-Serie, alle Einträge dieser Serie findest du in unserem Index aufgelistet.

Beschriftungen