Alphabetisches Sortieren

Übersicht

Man kann Wörter nach verschiedenen Richtungen sortieren: entweder vom Wortanfang her (heute üblich) oder vom Wortende her (reimender Sort).
Bei Sprachen mit einfacher Silbenstruktur sind auch 2 gemischte Versionen denkbar: Worte werden vom Anfang her silbenweise sortiert, aber die Silben vom Ende her (reimende Endsilben); oder umgekehrt (sinnlos).
Die stärkste Reimwirkung erzielt eine Sortierung vom Wortende her zuerst nach allen Vokalen, dann nach Konsonanten.

Bei allen folgenden Beispielen legen wir die nach Tonhöhen geordnete Vokalfolge   i e a o   zugrunde




Sortierung:   vom Wortanfang her

Das ist die heute beim Latein-ABC übliche Sortierrichtung. Die Worte   ati ata oro osi oso ovi   werden in dieser Reihenfolge sortiert.




Sortierung:   vom Wortende her   (reimend)

Die Worte   osi ati ovi ata oro oso   werden in dieser Reihenfolge sortiert.
Diphtonge werden automatisch zusammen sortiert:   i  ei  ai  oi   e  a  o
Falls die Konsonanten nach den Vokalen im ABC stehen:   ei  ai  oi  ki   e  a  o

Nachteil:   Die Sortrichtung vom Wortende her herwiderspricht der Buchstabierrichtung beim Diktieren (vom Wortanfang her) - nachteilig, weil man beim Suchen im Lexikon geistig buchstabiert.

Vorteil:   Wörter, die sich reimen, liegen im Lexikon beieinander (oro oso in obiger Liste). Die Endsilben   si ti vi   folgen aufeinander, nicht die Endsilben   si se sa . Ein Dichter kann also einfach den betreffenden Lexikonabschnitt durchsuchen auf der Suche nach einem Reimwort. Bei geeigneter ABC-Ordnung ( i e a o statt a e i o ) liegen auch fast reimende Worte nahe beieinander.




Sortierung:   vom Wortende her, Vokale zuerst   (vokalisch reimend)

Obiger Sortmechanismus vom Ende her hatte das Ziel:   Je mehr sich Wörter reimen, desto näher sollen sie im Lexikon sein. Es gab dabei 2 Ausnahmen:

- Worte mit gleicher Endung, z.B. -si , liegen am engsten beisammen, aber 100 % gleiche Endungen reimen nicht gut (außer Diphtonge):   -si -si   reimt schlechter als   -si -ti . Ein 100 % reimendes Lexikon ist deshalb per se unmöglich.

- In der Folge  osi ati ovi  stört das mittlere Wort.   Schöner wäre   ati osi ovi

Letzteres wird erreicht, indem man vom Wortende her zuerst nach allen Vokalen sortiert, dann nach allen Konsonanten. Das Sortieren ist dann logisch komplizierter, aber musikalisch einfacher, weil reimender. (Praktikabel wäre dieser Sortmechanismus vor allem bei Sprachen mit Silbenstruktur Konsonant - Vokal, siehe folgendes Beispiel.) Die Worte   pili mini   kali pali   sala tala   werden dann in dieser Reihenfolge sortiert.




Beispiel:   Plansprache mit einfacher Silbenstruktur

Zur Veranschaulichung der weiteren Sort-Mechanismen entwerfen wir eine Plansprache (künstliche Sprache) mit folgendem phonetischen System:


         4  Vokale:                    i  e  a  o
         4  summende Konsonanten:      n  m  l  v
         4  nicht summende Kons.:      s  f  t  p

Alle Silben haben die Form "Konsonant + Vokal", z.B.   ti ta ki     Wortbeispiele:   ti sino pivili kapitano
Die Silbenstruktur Konsonant - Vokal ist auch für das Sortieren bzw. Suchen im Lexikon vorteilhaft, weil dann immer Konsonant mit Konsonant, Vokal mit Vokal verglichen wird (mit etwas Übung immer gleich Silbe mit Silbe, dann geht der Wortvergleich viel schneller). Im Alphabet sind ähnliche Laute eng beisammen, was den Wortvergleich intuitiver und schneller macht:

         ABC-Folge:    i  e  a  o      n  m  l  v      s  f  t  p






Sortierung:   Silbenweise vom Wortanfang, in Silben vom Ende her

Motivation: Die Silben   li si ti   klingen ähnlicher als die Silben   li le la , und Ähnliches sollte ja im Alphabet beieinander sein. Die Silben   li si ti   le se te   la sa ta   werden also in dieser Reihenfolge sortiert und nicht   li le la   si se sa   ti te ta  . Die Silben sind also wie die Vokale nach Tonhöhe geordnet. Andererseits ist eine Sortierung vom Wortanfang her praktischer. Dieser Sortmechanismus ist eine Kombination von beidem, der die Vorteile beider Methoden vereinigen will.

  mili vili mali vali visi posi siti   werden in dieser Reihenfolge sortiert.





Bewertung

Ergonomie allgemein:   Am einfachsten und praktischsten ist meist die Sortierung vom Anfang her, in Diktatreihenfolge.



Ergonomie schriftlich:   Auch bei geschriebenem Text ist i.A. die Sortierung vom Anfang her einfacher. Bei Worten, die in Spalten untereinander stehen, stehen dann automatisch die zu vergleichenden Buchstaben direkt untereinander (vgl. unten Zahlen).
Ausnahme: für Silbenschriften (Silbentyp Konsonant + Vokal), bei denen Silbenzeichen mit gleichem Vokal sehr ähnlich sind (z.B. gleiche Breite haben), ist Sortierung nach Zeichenähnlichkeit, also nach gleichem Vokal, also vom Ende her (zumindest innerhalb der Silbe), u.U. besser.



Sprachtyp:   Bei Sprachen mit typischen Wortenden für Substantiv, Adjektiv etc. werden bei Sortierung vom Wortende her alle Substantive zusammengefaßt, alle Adjektive etc. Das ist ein Vorteil, aber der Nachteil ist größer: laufen, Lauf und Läufer sind jetzt im Lexikon weit auseinander.



Reim:   Reimende Sortierung wird (nie perfekt) erzielt durch Sortierung vom Ende her, am meisten wenn zuerst nach allen Vokalen sortiert wird, am wenigsten wenn nur in der Silbe vom Ende her sortiert wird (Silbentyp Konsonant + Vokal)



Akzent:   Zur Sortierung vom Anfang her paßt ein Anfangsakzent der Worte, weil in beiden Fällen der Wortanfang stärker gewichtet wird. Entsprechend paßt zur Sortierung vom Ende her ein Endakzent der Worte.



Vergleich mit Zahlen:   Es ist ergonomisch, bei der alphabetischen Sortierung dieselbe Reihenfolge einzuhalten wie beim Wertvergleich von Zahlen (der ja auch, nach Längenvergleich, zeichenweise erfolgt)

Bei der 'westlichen' Zahlenschreibung werden die höherwertigen Stellen zuerst geschrieben und gesprochen (z.B. einhundertdreißig). Sie paßt also zur alphabetischen Sortierung vom Wortanfang her (bei der die ersten Buchstaben eines Wortes sozusagen eine höhere Wertigkeit haben als die letzten). Auch bei der Positionsangabe sind in den meisten Kordinatensystemen die vorderen Ziffern wichtiger.

Bei der arabischen Zahlenschreibung wird die Ziffer mit dem niedrigsten Stellenwert zuerst geschrieben. Dazu paßt die alphabetische Sortierung vom Wortende her (bei der die letzten Buchstaben eines Wortes sozusagen eine höhere Wertigkeit haben als die ersten).

Die niederwertigen Ziffern einer Zahl zuerst zu schreiben, hat folgende Vor- und Nachteile:
Beim ziffernweisen Hören / Lesen kennt man sofort den Stellenwert und damit die endgültige Bedeutung jeder Ziffer. Schreibt man Zahlen in Spalten untereinander, so stehen automatisch Ziffern mit gleichem Stellenwert untereinander, ohne daß man vor manchen Zahlen Leerräume lassen muß.
Andererseits ist es aber besser, beim Sprechen die hochwertigen Ziffern ( + Mengenbegriff wie tausend oder hundert) zuerst zu nennen, weil man dann sofort den ungefähren Zahlwert kennt.


Vergleiche hierzu:   Wertrichtiges alphabetisches Sortieren von Zahlen



EDV:   Eintippen und anschließenden Sortieren eines Wortes bewirkt logisch in der EDV:
- beim Sort vom Wortanfang her Zwischenspeicherung nach dem FIFO-Prinzip (first in, first out)
- beim Sort vom Wortende her Zwischenspeicherung nach dem LIFO-Prinzip (last in, first out), auch Kellerspeicher genannt, der oft besonders effizient ist. D.h. der zuletzt eingetippte Buchstabe wird zuerst wieder hergeholt und verarbeitet, mit den Endbuchstaben anderer Worte verglichen.





Die Benutzung der hier beschriebenen Techniken ist frei Stand: 18.7.05 Autor: Leonhard Heinzmann Homepage