Ein klares, schönes Lautsystem für künstliche Sprachen
Kurzbeschreibung
Eine künstliche Sprache, die als internationale Hilfssprache dienen soll,
muß für Leute mit unterschiedlichster sprachlicher Herkunft leicht
erlernbar sein. Nicht nur die Grammatik, sondern auch die Aussprache.
Wir zeigen, daß letzteres möglich ist, wenn man sich auf relativ wenige,
klare und gut unterschiedene Laute und Silben beschränkt. Die Sprache kann trotzdem
sehr gut klingen, und es lassen sich genug kurze Worte bilden.
Eine phonetisch klare Sprache erleichtert nicht nur die
zwischenmenschliche Verständigung bei schlechten Hörverhältnissen,
sondern ermöglicht auch fehlerfreie maschinelle Spracherkennung,
die bei den meisten natürlichen Sprachen unmöglich ist.
Kurz, ein sehr klares, einfaches phonetisches System kann die
menschlichen und technischen Bedürfnisse gut erfüllen.
Ein gut entworfenes einfaches Lautsystem ist nicht nur besser,
sondern wirkt auch natürlicher als die Lautsysteme der meisten
'natürlichen' Sprachen. Es ist deshalb nicht als primitiv,
sondern eher als zweckmäßig und human anzusehen.
Wir zeigen die Gesichtspunkte, die man bei einem Lautsystem berücksichtigen muß,
und stellen einige prototypische Lautsysteme vor.
Einzelne Laute
Folgende Vokale sind klangschön, klar, gut unterschieden und kommen in fast jeder Sprache vor:
i e a o
(e geschlossen wie in Telefon, nicht ä-ähnlich; a hell; o geschlossen wie in Ofen und relativ hell)
Auf u könnte man in musikalischer Hinsicht verzichten: es ist viel
dumpfer und unmusikalischer. Eine Person direkt gegenüber mit vielen
dunklen Wörtern anzureden, wird intuitiv als unfreundlich oder gar
bedrohlich empfunden. Auch wird m.E. ein Konsonant um so schlechter
gehört, je dunkler die benachbarten Vokale sind.
Wohl aus allen drei Gründen ist z.B. im Italienischen und Spanischen
u viel seltener als die anderen Vokale (ca. 1/3 bis 1/4). Umgekehrt
ist im Sumerischen u häufig, und im Akkadischen enden praktisch
alle Wörter auf -u: Hier diente die Rede sozusagen der Einschüchterung
des Gegenüber und allgemein dem Aufbau einer furchtsam-autoritären Stimmung.
y
Mit y verhält es sich umgekehrt wie mit u: es kommt nur in
wenigen Sprachen vor, wäre aber musikalisch
ein Gewinn und wird als freundlich empfunden.
Zwar sind Folgen von i und y, z.B. tityti, schwer sprechbar, aber sie
lassen sich gezielt vermeiden. Ich persönlich würde y dazunehmen.
Klangschönheit und geistig-seelische Bedeutung des y sind m.E. wichtiger
als der einmalige Lernaufwand.
Ähnliches wie für y gilt für den Laut ö (relativ hell).
Auch das nasale o könnte eine akustische Bereicherung sein,
wenn es nicht zu dunkel gesprochen wird.
Folgende Konsonanten sind m.E. für Menschen am leichtesten erlernbar:
s S f t k p l n m v
großes S = stimmloses sch wie in 'Schuh', v wie in 'Vase'. Statt sch
könnte man ch wie in 'ich' verwenden, es unterscheidet sich besser von s .
Die Laute b, d, g sollte man m.E. nicht verwenden, sie sind
p, t, k zu ähnlich und bei schnellem Sprechen oder gehäuftem Auftreten (tiditi)
von diesen kaum zu unterscheiden, außer am Wortanfang.
Obige 10 Konsonanten und 4 Vokale würden bereits ausreichen für
ein Lautsystem, es lassen sich damit genügend kurze Worte bilden.
Aber auf Dauer wirken diese 10 Konsonanten allein zu monoton.
Meiner Ansicht nach sollte man auf jeden Fall r
dazunehmen, es bringt viel Abwechslung in die Konsonanten.
Das kann man auch mit Konsonantenkombinationen erreichen (s.u.)
Lautkombinationen
Folgende Vokalkombinationen sind leicht sprechbar und machen eine
Sprache sehr wohlklingend:
ei ai oi ui ie ia io iei iai ioi iui ye ya yo yei yai yoi yui eie eia eio aie aia aio oie oia oio eiei eiai eioi aiei aiai aioi oiei oiai oioi ao iao (i-ao) eiao aiao oiao aui (au-i) iaui (ijau-i)
Es sind teils einsilbige Lautkombinationen: ei, ai, ... ao (ähnlich deutsch au, klingt aber schöner)
Teils zweisilbige: ie (sprich ije) haben wir mehr der Vollständigkeit wegen erwähnt, es ist nicht so klangschön wie ia, io.
Sprich iei wie ijei, ye wie üje, yei wie üjei, eiei wie eijei, etc ...
Die einzige 3-silbige Kombination ist iaui
Auf Konsonantenkombinationen kann und sollte man weitgehend verzichten:
Denn ein Konsonant ist neben oder zwischen anderen Konsonanten
schlechter hörbar (wohl z.T. deshalb, weil er dann verschliffen
ausgesprochen wird). Eine ästhetische Bereicherung des Klangbildes
wären m.e. die Kombinationen ts, ks (beide gut gesprochen nur je 1 Laut), st, sk, pr.
Auch nt, mp, ngk halte ich für wohlklingend, diese Laute sind aber am
Wortanfang unsprechbar, nach Vokalkombinationen wie aiai schwer sprechbar.
tsch (wie in Matsch) klingt m.E. etwas ordinär.
Unerwünschte Lautkombinationen (unästhetisch oder schwer aussprechbar) kann man
bei Freihand-Wortbildung leicht vermeiden. Nicht aber, wenn die Worte einer künstlichen
Sprache nach einem Prinzip gebildet werden (s. Hauptartikel
Entwurfsprinzipien, Wortbildung).
Denn auch schöne Laute können unangenehme Kombinationen ergeben: y und ö klingen ästhetisch,
aber die Vokalfolgen y-ö-y, ö-e-ö (mit Konsonanten dazwischen) sind schwer sprechbar und z.T unschön.
Hier muß man entweder das Wortbildungsprinzip so gestalten, daß solche Lautkombinationen vermieden werden,
oder von vornherein nur solche Laute wählen, die in jeder Kombination miteinander schön
oder akzeptabel wirken !
Silben- und Wortstruktur
Leicht sprechbar und wohlklingend sind Silben mit der Struktur "Konsonant + Vokal(kombination)". Am Wortanfang wären auch Silben der Struktur "Vokal(kombination)" möglich. Damit lassen sich z.B. folgende Worte bilden:
i a o ai oi ia ata ote ela itai oita sipa mile osipa elati solima takiti akipila
Offensichtlich sind diese Worte wegen der einfachen Laute und
der klaren Silbenstruktur leicht sprechbar, und auch klangvoll.
Auch die weiter vorn erwähnten 2-silbigen Vokalkombinationen haben eigentlich diese Silbenstruktur:
Z.B. klingt aia wie aja oder aija, die 2. Silbe hat also die Struktur Konsonant + Vokal.
Mit einem einfachen, klaren phonetischen System können etwa genauso viele
akustisch gut unterschiedene Worte gebildet werden wie mit einem phonetischen System mit vielen ähnlichen Lauten.
Denn bei letzterem sollten die meisten bildbaren Lautkombinationen nicht als Wörter benutzt werden, weil sie eben zu ähnlich sind.
Besonders leicht sprechbar und wohlklingend (und relativ kurz) sollen häufig benutzte Wörter sein, also
Grammatikpartikel und Wörter wie 'tun', 'sein', 'Mensch' etc.
Das verbessert den Gesamteindruck jedes Textes.
Häufige Grammatikworte, z.B. Artikel, sollen aber nicht aufdringlich wirken.
Worte im Satz
Nicht nur einzelne Worte müssen leicht sprechbar bzw. hörbar sein.
Sie müssen auch innerhalb eines Satzes gut erkennbar sein. Gegenbeispiel:
Die Wortfolge 'kami mela pini' könnte bei flüssigem Sprechen auch z.B. als
'ka mime la pini' o.Ä. interpretiert werden, d.h. die Wortgrenzen sind
unklar. Das ist eine Folge der regelmäßigen Silbenstruktur, und der
geringen Zahl verschiedener Silben: Die letzte(n) Silbe(n) eines Wortes
könnte(n) auch der Anfang eines anderen Wortes sein.
In den natürlichen Sprachen ist das Problem der Zerlegung eines Satzes
in Worte durch den Hörer auf verschiedene Weise gelöst:
-- phonetische Maßnahmen: Im Chinesischen gibt es nur einsilbige Wörter.
Da aber fast jeder Begriff aus mehreren Worten besteht (z.B. 'Land Mitte'
= China), ist das Problem teilweise auf das Unterteilen eines Satzes
in Wortgruppen verlagert, was durch Rhythmus und Wortgruppenpause geschieht.
Im Deutschen und Englischen gibt es Tausende von Silben. Deshalb ist es
unwahrscheinlich, daß ein Wortende gleichzeitig der Anfang eines anderen
Wortes ist. Das ist jedoch keine systematische Lösung: man muß die
vorkommenden Worte kennen, um einen Satz in diese unterteilen zu können.
Im Französischen bestehen die gesprochenen Worte fast nur aus Silben
der Struktur 'Konsonant + Vokal'. Wortpausen sind selten, der Akzent
ist beliebig. Das Französische hat deshalb (wie auch das Chinesische)
eine starre Wortstellung und viele starre Stilfiguren, um das Verstehen eines Satzes zu erleichtern.
(Dagegen ist im Deutschen mit seinen im Satz besser erkennbaren Worten die Wortstellung freier).
-- Erkennen des Satzsinns: Auch wenn man einen Satz akustisch nur teilweise
versteht, kann man ihn oft gedanklich vollständig rekonstruieren, wenn man
seinen Sinn erfaßt hat. Z.B. rekonstruiert man den gehörten Satz "Ich woh..
in ei... Hau." leicht zu "Ich wohne in einem Haus". Dieser Prozeß spielt
sich meist völlig unbewußt ab und spielt beim Gebrauch der meisten natürlichen
Sprachen eine große Rolle. Diese menschliche Kombinationsgabe ermöglicht
bei einer schlechten Telefonverbindung mit einer Silbenverständlichkeit von
nur 10% noch eine Satzverständlichkeit von 42% , die Werte gelten für
das Englische [Steinbuch: 'Automat und Mensch']
Dieser unbewußte Mechanismus 'Rekonstruktion zum Sinnvollen',
der einen akustisch schlecht verstandenen Satzes vervollständigt,
zerlegt auch eine zusammenhängende Lautfolge so in Wörter,
daß sich ein Sinn ergibt.
Wir suchen aber ein phonetisches System, das Folgendes ermöglicht:
Zerlegung eines Satzes in Worte rein aufgrund der Phonetik,
ohne die Worte des Satzes bzw. der Sprache zu kennen, und ohne Erkennen des Satzsinns
(Aber bei Lärm u.Ä. ist Erkennen des Satzsinns zur Rekonstruktion nötig)
Rein phonetische Worttrennung macht die Sprache für Anfänger leichter verständlich,
und auch Kenner verbrauchen sicher weniger gedankliche Energie.
Und es macht die Sprache tauglich für automatische Spracherkennung
und -Verarbeitung. Das erreicht man mit folgenden Maßnahmen:
1) Jede Wortpause deutlich sprechen. Ist umgangssprachlich kaum praktikabel.
2) Jedes Wort hat Anfangsakzent (oder jedes Wort hat Endakzent)
Anfangsakzent ist etwas bewegter und druckvoller, Endakzent wirkt auf Dauer
etwas schleppend, doch kann die Betonung leichter erfolgen, mit dem Ausstoß der Restluft.
Theoretisch ist Endakzent vielleicht schöner: bei der vorteilhaften Silbenstruktur
Konsonant-Vokal wird tatsächlich der letzte Laut betont (bei Anfangsakzent eigentlich
der zweite Laut, der erste Vokal), und auch eine Wortfolge ohne Wortpausen ist sofort decodierbar:
wenn man eine betonte Silbe hört, weiß man, daß das Wort zu Ende ist
(bei Anfangsakzent muß man noch die erste Silbe des nächsten Wortes hören).
Obige Maßnahmen reichen meist nicht aus. Besonders bei einsilbigen Worten und flüssigem Sprechen ist eine
rein phonetische Erkennung der einzelnen Worte im Satz oft unmöglich. Das leistet folgende Maßnahme:
3) Jedes Wort hat eine solche Struktur, daß es im Satz leicht erkannt werden kann. Beispiele:
a) Jedes Wort beginnt und endet mit Vokal, und hat keine Diphtonge.
Bei einer Wortfolge wie 'o anima epoli asita' sind die einzelnen Worte leicht erkennbar,
jeder Absatz zwischen zwei Vokalen ist eine Wortpause.
b) Jedes Wort beginnt mit Konsonant, endet mit Vokal und hat keine Diphtonge.
Vor jedem Wort wird eine Partikel (Vokal oder Diphtong) gesprochen.
Das Aufeinandertreffen von 2 oder 3 Vokalen im Satz (Wortendevokal + Partikel) markiert dann immer eine Wortgrenze.
Das ist die Partikel-Version von Methode a
c) Jedes Wort hat ein Anfangskennzeichen (oder jedes Wort hat ein Endekennzeichen).
(Uneffektiv: manche Worte haben Anfangs-, andere Endekennzeichen)
Als Kennzeichen dienen bestimmte Vokale, Konsonanten oder Silben, die sonst nicht im Wort vorkommen.
Oder manche / alle Diphtonge. Oder manche / alle Konsonantenkombinationen.
Auch gemischte Lösungen sind möglich. Kennzeichen muss nicht unbedingt der Wortrand sein,
sondern auch der letzte Konsonant oder die zweitletzte Silbe z.B. können als Endesignal dienen, siehe Beispiel c3.
Beispiele (nur wenige sind praktikabel, viele zeigen wir mehr der Vollständigkeit wegen, sie sind aber zu stereotyp):
Beispiel c1: Jedes Wort beginnt mit h, und h kommt nur am Wortanfang vor.
Phonetisch günstig ist es, wenn alle Worte mit Vokal(kombination) enden (fließendes Sprechen).
Bei der Wahl des Anfangskonsonanten spielen folgende Gesichtspunkte eine Rolle:
(diese gelten sinngemäß auch für die folgenden Beispiele und Methoden)
- flüssiges und schnelles Sprechen (trifft bei h nicht zu)
- Signalwirkung: man hat die Wahl zwischen dezenter und starker Signalwirkung.
Ein starkes Signal macht die Worte im Satz intuitiv leichter erkennbar, und auch bei Lärm gut erkennbar.
h wirkt relativ dezent, ein Konsonant s, n oder gar k an jedem Wortanfang klingt monotoner und abgehackter.
Besonders klar ist das Wortanfangssignal, wenn der verwendete Konsonant
der einzige seiner Lautgruppe ist (z.B. s am Wortanfang, Sprache hat keinen weiteren Zischlaut)
- Laut-Symbolik: ein Unterbrechungskonsonant p, t, k, am Wortanfang schafft eine Lautunterbrechung am Wortanfang.
Wenn alle Unterbrechungskonsonanten nur am Anfang erlaubt sind, verhindert das gleichzeitig eine Lautunterbrechung im Wortinnern.
Logische und akustische Worttrennung gehen parallel. Das ermöglicht eine leichte technische Zerlegung eines gesprochenen Satzes in Worte.
- Mund-Symbolik: bei m, p wird der Mund völlig geschlossen, sie symbolisieren also eine Sprachpause
Nur der Konsonant p (und b) erfüllt die letzten 2 Bedingungen, aber die Sprache würde zu monoton und abgehackt klingen
Man kann auch mehrere Konsonanten als Wortanfangssignal wählen. Dabei hat man 2 Möglichkeiten:
- Alle Konsonanten einer Lautgruppe, z.B. p, t, k.   Gute Signalwirkung, monotone Wortanfänge
- Konsonanten verschiedener Lautgruppen, z.B. s, n, p Geringere Signalwirkung, Wortanfänge weniger monoton
Sind mehrere Konsonanten als Grenzsignal möglich, ist die Zahl der bildbaren Worte höher
(insbesondere die Zahl der möglichen kurzen Worte - wichtig für Grammatikpartikel).
Bei einer Wortlänge von 3 Konsonanten (+ Vokale) ist es optimal, 1/3 der Konsonanten nur am Wortanfang zu erlauben.
Sie können auch die Wortart signalisieren (Substantiv, Adjektiv ...)
Beispiel c2: Jedes Wort endet mit n, und n kommt nur am Wortende vor.
Statt n könnte man auch z.B. ng, s oder l verwenden. Phonetisch günstig ist es, wenn alle Worte mit Vokal(kombination) beginnen.
Endkonsonanten verhindern aber die phonetisch optimale Silbenstruktur Konsonant - Vokal.
Beispiel c3: Silbenstruktur Konsonant + Vokal(e), letzter Silbe beginnt mit n, das sonst nie vorkommt.
Man könnte statt n zusätzlich Konsonantengruppen mit n erlauben (nt, nf, ns, sn, schn, ln), oder beliebige
Konsonantengruppen (st, sk, ...), so daß jede Konsonantengruppe die letzte Silbe eines Wortes andeutet.
Dann sind die Wortenden abwechslungsreicher, die Zahl der bildbaren Worte ist höher.
Variationen: n, f, k oder eine beliebige Konsonantenkombination markieren letzte Silbe. Beliebige Vokalkombinationen in den Silben,
z.B. ai, aia, ia, iai, aiai. Dann ist das Formprinzip der Wortenden auf den ersten Blick nicht zu erkennen,
die Wortenden sind sehr abwechlungsreich, aber trotzdem ein wirksames Endesignal.
Man kann auch Konsonanten (oder Vokale) definieren, welche die zweitletzte Silbe eines Wortes signalisieren.
Die letzte Silbe kann dann beliebig sein.
Als Endesignal könnte auch gelten, wenn die letzten 2 Silben eines Wortes mit dem gleichen Konsonanten beginnen,
wie bei 'Banane', oder mit 2 bestimmen Konsonanten, z.B. k-n
Beispiel c4: Jedes Wort beginnt mit a, und a kommt nur am Wortanfang vor.
Phonetisch günstig ist es, wenn alle Worte mit Konsonant enden, was aber etwas ruppig klingt.
Beispiel c5: Jedes Wort endet mit o, und o kommt nur am Wortende vor.
Phonetisch günstig ist es, wenn alle Worte mit Konsonant beginnen. Dann kann man im Wortinneren auch Diphtonge
wie ai, ia (sogar oi, io) zulassen, denn es besteht keine Verwechslungsgefahr mit Wortgrenzen wie ...a i... oder ...i a...
Variation: Man erlaubt nur am Wortende auch schwer sprechbare Vokale wie y, ö, nasales o
Beispiel c6: Jedes Wort endet mit einsilbigem Diphtong, und Diphtonge kommen nur am Wortende vor (s.u. Lautsystem 'lalai')
Phonetisch günstig ist es, wenn alle Worte mit Konsonant beginnen. Dann kann man im Wortinneren auch
2-silbige Diphtonge wie ia, io zulassen, denn es besteht keine Verwechslungsgefahr mit Wortgrenzen wie ...i a...
Variante: am Wortanfang kann man auch Vokale und Diphtonge zulassen.
Beispiel c7: Ein phonetisches System mit den 12 Konsonanten p t k r (Unterbrechungslaute)
m n l v (Summlaute) f s sh h (Zischlaute), 4 Vokalen i e a o und Silbenstruktur Konsonant-Vokal.
Die Silben pi te ka ro mi ne la vo fi se sha ho dienen als Endesignal.
Variation: man erlaubt statt Vokalen auch Vokalkombinationen. Silben sind Endesignal, wenn sie mit obigen
einfachen Silben beginnen.
Die Wortenden sind abwechslungsreich und deshalb intuitiv (ohne Kenntnis der Sprache) kaum als Endesignale erkennbar.
Silben (Konsonant-Vokal-Kombinationen) dienen als Endesignal.
Solche gemischte Systeme sind viele denkbar, es gibt gute und schlechte Kombinationen.
Bei obigen Wortstrukturen a, b, c ist ein geschriebener Text auch dann leicht und eindeutig in Worte zerlegbar,
wenn man alle Leerzeichen streicht.
Entsprechend ist ein gesprochener Text auch dann noch rein phonetisch in Worte zerlegbar,
wenn weder Wortpause noch Akzent gesprochen werden.
Wenn man die betreffende Sprache ein wenig kennt,
spielt sich das akustische Erkennen eines Wortes im Satz mittels einer dieser Methoden (z.B. Wortendesignal) automatisch und unbewußt ab.
Man könnte diskutieren, ob z.B. Worte mit Endesignal auch Endakzent haben sollten (Verstärkung des Endesignals)
oder Anfangsakzent.
Für eine Lautbildschrift sind die Methoden a, b, c nur bedingt geeignet.
Am besten noch Methode b, man spricht vor jedem Wort eine (nicht geschriebene) Partikel,
welche die Position des Wortes angibt (Bildanfang, Spaltenanfang nichterste Spalte, innerhalb Spalte), s.u. Lautsystem 'a lala'.
Oder Methode a, man spricht am Anfang jedes Wortes, das nicht mit Vokal beginnt, den Leervokal i (s.u. Lautsystem 'alala').
Oder Methode c, Beispiel 6 (s.u. Lautsystem 'lalai')
Generell gibt es also 2 gegensätzliche Ideale der phonetischen Worttrenung im Satz:
- Trennung nur durch Wortpause (entsprechend der Wortlücke beim Schreiben), keine Einschränkung der Wortbildung
- Trennung nur durch Wortgrenzsignal, ermöglicht flüssiges Sprechen ohne Pausen
Eine Mischung zwischen beiden Methoden sind Unterbrechungskonsonanten am Wortanfang,
die automatisch eine Wortpause erzeugen (s.o. Beispiel c1, 'Lautsymbolik').
Bei der zweiten Methode kann man noch unterscheiden zwischen einheitlichem, intuitiv leicht erkennbarem Grenzsignal,
und vielfältigen Grenzsignalen, die variable Wortenden (oder Wortanfänge) erlauben.
Vielfältige Endesignale (wie in Beispiel c3 oder c7) sind intuitiv schlecht erkennbar,
ermöglichen aber trotzdem eine saubere Zerlegung eines Textes in Worte.
Gibt es kryptographische Systeme, die das ausnutzen?
Satzmelodie und Rhythmus
Auch diese sind bei einer künstlichen Sprache zu entwerfen.
Es sollte eine deutliche, musikalische Satzmelodie vorherrschen
mit rhythmischem Auf und Ab. Monotonie ist unbedingt zu vermeiden.
Wortbildungsprinzip und phonetisches System
Es gibt verschiedene Methoden, die Worte einer künstlichen Sprache
zu bilden: z.B. freihand, oder nach Gruppenähnlichkeit, oder nach einem
alphabetischem Bibliothekscode, oder nach dem Lautbildschrift-Prinzip.
Bei Freihand-Bildung der Worte kann man jedes beliebige phonetische System verwenden, auch bei Wortbildung nach Gruppenähnlichkeit.
Bei Wortbildung nach Bibliothekscode braucht man Worte mit regelmäßiger Struktur, z.B. mit Silbenstruktur Konsonant - Vokal
(was man aber auch erreichen kann, indem man sich zwischen 2 Konsonanten den Nullvokal vorstellt,
zwischen 2 Vokalen den Nullkonsonant).
Man muß man den Bibliothekscode dem phonetischen System anpassen oder umgekehrt:
sollen z.B. alle Worte mit Vokal beginnen, und hat man 5 Vokale, so muß eben die 1. Unterteilung
aller Begriffe in nur 5 Bereiche erfolgen (z.B. Lebewesen beginnen mit a, Abstrakta mit i, ...).
Die Unterteilung muß abwechselnd durch Vokal und durch Konsonant beschrieben werden.
Es ist phonetisch vorteilhaft, am Ende nach einem Konsonanten einen Leervokal anzuhängen.
Bei Wortbildung nach dem Lautbildschrift-Prinzip bestimmt die Art der
Lautbildschrift das phonetische System mit:
Bei einer Lautbild-Buchstabenschrift sind Diphtonge schwer zu realisieren,
bei einer Lautbild-Silbenschrift einfach: man definiert eben auch Silbenzeichen, die Silben mit Diphtongen entsprechen.
Ein Beginnen aller Worte mit Vokal ist bei Lautbildschrift nur mit Tricks möglich (ggf. Leervokal i am Wortanfang sprechen).
Das erhöht aber die Wort- und Satzlänge.
Vorteile einer klaren Phonetik
- Eine phonetisch klare Sprache ist leichter zu erlernen als eine mit komplizierter Phonetik
- Eine phonetisch klare Sprache erleichtert die akustische Verständigung:
bei Schwerhörigkeit (woran viele ältere Menschen leiden), bei Lärmkulisse (geringerer Partyeffekt: schlechtes Hören, wenn alle durcheinanderreden),
bei geringer Lautstärke (größere Entfernungen bei Vortrag, Theater),
bei schlechter Akustik im Raum, bei schlechter Übertragungsqualität im Telefon, Radio etc.
- Eine phonetisch klare Sprache ermöglicht eine gute Sprachsynthese und vor allem eine fehlerfreie maschinelle
Spracherkennung, die bei den meisten natürlichen Sprachen unmöglich ist (s.u.)
- Eine Sprache mit wenigen Vokalen und Silbenstruktur Konsonant-Vokal ermöglicht viele Reime.
Z.B. reimt sich bei einer solchen Sprache mit nur 4 Vokalen ein Wort auf ein Viertel aller anderen Worte
(..ta auf ..ka, ..pa, ..ma, ..na etc.), wobei der Selbstreim (..ta auf ..ta) am schlechtesten reimt.
Diese leichte Reimbildung nicht nur günstig für die Poesie, sondern auch für Lehrgedichte, eine viel zu wenig benutzte Idee,
mit der sich sogar mathematische und physikalische Fakten leicht und unterhaltsam im Gedächtnis behalten lassen.
- Eine Sprache mit wenigen Lauten kommt mit einer kleineren Tastatur aus
- Eine Sprache mit klarer Silbenstruktur ermöglicht Wortbildung nach Bibliohekscode (s.o.)
Automatische Spracherkennung
Diese wird immer wichtiger. Wie gut eine Sprache dafür geeignet ist,
hängt fast ausschließlich von ihrem Lautsystem ab:
vorteilhaft sind klare, deutlich unterschiedene Laute,
eine klare Silbenstruktur "Konsonant + Vokal / Diphtong" und
eindeutige Zerlegbarkeit von Sätzen in Worte rein aufgrund der Phonetik.
Falls diese Bedingungen erfüllt sind, läßt sich meiner Ansicht nach automatische Spracherkennung
einfach und fehlerfrei durchführen:
Da die Lautstärke bei den Vokalen ihr Maximum erreicht, kann
man an den Maxima / Minima der Lautstärke Worte in Silben zerlegen,
welche dann, da die Silbenzahl bei einfacher Silbenstruktur begrenzt ist,
durch elektronische Resonanzglieder erkannt werden.
Bei obigen phonetischen Gegebenheiten kann auch Sprachsynthese
(z.B. wenn Computer mit Mensch spricht) silbenweise durchgeführt werden:
Es werden nur die Klangmuster jeder Silbe abgespeichert (mit / ohne Betonung).
Verschleifungen oder Bindungen zwischen Silben gibt es kaum (im Ggs. zu den Lauten innerhalb einer Silbe).
Dadurch wird die Sprachsynthese einfach und effizient, und das Resultat klingt natürlich.
Weitere Gesichtspunkte
Weitere spezielle Gesichtspunkte der Sprache, die bereits beim Entwurf eines
Lautsystems zu berücksichtigen sind, diskutieren wir in eigenen Artikeln:
Ein Finger-Buchstabiersystem
Sprache und Psyche
Einige prototypische Lautsysteme
Bei allen folgenden Lautsystemen gilt:
- i y e o u sind sehr geschlossen (d.h. e wie in Telefon, nicht ä-ähnlich,
o geschlossen wie in Ofen und relativ hell, nicht offen und dunkel wie in Norden,
y und u ohne Lippenvorstülpung). a ist offen und hell.
Diphtonge mit -i am Ende sind einsilbig. l, n, m ,v sind summender als im Deutschen.
S (großes S) ist kürzel für den Laut sch.
- Alle Worte haben Anfangsakzent (Tonerhöhung und Längung des Vokals).
Stattdessen wäre auch Endakzent möglich. Dieser wirkt vielleicht
musikalischer (auf dem letzten Vokal sind Tonerhöhung und -Längung
deutlicher), aber auch schleppender. Anfangsakzent wirkt etwas
druckvoller und lebendiger, signalisiert die Wortgrenze sofort
und ist besonders beim Lesen leichter sprechbar:
man muß keine Luftreserve für den Endakzent behalten, und auch
beim Rhythmus geht es nach der 1. Silbe gleichmäßig weiter.
- Als Grammatikworte werden vor allem kurze Worte verwendet.
Das verringert die Satzlänge, denn sie kommen häufig vor.
Ideal wäre, daß alle Worte bis zu einer bestimmten Länge
Grammatikworte sind, alle längeren lexikalische Worte.
Bei Sortierung des Wortschatzes nach Länge (dann erst nach ABC)
kommen dann zuerst alle Grammatikworte, ein wichtiger,
spezieller Teil des Wortschatzes.
- Beim Vergleich der Silbenzahlen ist zu berücksichtigen:
nicht alle Silben sind gleich lang.
Lautsystem 'alala'
Laute:
s S f t k p n m v l u o a e i
Wortbildung:
- Erste Silbe = Vokal
- Andere Silben = Konsonant + Vokal
Silbenzahl:
5 Anfangssilben (Vokal) + 10*5 Silben (Konsonant + Vokal) = 55
Satzbeispiel: o anima epoli iso alita e okarina
Worttrennung im Satz:
Sehr deutlich, immer eine Zäsur zwischen 2 Vokalen.
Bewertung:
Sehr klares, einfaches Lautsystem, sehr leicht erlernbar.
Sehr leicht sprechbar wegen den einfachen Lauten und Silben (max. Konsonant + Vokal).
Klangschön wegen den klaren Vokalen.
U sollte seltener vorkommen und mit den anderen Lauten harmonieren.
Zahlenmäßig ausgewogen: 10 Konsonanten, 5 Vokale.
Mit nur 55 Silben ist die Silbenzahl vielleicht zu gering,
um viele kurze Worte bilden zu können.
Bemerkung:
Das einzige der hier vorgestellten Lautsysteme ohne Vokalkombinationen.
Erweiterung:
Mit den Lauten r, ng (wie in 'singen'), y wäre das Lautystem
abwechslungsreicher und klangschöner. 12 Konsonanten, 6 Vokale. Die Zahl der möglichen Worte
mit genau 5 Lauten (z.B. alala) steigt von 5*50*50 = 12500 auf
6*72*72 = 31104 (Worte mit 1 oder 3 Lauten, wie a oder ala,
nicht eingerechnet).
Mit den Lauten r, z, ng, h, ö, y wäre das Lautsystem noch
abwechslungsreicher und klangschöner. 14 Konsonanten, 7 Vokale.
Die Zahl der möglichen Worte mit genau 5 Lauten steigt auf 7*98*98 = 67228
Vergleiche:
Das Sprechen der einfachen, klaren, gut abgegrenzten Silben könnte man
vergleichen mit dem Geblubber aufsteigender Luftblasen, und diese auch
etwas mit einer Kette.
Lautsystem 'a lala'
Dies ist die analytische Variante des Lautsystems 'alala'.
Worte beginnen nicht mit Vokal, sondern jedem Wort wird ein
einzelner Vokal als Partikel vorangestellt.
Worttrennung im Satz:
Sehr deutlich: eine Zäsur zwischen 2 Vokalen markiert ein Wortende,
der zweite Vokal ist ein eigenes Wort, danach beginnt ein neues Wort.
Satzbeispiel: o nima e poli a so a lita e tokarina
Bemerkung:
Die Partikel könnten bei einer Lautbildschrift
die Position des Wortes im Bildsatz angeben, z.B.:
o = Satzanfang, a = Spaltenanfang außer 1. Spalte, e = sonstig
Brauchbar ist dieses System auch für 'sichtbare' Grammatiken,
die zur Darstellung der Wortbeziehungen immer Partikel verwenden
(siehe Molekül-Grammatik).
Da die Partikelzahl zu gering wäre, wenn man nur Vokale
als Partikel verwendet, könnte man auch Diphtonge und Worte
des Typs ala (und sogar alala) als Partikel verwenden.
Die Worttrennung im Satz bleibt genauso gut.
Lautsystem 'alaja'
Laute:
s S f t k p n m v j l r u o a e y i
Wortbildung:
- Erste Silbe = Vokal
- Andere Silben = Konsonant + Vokal
Silbenzahl:
6 Anfangssilben (Vokal) + 12*6 Silben (Konsonant + Vokal) -2
unsprechbare Silben (ji, jy gibt es nicht) = 6 + 72 -2 = 76
Satzbeispiel: itija ala iti e olimajo isitaki
Worttrennung im Satz:
Gut, immer Zäsur zwischen 2 Vokalen. Problem: eine Lautfolge ..i a..
an der Grenze von 2 Worten könnte bei schnellem Sprechen als ..ija..
gehört werden, die 2 Worte also als 1 Wort. Gegenmaßnahme:
nach Worten die auf i enden, Wortpause und Anfangsakzent
deutlich sprechen. Oder i am Wortende verbieten.
Oder am Wortanfang immer ein h sprechen.
Bewertung:
Klares, einfaches Lautsystem, leicht erlernbar (bis auf r, y).
Leicht sprechbar wegen den einfachen Silben (max. Konsonant + Vokal).
Klangschön, auch wegen den möglichen Lautfolgen ija yja eja aja oja ajo,
ajaja ejajo etc. U sollte nicht zu häufig vorkommen und mit den anderen
Lauten harmonieren. Zahlenmäßig ausgewogen: 12 Konsonanten, 6 Vokale.
Bemerkung:
Dieses Lautsystem hat keine Vokalkombinationen, aber wegen j doch:
aja klingt wie aia, etc.
Erweiterung:
Mit ö, h, ng hätte man 14 Konsonanten und 7 Vokale.
Der einsilbige Diphtong ao (klangschöner als au) könnte wie
ein einzelner Vokal verwendet werden.
Lautsystem 'alaila'
Ähnelt dem Lautsystem 'alala', erweitert um einsilbige Diphtonge
Laute, Diphtonge:
s S f t k p n ng m l r v u o a e i ui oi ai ei ao (einsilbig)
Wortbildung:
- Erste Silbe = Vokal (außer i) oder Diphtong
- Andere Silben = Konsonant + Vokal oder + Diphtong
Silbenzahl:
9 Anfangssilben (i verboten) + 12*5 Silben (Konsonant + Vokal)
+ 12*5 Silben (Konsonant + Diphtong) = 9 + 60 + 60 = 129
Satzbeispiel: etoisa ala aoti olimani usitaki
Worttrennung im Satz:
Sehr deutlich, immer eine Zäsur zwischen 2 Vokalen / Diphtongen.
Weil i am Wortanfang verboten ist, gibt es keine Verwechslungsgefahr
...a i... (2 Worte) mit ...ai... (1 Wort).
Bemerkung:
Auch aia, aio ... als Wörter möglich. Die akustische Worttrennung
wird dadurch nicht beeinträchtigt.
Lautsystem 'a laila'
Dies ist die analytische Variante des Lautsystems 'alaila'.
Worte beginnen nie mit Vokal, sondern jedem Wort wird ein
einzelner Vokal oder Diphtong als Partikel vorangestellt.
Satzbeispiel: ei toisa a latai o limoine u sitaki
Worttrennung im Satz:
Sehr deutlich: eine Zäsur zwischen 2 Vokalen / Diphtongen markiert ein Wortende,
der zweite Vokal / Diphtong ist ein eigenes Wort, danach beginnt ein neues Wort.
Lautsystem 'lalai'
Laute, Diphtonge:
Konsonanten: s S f t k p n ng m l r v Vokale: u o a e i Diphtonge: ui oi ai ei
Wortbildung:
- Nichtletzte Silbe = Konsonant + Vokal (außer i)
- Letzte Silbe = Konsonant + Diphtong
Auch u o a e ui oi ai ei sind als Wörter erlaubt.
Silbenzahl:
Im Wortinneren und am Wortende je 12*4 = 48 Silben.
Silben am Wortende sind länger (Diphtong)
Satzbeispiel: ai teletoi volai nei soloi e lakanoi sotai
Worttrennung im Satz:
Sehr gut: Jedes Wort (außer u o a e) endet mit Diphtong-i, sonst enthält es keine Diphtonge.
Ein Diphtong-i ist sozusagen ein tönender Wortzwischenraum.
Bewertung:
Vorteile:
- Dieses Lautsystem kombiniert 2 sonst unvereinbare Fähigkeiten:
fließendes Sprechen ohne Wortpausen und exakte Worttrennung beim Hören.
Auch wenn man beim Schreiben alle Wortzwischenräume wegläßt,
ist ein Text noch korrekt in Worte zerlegbar.
Denn jedes Wort hat ein Endesignal (Diphtong-i), deshalb ist
kein Wort ist der Anfang eines anderen Wortes.
- Jedes Wort hat genau 1 einsilbigen Diphtong, was es klangschön macht,
aber nicht überladen.
Nachteile:
- Bei einer Lautbildschrift
wird das Lesen komplizierter und unnatürlicher:
ein Wortzwischenraum wird als Diphtong-i gelesen. (Anders ausgedrückt: derselbe Buchstabe o
wird im Wortinnern als o, am Wortende als oi gelesen)
- Die Worte werden akustisch länger
- Bei einer Lautbild-Silbenschrift hat man weniger Silbenzeichen,
da man den Silben mit Diphtong dasselbe Zeichen zuordnen muß wie
den Silben ohne Diphtong-i (sonst könnte man diese Zeichen nicht am Wortende verwenden).
Das verringert die optische Gestaltungsmöglichkeit von Worten.
Variationen:
- Diejenigen Vokalphoneme u o a e ui oi ai ei ,
die man nicht als Worte verwendet, kann man am Wortanfang erlauben.
Die Erkennbarkeit der Worte im Satz bleibt erhalten.
Vergleiche:
Man könnte 4 Vokale den 4 Fingern zuordnen, das Diphtong-i dem Daumen
(zu dessen plumper Form es aber m.E. intuitiv nicht paßt), siehe
Finger-Buchstabiersystem
Ein Wort in obigem Lautsystem könnte man vergleichen mit einem Kraut mit (kürzerem oder längerem)
senkrechtem Stiel (Silben Konsonant + Vokal) und einer Blütendolde obenauf
(Silbe mit Diphtong), der Lautstärke nach auch mit einer Keule.
Lautsystem 'lilai'
Laute, Diphtonge:
Konsonanten: s S f t k p n ng m l r v Vokalphoneme 1: u o a e i Vokalphoneme 2: ui oi ai ei y
Aus einem Vokalphonem 1 wird ein Vokalphonem 2 durch Anhängen
von Diphtong-i.
Beispiel: u - ui .
Ausnahme: aus i wird nicht ii, sondern y
Wortbildung:
- Nichtletzte Silbe = Konsonant + Vokalphonem 1
- Letzte Silbe = Konsonant + Vokalphonem 2
Auch u o a e y ei ai oi ui sind als Wörter erlaubt
Silbenzahl:
Im Wortinneren und am Wortende je 12*5 = 60 Silben
(Konsonant + Vokalphonem), wobei die Silben am Wortende meist länger sind (Diphtong)
Satzbeispiel: ai tilitoi volai nei soly e likoi sotai
Worttrennung im Satz:
Sehr gut: Jedes Wort endet mit Diphtong-i (oder y, das als ii gilt).
Im Wort kommen keine Diphtonge vor. Ein Diphtong-i ist sozusagen ein tönender Wortzwischenraum.
Bemerkung:
Dieses Lautsystem lilai entspricht dem eben beschriebenen Lautsystem lalai bis auf
die Tatsache, daß auch y verwendet wird.
Es ist dadurch komplizierter, aber akustisch abwechslungsreicher und klangschöner.
Bei einer Lautbildschrift
hat man 1 Buchstaben oder 12 Silbenzeichen mehr (bessere Ideogramme),
aber das Lesen wird durch den Wechsel i-y komplizierter.
Variationen:
- Man könnte y nur im Wortinneren erlauben, i nur am Wortende.
Ein i würde dann immer ein Wortende signalisieren. Das wäre
logischer als die oben beschriebene umgekehrte Lösung, die
gewählt wurde, damit das leichter sprechbare i häufiger
vorkommt als y
- Statt ei könnte man ö verwenden.
- Diejenigen Vokalphoneme u o a e y ei ai oi ui ,
die man nicht als Worte verwendet, kann man am Wortanfang erlauben.
Die Erkennbarkeit der Worte im Satz bleibt erhalten.
Lautsystem 'lialai'
Laute, Diphtonge:
Konsonanten: s S f t k p n ng m l r v Vokalphoneme 1: u o a e i ie ia io iu Vokalphoneme 2: ui oi ai ei y iei iai ioi iui
Aus einem Vokalphonem 1 wird ein Vokalphonem 2 durch Anhängen
von Diphtong-i.
Beispiele: u - ui, iu - iui .
Ausnahme: aus i wird nicht ii, sondern y
Wortbildung:
- Nichtletzte Silbe = Konsonant + Vokalphonem 1
- Letzte Silbe = Konsonant + Vokalphonem 2
Auch u o a e y ei ai oi ui sind als Wörter erlaubt;
sogar io, ia ... und aio, aia ... sind möglich
Silbenzahl:
Im Wortinneren und am Wortende je 12*9 = 108 'Silben'
(Konsonant + Vokalphonem), wobei die Silben am Wortende meist länger sind (Diphtong-i)
Satzbeispiel: ai tilitoi violai nei soly e likoi sotai
Bemerkung:
Dieses Lautsystem lialai entspricht dem eben beschriebenen Lautsystem lilai bis auf
die Tatsache, daß im Wortinnern auch zweisilbige Diphtonge (ie ia iao iu) möglich sind,
und am Wortende entsprechend die Triphtonge iei iai ioi iui.
Es ist dadurch komplizierter, aber akustisch abwechslungsreicher und klangschöner,
und bei einer Lautbild-Silbenschrift
hat man mehr Silbenzeichen zur Verfügung.
Die Benutzung der hier beschriebenen Techniken ist frei Stand: 17.3.2007 Autor und Erfinder: Leonhard Heinzmann Homepage