SLP Notizen

Teil I
Kapitel 4: Computerphonologie und TTS

Inhalt

Allgemeines

Phonetik: Lehre von den Sprachlauten
Phonologie: Lehre von den Lautsystemen der Sprache

Sprachlaute und phonetische Transkription

unterschiedliche Transkriptionssysteme

Arpabet, IPA, IPA in Latin1

enge Transkription vs. weite Transkription (letztere sinnvoller, Abstraktion, eher phonologisch nutzbar)
Kategorisierung der Sprachlaute

Konsonanten

stimmhaft, stimmlos: Vibration an der Glottis
Artikulationsstelle

weiter vorne, weiter hinten: labial, dental, alveolar, retroflex, palatal, velar, uvular, pharynal, glottal

Artikulationsart

plosiv, nasal, vibrant, frikativ, approximierend, lateral

Vokale

immer stimmhaft
vorne, zentral, hinten: entspricht Artikulationsstelle
Öffnungsgrad des Kiefers
Lippenrundung (rund, unrund)

Diphthonge: Übergang zwischen zwei Vokalen, einer von beiden ist der stärkere

Silben

Silbengrenzen werden in IPA durch [.] gekennzeichnet

keine eindeutige Definition, vor allem nicht der Grenzen

sehr ambig, und wohl auch nicht immer wichtig, wo die Grenze ist

Onset, Kern/Nukleus, Coda

phonologische Regeln zu erlaubten Konsonanten innerhalb von Onset/Coda: Sonorität

meist Einigkeit über die Zahl der Silben in einem Wort (aber nicht immer: Höhe = [höə̯] / [hö.ə])

Phonemik und phonologische Regeln

Allophon: unterschiedliche Realisierung eines Phonems in unterschiedlichen Kontexten
Auslautverhärtung
ch-Laut im Deutschen
Aspiration ([t] nach [ʃ] nicht aspiriert, sonst ja)

Transduktoren für phonologische Regeln

Regeln: a → b / c __ d

Kontext wird auch über Merkmale (sonor, ...) dargestellt, auch Morphemgrenzen (^) sind Kontext

jeweils eine Regel für ein Phänomen

Grund: feeding/bleeding (Abhängigkeiten zwischen Regeln erfolgen durch Kaskadierung) ist selten

Zweilevel-Transduktoren (Koskenniemi)

Constraints auf beiden Ebenen (lexikalische und Oberfläche) durch ":"

TODO: Beispiel ankucken, vielleicht deutsches Beispiel ausdenken

weitere Themen der Computerphonologie

Harmonie

Vokale unterschiedlicher Morpheme eines Wortes müssen alle einer Vokalklasse angehören (schwer, leicht, ...)
durch Kaskade oder parallele Zwei-Level-Regeln darstellbar

Templatic Morphology

Wörter aus zwei Morphemen: Konsonanten-Cluster plus Vokal-Cluster
ebenfalls durch (Mehr-Level-)Transduktoren machbar

Optimality Theory

alternative Darstellung morphologischer Prozesse
Generative Funktion generiert alle möglichen (unendlich vielen) Oberflächenformen zur gegebenen lexikalischen Form
Evaluationsfunktion sucht gemäß sprachspezifischer Constraints die "korrekte" Form aus
Constraints:

Faithfullness: Ähnlichkeit zwischen Lexikon und Oberfläche. FaithV, FaithC für Verben und Konsonanten
Komplexität (von Konsonantenclustern, Vokalclustern, ...)
[x] vor hinteren, [ç] vor vorderen Vokalen

sinnvoll mit weichen Constraints und der Selektierung der Form mit geringsten Kosten

Maschinelles Lernen von phonologischen Regeln

steht eigentlich nix zu drin im Buch

Graphem-Phonem-Umsetzung für TTS

Wörterbücher,
~ 20 % der Wörter sind Eigennamen
Zahlenaussprache
Regelwerke (parallele Regelarchitektur) für FST-basierte Aussprachelexika

Lexikoneinträge bekommen FST zugeordnet (c|k a|æ t|t)
FSAs für die Reihung von Morphemen in Wörtern (möglicherweise auch hier FSTs?)
jede Regel ein FST
Zwei-Level-Architektur

Prosodie in TTS

Suprasegmentalia, Betonung, Satzmelodie, Intonationseinheiten, Grundfrequenz, Lautheit, andere Dimensionen von Betonung, ...

menschliche Verarbeitung von Phonologie und Morphologie

TODO

letzte Änderung: 17. August 2006.

mail AT timobaumann.de