SLP Notizen
Teil I
Kapitel 4: Computerphonologie und TTS
Inhalt
- Allgemeines
- Phonetik: Lehre von den Sprachlauten
- Phonologie: Lehre von den Lautsystemen der Sprache
- Sprachlaute und phonetische Transkription
- unterschiedliche Transkriptionssysteme
- Arpabet, IPA, IPA in Latin1
- enge Transkription vs. weite Transkription (letztere sinnvoller, Abstraktion, eher phonologisch nutzbar)
- Kategorisierung der Sprachlaute
- stimmhaft, stimmlos: Vibration an der Glottis
- Artikulationsstelle
- weiter vorne, weiter hinten: labial, dental, alveolar, retroflex, palatal, velar, uvular, pharynal, glottal
- Artikulationsart
- plosiv, nasal, vibrant, frikativ, approximierend, lateral
- Vokale
- immer stimmhaft
- vorne, zentral, hinten: entspricht Artikulationsstelle
- Öffnungsgrad des Kiefers
- Lippenrundung (rund, unrund)
- Diphthonge: Übergang zwischen zwei Vokalen, einer von beiden ist der stärkere
- Silben
- Silbengrenzen werden in IPA durch [.] gekennzeichnet
- keine eindeutige Definition, vor allem nicht der Grenzen
- sehr ambig, und wohl auch nicht immer wichtig, wo die Grenze ist
- Onset, Kern/Nukleus, Coda
- phonologische Regeln zu erlaubten Konsonanten innerhalb von Onset/Coda: Sonorität
- meist Einigkeit über die Zahl der Silben in einem Wort (aber nicht immer: Höhe = [höə̯] / [hö.ə])
- Phonemik und phonologische Regeln
- Allophon: unterschiedliche Realisierung eines Phonems in unterschiedlichen Kontexten
- Auslautverhärtung
- ch-Laut im Deutschen
- Aspiration ([t] nach [ʃ] nicht aspiriert, sonst ja)
- Transduktoren für phonologische Regeln
- Regeln:
a → b / c __ d
- Kontext wird auch über Merkmale (sonor, ...) dargestellt, auch Morphemgrenzen (^) sind Kontext
- jeweils eine Regel für ein Phänomen
- Grund: feeding/bleeding (Abhängigkeiten zwischen Regeln erfolgen durch Kaskadierung) ist selten
- Zweilevel-Transduktoren (Koskenniemi)
- Constraints auf beiden Ebenen (lexikalische und Oberfläche) durch ":"
- TODO: Beispiel ankucken, vielleicht deutsches Beispiel ausdenken
- weitere Themen der Computerphonologie
- Harmonie
- Vokale unterschiedlicher Morpheme eines Wortes müssen alle einer Vokalklasse angehören (schwer, leicht, ...)
- durch Kaskade oder parallele Zwei-Level-Regeln darstellbar
- Templatic Morphology
- Wörter aus zwei Morphemen: Konsonanten-Cluster plus Vokal-Cluster
- ebenfalls durch (Mehr-Level-)Transduktoren machbar
- Optimality Theory
- alternative Darstellung morphologischer Prozesse
- Generative Funktion generiert alle möglichen (unendlich vielen) Oberflächenformen zur gegebenen lexikalischen Form
- Evaluationsfunktion sucht gemäß sprachspezifischer Constraints die "korrekte" Form aus
- Constraints:
- Faithfullness: Ähnlichkeit zwischen Lexikon und Oberfläche. FaithV, FaithC für Verben und Konsonanten
- Komplexität (von Konsonantenclustern, Vokalclustern, ...)
- [x] vor hinteren, [ç] vor vorderen Vokalen
- sinnvoll mit weichen Constraints und der Selektierung der Form mit geringsten Kosten
- Maschinelles Lernen von phonologischen Regeln
- steht eigentlich nix zu drin im Buch
- Graphem-Phonem-Umsetzung für TTS
- Wörterbücher,
- ~ 20 % der Wörter sind Eigennamen
- Zahlenaussprache
- Regelwerke (parallele Regelarchitektur) für FST-basierte Aussprachelexika
- Lexikoneinträge bekommen FST zugeordnet (c|k a|æ t|t)
- FSAs für die Reihung von Morphemen in Wörtern (möglicherweise auch hier FSTs?)
- jede Regel ein FST
- Zwei-Level-Architektur
- Prosodie in TTS
- Suprasegmentalia, Betonung, Satzmelodie, Intonationseinheiten, Grundfrequenz, Lautheit, andere Dimensionen von Betonung, ...
- menschliche Verarbeitung von Phonologie und Morphologie
letzte Änderung: 17. August 2006.
mail AT timobaumann.de