SLP Notizen
Teil IV
Kapitel 18: Diskurs
Inhalt
- Allgemeines
- Pragmatik ist die Bedeutung von Sätzen im Kontext von anderen Sätzen.
- Methoden gehen über die Satzgrenzen hinaus
- es gibt unterschiedliche Diskurs-Typen: Monolog, Dialog, ...
- es gibt Diskurs-Kontext und Situationskontext (kein Teil der Sprache)
- Diskurs-Modell: beschreibt den aktuellen Diskurs-Zustand mit den unterschiedlichen Referenten und ihrer jeweiligen Aktivität
- (Ko-)Referenz-Auflösung
- unterschiedliche referierende Ausdrücke beziehen sich auf einen Referenten
- referieren zwei Ausdrücke den gleichen Referenten, so heißen sie koreferent
- referierende Ausdrücke können einen Referenten einbringen(evoke) oder aufrufen (access)
- Anapher: (nicht-eindeutige) Referenz auf etwas schon eingebrachtes
- Katapher: (nicht-eindeutige) Referenz auf etwas erst noch Einzubringendes
- Anaphorik: Zuordnung wiederaufrufender Referenten zu den hervorrufenden (also Mapping gleichreferierender Ausdrücke)
- Pronomen rufen Referenten auf (oder sind Kataphern)
- unterbrochene Mengen: mehrere Referenten, die später zu einem zusammengefasst werden
- Aktivität eines referierenden Ausdrucks bestimmt die W.keit dafür, dass er referiert wird
- Semantische und syntaktische Constraints helfen bei der Auflösung
- Person, Numerus, Genus, Kasus schränken den Referenzraum zwischen Ausdrücken erheblich ein (Peter ≠ es)
- Reflexive können je nach syntaktischer Stellung nur bestimmte Referenten haben
- John sagt, dass Bill sich ein Auto kauft.
- Selektive Restriktionen der Verben: Timo sah den Eiffelturm, als er nach Granada flog.
- Präferenzen der Pronomina-Interpretation
- Neuheit: neuere Referenten werden eher referenziert
- grammatische Funktion: Subjekt > Objekt
- Wiederholte Erwähnung
- Parallelität: Strukturgleichheit zweier Sätze zeugt von gleicher unterliegender Struktur
- Verb-Semantik / thematische Rolle: bestimmte Rollen werden (situationsabhängig) präferiert
- regelbasierter (flacher) Algorithmus zur Pronomen-Resolution
- NPs bekommen nach bestimmten Faktoren Aktivitätswerte hinzuaddiert
- mit jedem neuen Satz werden die Aktivitätswerte halbiert (Neuheit)
- jeweils aktivierteste kompatible NP wird zugeordnet
- Korrektheit: ~80%
- Syntaxbaumbasierter Algorithmus
- anhand bestimmter Regeln wird innerhalb des Syntaxbaums nach dem Koreferenten gesucht
- gibt's da nichts stochastisches, ist doch wie WSD nur mit anderen Features?
- Text-Kohärenz
- Zusammenhang zwischen einzelnen Sätzen
- dieser Zusammenhang erzeugt oft mehr Information als die ursprüngliche Aussage enthielt
- wird häufig über Abduktion (ungültigen Schluss) geschlossen
- unterschiedliche Beziehungen:
- Folge
- Erklärung
- Parallelität
- Ausarbeitung
- ...
- sinnvoll für
- Textzusammenfassung (Ausarbeitungen weglassen oder inkorporieren)
- Textverständnis (also irgendwann auch Spracherkennung, MT, ...)
- Erkennung "wichtiger" Keywords für IR
- Inferenzbasierte Kohärenzbestimmung
- Wissensbasiert
- unterschiedlichen Beziehungen sind unterschiedliche Regeln zugeordnet
- möglichst plausible Schlüsse wählen die "richtige" Beziehung zwischen Sätzen aus
- alles großer Humbug, wenn's nach mir geht
- vgl. auch Segmentierungsalgorithmen mit Vektorraummodellen (IR)
- Diskurs-Strukturen
- Diskurse sind stark baumartig aufgebaut (d.h. keine flachen Satzfolgen, sondern Teillösungen in Teilbäumen)
- Skripte (übliche Gesprächsabläufe)
- Frames (bestimmte Stellen müssen gefüllt werden, Bahnhofsauskunft)
- Psycholinguistische Studien zu Referenz und Kohärenz
letzte Änderung: 14. August 2006.
mail AT timobaumann.de