POS-Tagging für Transkripte gesprochener Sprache
Die Autorin hat für ihre Arbeit 2020 den Peter-Roschy-Preis des Vereins der Freunde des Leibniz-Instituts für Deutsche Sprache erhalten.
Inhalt:
1 Einleitung
1.1 Was ist Part-of-Speech-Tagging?
1.2 Inhalt und Aufbau der Arbeit
1.3 Datengrundlage FOLK
1.4 Related Work
1.5 Pilotstudie
1.6 Zielsetzung der Arbeit
2 Theoretische Grundlagen
2.1 Grammatik der gesprochenen Sprache
2.2 Segmentierung von Transkripten gesprochener Sprache
2.3 Kontext und Multimodalität in der Face-to-Face-Interaktion
2.4 Wortarten in der gesprochenen Sprache
2.5 Weitere Klassifikationsprobleme
3 Empirischer Teil
3.1 Zielsetzung der empirischen Arbeit
3.2 Überblick über die empirische Vorgehensweise
3.3 Auswahl des Taggers und des Tagsets
3.4 Funktionsweise des Taggers
3.5 Möglichkeiten der Anpassung des Taggers und des Tagsets
3.6 Erstellen des Goldstandards
3.7 Erste Anpassung des Tagsets und der Guideline
3.8 Manuelle Korrektur des Development-Sets
3.9 Inter-Annotator-Agreement zur manuellen Korrektur des Development-Sets
3.10 Einführung eines Post-Processings
3.11 Zweite Anpassung der Guidelines
3.12 Entwicklung eines automatisierten Taggings anhand des Development-Sets
3.13 Manuelle Korrektur des Goldstandard-Sets
3.14 Entwicklung eines automatisierten Taggings anhand des Goldstandards
3.15 Evaluation des POS-Taggings für spontansprachliche Daten
3.16 Fazit
4 Abschließende Diskussion und Ausblick
Narr Francke Attempto Verlag GmbH + Co. KG
Dischingerweg 5
72070 Tübingen
Telefon: +49 (7071) 9797-0
Telefax: +49 (7071) 9797-11
http://www.narr.de
E-Mail: bader@narr.de