Abschlussarbeit

Zurück zur Liste

Automatische Satzsegmentierung von Sprache unter Verwendung von prosodischen Merkmalen

AutorInnen Pausch, F.
Jahr 2011
Art der Arbeit Toningenieur-Projekt
Themenfeld Audiosignalverarbeitung
Schlagwörter Sprachverarbeitung
Abstract Automatische Satzsegmentierung von Sprache stellt einen wichtigen ersten Schritt in vielen Bereichen der Sprachsignalverarbeitung dar. Spracherkennungsprogramme geben meist nur die Grenzen von Wörtern aus ohne vorhandene Strukturen wie Satzgrenzen zu detektieren. In der linguistischen Sprachverarbeitung werden jedoch genau solche Grenzen benötigt, damit Programme zuverlässig funktionieren. Abgesehen davon ist es sehr zeitaufwendig, Satzgrenzen per Hand zu labeln. Ziel ist deshalb die Entwicklung eines Algorithmus, der eine Satzsegmentierung unter Verwendung von prosodischen Merkmalen durchführt. In dieser Projektarbeit wird dabei die Aix-MARSEC Datenbank, eine Sammlung von BBC Nachrichten, einer Analyse unterzogen. Der Algorithmus gliedert sich dabei folgendermaßen: Stimmhafte Regionen werden zunächst mittels eines adaptiven, energiebasierenden Spracherkennungsalgorithmus detektiert und die Pausenlängen bzw. die Intensität als erste Features berechnet. Die gefundenen Blöcke stellen die Regionen für die nachfolgende Tonhöhenanalyse dar. An den Grenzen werden Tendenzen im Tonhöhenverlauf mittels linearer Regression (optimal im Sinne eines kleinsten quadratischen Fehlers) berechnet und daraus verschiedene prosodische Merk- male (Intonation an Satzgrenzen, Gradient der Intonation, Grundtonabfall...) abgeleitet werden. In weiterer Folge werden diese Merkmale in einem Entscheidungsbaum kombiniert und die Satzgrenzen ermittelt.
URL http://phaidra.kug.ac.at/o:11447
BetreuerInnen Jany-Luig, J.