Abschlussarbeit

Zurück zur Liste

Speech Enhancement with Factor-Graphs

AutorInnen Irnberger, W.
Jahr 2003
Art der Arbeit Diplomarbeit
Themenfeld Audiosignalverarbeitung
Schlagwörter Sprachverarbeitung
Abstract In dieser Arbeit wird versucht, Sprachsignale mittels Faktor-Graphen zu bearbeiten und damit die Sprachverständlichkeit gestörter Signale zu verbessern. Dazu wurde das Linear Predictive Coding (LPC)-Modell zur synthesischen Spracherzeugung herangenommen und in die Faktor-Graphen Darstellung übergeführt. Dieses erste Modell wird in dieser Arbeit als Ausgangpunkt für weitere Verbesserungen und Abänderungen herangezogen. Kapitel 2 gibt eine kurze Einleitung in die Theorie der Faktor-Graphen. Es wird die Darstellung, der Umgang und die Berechnung von Faktor-Graphen erläutert. In Kapitel 3 wird das vorhandene LPC-Modell in der Faktor-Graphen Darstellung erklärt. Linear Predictive Coding kommt aus der digitalen Sprachverarbeitung und wird zur Sprachsynthese und auch Analyse verwendet. Kapitel 4 befasst sich mit der Erweiterung des Graphen um ein Störmodell und Modifizierungen bei den Filtergewichten um diese besser nachbilden zu können. Diese Veränderungen sollen das gesamte Modell verbessern. Um reale Sprachsignale in Echtzeit verarbeiten zu können, wird in Kapitel 5 der Aufbau des Faktor-Graphen dynamisiert. Damit soll der Rechenaufwand minimiert werden. Diese Dynamisierung und die Auswirkungen der in Kapitel 4 eingeführten Veränderungen werden in Kapitel 6 getestet. Die verwendete Programmier- und Simulationsumgebung ist C++.
URL http://phaidra.kug.ac.at/o:11114
BetreuerInnen Höldrich, R., Korl, S.