Abschlussarbeiten

Zurück zur Liste

Speech Enhancement with Factor-Graphs

Abstract In dieser Arbeit wird versucht, Sprachsignale mittels Faktor-Graphen zu bearbeiten und damit die Sprachverständlichkeit gestörter Signale zu verbessern. Dazu wurde das Linear Predictive Coding (LPC)-Modell zur synthesischen Spracherzeugung herangenommen und in die Faktor-Graphen Darstellung übergeführt. Dieses erste Modell wird in dieser Arbeit als Ausgangpunkt für weitere Verbesserungen und Abänderungen herangezogen. Kapitel 2 gibt eine kurze Einleitung in die Theorie der Faktor-Graphen. Es wird die Darstellung, der Umgang und die Berechnung von Faktor-Graphen erläutert. In Kapitel 3 wird das vorhandene LPC-Modell in der Faktor-Graphen Darstellung erklärt. Linear Predictive Coding kommt aus der digitalen Sprachverarbeitung und wird zur Sprachsynthese und auch Analyse verwendet. Kapitel 4 befasst sich mit der Erweiterung des Graphen um ein Störmodell und Modifizierungen bei den Filtergewichten um diese besser nachbilden zu können. Diese Veränderungen sollen das gesamte Modell verbessern. Um reale Sprachsignale in Echtzeit verarbeiten zu können, wird in Kapitel 5 der Aufbau des Faktor-Graphen dynamisiert. Damit soll der Rechenaufwand minimiert werden. Diese Dynamisierung und die Auswirkungen der in Kapitel 4 eingeführten Veränderungen werden in Kapitel 6 getestet. Die verwendete Programmier- und Simulationsumgebung ist C++.
Autor*innen Irnberger, W.
Betreuer*innen Höldrich, R., Korl, S.
Jahr 2003
Art der Arbeit Diplomarbeit
URL https://phaidra.kug.ac.at/o:11114
Anmerkung Audiosignalverarbeitung
Status abgeschlossen
Keywords Sprachverarbeitung