Abschlussarbeit
Zurück zur Liste
Speech Enhancement with Factor-Graphs
AutorInnen | |
Jahr | 2003 |
Art der Arbeit | Diplomarbeit |
Themenfeld | Spatial Audio |
Schlagwörter | Ambisonics, Akustik, Wiedergabetechnik, Signalverarbeitung |
Abstract | In dieser Arbeit wird versucht, Sprachsignale mittels Faktor-Graphen zu bearbeiten und damit die Sprachverständlichkeit gestörter Signale zu verbessern. Dazu wurde das Linear Predictive Coding (LPC)-Modell zur synthesischen Spracherzeugung herangenommen und in die Faktor-Graphen Darstellung übergeführt. Dieses erste Modell wird in dieser Arbeit als Ausgangpunkt für weitere Verbesserungen und Abänderungen herangezogen. Kapitel 2 gibt eine kurze Einleitung in die Theorie der Faktor-Graphen. Es wird die Darstellung, der Umgang und die Berechnung von Faktor-Graphen erläutert. In Kapitel 3 wird das vorhandene LPC-Modell in der Faktor-Graphen Darstellung erklärt. Linear Predictive Coding kommt aus der digitalen Sprachverarbeitung und wird zur Sprachsynthese und auch Analyse verwendet. Kapitel 4 befasst sich mit der Erweiterung des Graphen um ein Störmodell und Modifzierungen bei den Filtergewichten um diese besser nachbilden zu können. Diese Veränderungen sollen das gesamte Modell verbessern. Um reale Sprachsignale in Echtzeit verarbeiten zu können, wird in Kapitel 5 der Aufbau des Faktor-Graphen dynamisiert. Damit soll der Rechenaufwand minimiert werden. Diese Dynamisierung und die Auswirkungen der in Kapitel 4 eingeführten Veränderungen werden in Kapitel 6 getestet. Die verwendete Programmier- und Simulationsumgebung ist C++. |
URL | http://phaidra.kug.ac.at/o:11114 |
BetreuerInnen |