Abschlussarbeit

Zurück zur Liste

Entwurf und Evaluierung eines Klassifikationsalgorithmus für Sprache, Musik und Alltagsumgebungsgeräusche

AutorInnen Rothmund, F.
Jahr 2017
Art der Arbeit Masterarbeit
Themenfeld Sonifikation
Abstract Ziel dieser Arbeit war der Entwurf und die Evaluierung eines Algorithmus zur Klassifizierung eines Audiodatenstroms in die Kategorien Musik, Sprache und Alltagsumgebungsgeräusche. Herkömmlicherweise wurden zur Audioklassifizierung konventionelle statistische Klassifikationsverfahren in Verbindung mit sogenannten Merkmalsvektoren verwendet, welche das Audiosignal mit wenigen Beschreibungsgrößen charakterisieren. Angeregt durch die erfolgreiche Anwendung in den Bereichen Bildklassifikation und Objekterkennung, wurden in den letzten Jahren erfolgreich sogenannte Deep Neural Nets zur Audioklassifizierung verwendet. Diese Arbeit beurteilt sowohl herkömmliche Klassifizierungsverfahren, als auch sogenannte Deep Learning Methoden für die Klassifizierung von Audiodaten in Echtzeit. Die Algorithmen wurden mit Aufnahmen einer Fernfeld-Mikrofonanordnung in verschiedenen häuslichen und gewerblichen Umgebungen evaluiert. Im engeren Sinne wurden eine nicht-lineare Support Vector Machine (SVM) in Verbindung mit verschiedenen Beschreibungsgrößen, und ein Convolutional Neural Net (CNN) in Verbindung mit Mel-Spektrogrammen untersucht. Während für saubere Signale beide Klassifikationsverfahren exzellente Erkennungsraten erzielen, funktionierte die SVM für Aufnahmen mit den Fernfeld- Mikrofonaufnahmen sehr schlecht. Mit dem CNN konnten für Audio-Clips von 1 Sekunde Erkennungsraten von über 94% erreicht werden.
BetreuerInnen Bauer, G., Sontacchi, A.