Abschlussarbeit

Zurück zur Liste

Verbesserte räumliche Wiedergabe durch Quellseparation

AutorInnen Meyer-Kahlen, N.
Jahr 2018
Art der Arbeit Masterarbeit
Themenfeld Audiosignalverarbeitung
Schlagwörter Music Information Retrieval
Abstract Technologien zur räumlichen Schallfeldaufnahme, und -wiedergabe wurden in den letzten Jahren stetig weiterentwickelt. Speziell das Aufkommen der virtuellen Realität hat diese Entwicklung beschleunigt und dazu beigetragen, dass sich Ambisonics als dominierendes Format durchsetzen konnte. In einer Higher Order Ambisonics (HOA) Aufnahme ist detaillierte räumliche Information über die Schallquellen enthalten. Liegt allerdings nur ein Stereoformat oder eine First Order Ambisonics (FOA) Produktion vor, ist die Richtungsauflösung deutlich begrenzt. Diese Arbeit beschäftigt sich mit Ansätzen um aus derartigen Aufnahmen einzelne Signalkomponenten zu extrahieren, mit dem Ziel räumlich besser aufgelöste Varianten zu erzeugen. Hierzu wird zunächst ein praktikabler Ansatz zur Trennung von direkten und diffusen Schallanteilen basierend auf der Kohärenzfunktion beschrieben. Darüber hinaus wird ein Quellseparationsansatz verwendet, um einzelne Bestandteile des Signals zu ermitteln und zu extrahieren. Der untersuchte Quellseparationsansatz beruht auf der Nicht-negativen Matrix-Faktorisierung (NMF) mit mehrdimensionalem Eingang (auch Nicht-negative Tensor-Faktorisierung, NTF). Unterschiedliche Aspekte bestehender NMF und NTF Ansätze werden diskutiert, wobei vor allem auf die statistische Interpretation eingegangen wird. Ein möglicher Algorithmus auf Basis eines derartigen statistischen Ansatzes wird vorgestellt und ein Gibbs Sampler für das mehrdimensionale Problem hergeleitet und in der Audioanwendung getestet. Zuletzt werden Gruppierungsstrategien auf Basis von cepstralen und räumlichen Eigenschaften vorgestellt.
BetreuerInnen Sontacchi, A.