Masterarbeiten

Akustischer Kontrastverstärker

Ständig nutzen wir unsere Ohren, um Informationen über unsere Umgebung zu sammeln: Wir klopfen die Wand ab, um ein geeignete Stelle für ein Bohrloch zu finden. Wir klopfen Obst und Gemüse ab (z.B. Wassermelonen), um den Reifegrad zu bestimmen. Wir klopfen auf Fässer, um deren Füllstand zu bestimmen. Geigenbauer stimmen Decke und Boden mit dem Klopfton aufeinander ab.
All diese Beispiele können unter dem Begriff Perkussion zusammengefasst werden. Auch Ärzte schätzen die Perkussion als einfaches Diagnosewerkzeug.
Der akustische Kontrastverstärker soll diese und evtl. auch andere Hörpraktiken erweitern, indem charakteristische Eigenschaften eines Klangs stärker herausgearbeitet werden (Cartoonifizierung), bzw. die Unterschiede zwischen verschiedenen Klängen verstärkt werden. Ein echtzeitfähiger Algorithmus dazu wurde bereits veröffentlicht [1]. Das System funktioniert ähnlich einem Hörgerät, mit einigen Parametern zur Kontrastverstärkung, siehe Demo-Video [2].
Im Rahmen der Masterarbeit soll nun getestet werden, ob das System unter realen Bedingungen auch hält, was es verspricht: Können Versuchspersonen damit z.B. versteckte Hohlräume in der Wand besser erkennen?
Zusätzlich soll die Software-Implementierung in SuperCollider optimiert (oder auch nach Pd oder C portiert) werden, um mit niedriger Latenz auf der Bela Plattform [3] zu laufen. Hierfür soll schließlich ein schickes, handliches Gehäuse mit intelligenter Kontrollstrategie (z.B. mit Hardware-Buttons/Fadern/Potis) entworfen werden, um eine möglichst einfache und intuitive Handhabung zu ermöglichen.
Je nach Interesse soll außerdem ein weiteres Verfahren zur akustischen Kontrastverstärkung entwickelt und implementiert werden - für den Einsatz jenseits der Perkussion, gerne auch für künstlerische Anwendungen.
Der Schwerpunkt der Arbeit kann je nach Vorkenntnissen und persönlichem Interesse ausgerichtet werden, z.B. auf Signalverarbeitung, Wahrnehmungspsychologie oder Interaktionsdesign.
Mindestanforderung: Grundkenntnisse in Matlab/Octave oder SuperCollider. Es sind keinerlei Vorkenntnisse in Hardware-Entwicklung notwendig!

Interessent_innen melden sich bitte bei Marian Weger (weger(at)iem.at).

[1] M. Weger & R. Höldrich (2019). A hear-through system for plausible auditory contrast enhancement. researchgate.net/publication/335715503
[2] Demo-Video: fedora.kug.ac.at/fedora/get/o:91922/bdef:Content/download
bzw. hier noch weitere: phaidra.kug.ac.at/o:91924
[3] Bela Plattform: bela.io

Entwicklung und Bau einer Experimentierplattform zur elektronischen Klangveränderung eines Tischs in Echtzeit

Ein Glastisch klingt anders als ein Holztisch - z.B. wenn man darauf schreibt, klopft, oder Gegenstände ablegt. Auf die Verwendbarkeit als Tisch hat das Material aber kaum einen Einfluss. Wie wäre es also, wenn ein Tisch physikalisch plausibel seinen Klang veränderte, um damit unaufdringlich Informationen zu vermitteln? Ein Beispiel: Während der Arbeitszeit klingt der Schreibtisch nach Holz, nach Feierabend klingt er nach Glas. Oder: Je höher der Aktienkurs, desto größer der Schreibtisch (--> tiefere Tonhöhe). Der Tisch wird somit zum akustischen Display zur Sonifikation beliebiger Daten. Wird zusätzlich die Position der Anregung lokalisiert, so ist es zudem möglich, unterschiedliche Regionen der Tischplatte individuell zu "augmentieren", um z.B. zweidimensionale Formen akustisch darzustellen. In einem anderen Kontext wird der Tisch zum Musikinstrument, ähnlich dem Hang oder der Steeldrum.

Für mehrere solcher Anwendungsgebiete wurden am IEM bereits Prototypen entwickelt: ein augmentiertes Grafiktablett, eine Klanginstallation zum "Malen nach Klang", sowie verschiedene Studien zur Sonifikation von Stromverbrauchsdaten (Videos und Literatur: [1]).

Im Rahmen dieser Arbeit soll nun auf Basis der bisherigen Prototypen eine neue Experimentierplattform entwickelt und gebaut werden, die alle bisher gewonnenen Erkenntnisse und Algorithmen in sich vereint. Neben künstlerischen Anwendungen zielt das System vor allem auf Hörversuche ab: Von besonderem Interesse sind dabei Unterscheidbarkeits-Schwellen (ab wann ist eine bestimmte Klangveränderung hörbar), sowie die Kanalkapazität (wie viel Information kann mit dieser Methode vermittelt werden).

Die Implementierung erfolgt in Pd oder SuperCollider, die Evaluierung einzelner Algorithmen erfolgt in Matlab/Octave.

InteressentInnen melden sich bitte bei Robert Höldrich (hoeldrich(at)iem.at) oder Marian Weger (weger(at)iem.at).

[1] Weitere Informationen, sowie Literatur und Videos: http://iem.at/~weger/ausschreibung

Modellierung der Echounterdrückung unterschiedlicher Reflexionseigenschaften

Der Präzedenzeffekt beschreibt eine Gruppe von Wahrnehmungsphänomenen, bei dem der Direktschall die Wahrnehmung dominiert. Studien zum Präzedenzeffekt verwenden üblicherweise das Paradigma der Spiegelschallquelle um den Einfluss von Reflexionseigenschaften wie Absorption, Laufzeit oder Richtung auf die Wahrnehmung zu untersuchen.

Bei Schallreflexionen an realen Wänden kommt es aufgrund der Oberflächenbeschaffenheit zu einer teilweisen räumlichen und zeitlichen Aufweitung des reflektierten Schalls. Dabei beschreibt der Streuungskoeffizient den Anteil der Energie, welcher nicht in Richtung der Spiegelreflexion reflektiert wird.

In dieser Arbeit soll ausgehend von einem Modell einer diffusen Reflexion die Ausbildung des Präzedenzeffektes in Form der Echoschwelle in einem Hörversuch untersucht werden. Die gewonnenen Versuchsdaten sollen zusammen mit bereits bestehenden Daten dazu verwendet werden, um ein Wahrnehmungsmodell der Echounterdrückung  zu erweitern.

InteressentInnen melden sich bitte bei: Florian Wendt  - wendt(at)iem.at oder Robert Höldrich -  robert.hoeldrich(at)kug.ac.at

Einfluss zeitvarianter Kammfilter auf die Höhenwahrnehmung

Ein bekanntes Phänomen der Höhenwahrnehmung ist der sogenannte Pitch-Height-Effekt, bei dem Klänge in höherer Tonlage tendenziell elevierter wahrgenommen werden als entsprechend tiefere Klänge. Dieses Mapping von Tonhöhe auf unsere innere Repräsentation von Raum lässt sich vor allem bei kontinuierlichen Tonhöhenänderungen beobachten.

Das Schallfeld in geschlossenen Räumen besteht aus Direktschall und Reflexionen. Durch Bewegung der Schallquelle ändern sich die entsprechenden Zeitverzögerung zwischen den einzelnen Schallen, wodurch das überlagerte Schallfeld am Ohr der hörenden Person eine Kammfilterung erfährt. Besonders bei breitbandigen Signalen kann diese zeitvariante Filterung als Glissando wahrgenommen werden.

In dieser Arbeit soll die Höhenwahrnehmung zeitvarianter Kammfilter hervorgerufen durch bewegte Schallquellen untersucht werden. Die Arbeit soll sich dabei auf Kammfilter konzentrieren, welche sich durch Überlagerung von Direktschall und Reflexionen resultierend aus physikalisch plausiblen Aufstellungen ergeben. Deren Auswirkung auf die Höhenwahrnehmung soll anschließend in einem Hörversuch untersucht werden.

InteressentInnen melden sich bitte bei: Florian Wendt  - wendt(at)iem.at oder Robert Höldrich -  robert.hoeldrich(at)kug.ac.at

Auditory perception of diplophonic voice

in Zusammenarbeit mit der Medizinischen Universität Wien


Diplophonia is a sign of vocal dysfunction and is characterized by the presence of two simultaneous pitches in the voice sound. In order to create a diagnostic tool for the medical profession, diplophonia needs to be better understood and objectified. Aim of the project is to determine experimentally and theoretically the circumstances under which two simultaneous pitches are perceived. The candidate’s tasks will be to review the literature, to plan and to perform experiments and to document the work. Optionally, the candidate will produce a publication for a scientific conference and/or Journal.

Tasks:
Literature review
Experimental work
Documentation

Your profile:
Good skills in ear training and analytic hearing
Interest in scientific texts and in formulating scientific questions
Interest in psychoacoustics and experimental design
Very good programming skills in MATLAB
Good English and LaTex skills
Psychoakustik 1/(2), Versuchsdesign in der Psychoakustik

Contact:
Univ.Prof. Dr. Robert Höldrich
Dr. Philipp Aichinger  or 01/40400 11670

Lokalisation von horizontalen Phantomschallquellen an dezentralen Hörpositionen

Die Hörereignisrichtung ist einer der wichtigsten räumlichen Parameter bei räumlichen Wiedergabeverfahren. Bisherige Untersuchungen zur Lokalisation von Phantomschallquellen haben sich hauptsächlich mit der Lokalisation in der zentralen Hörposition beschäftigt. Für diesen Fall gibt es mehrere Modelle zur Vorhersage der Hörereignisrichtung, darunter ein sehr einfaches geometrisches Modell. Ziel dieser Arbeit ist die Untersuchung der Lokalisation an dezentralen Hörpositionen und die Erweiterung der Vorhersagemodelle, insbesondere des geometrischen Modells. Als Grundlage dazu dienen Versuchsergebnisse aus der Literatur und dem IEM. Für die Verfeinerung der Modelle sind gegebenenfalls eigene Hörversuche notwendig.

Interessentinnen bitte melden bei Matthias Frank frank(at)iem.at

Automatische Klassifizierung pathologischer Stimmklänge

Anhand bestimmter akustischer Messwerte ist eine manuelle Klassifizierung nach krank und gesund, oder zumindest eine wahrscheinliche Zuordung subjektiv bereits möglich. Seit den 1950er Jahren werden Verfahren künstlicher Intelligenz entwickelt, die nun auch in diesem Bereich der Medizin eine automatische Klassifizierung möglich machen sollen. In dieser Diplomarbeit werden Verfahren zur automatischen Klassifizierung erlernt. Es werden Toolboxes zur automatischen Klassifizierung gesammelt und für verschiedene Anwendungsbereiche getestet und kritisch evaluiert.
Für diese Diplomarbeit werden ausgezeichnete Programmierkenntnisse (vorzugsweise Praat, MATLAB und SPSS) und sehr gutes mathematisch-analytisches Verständnis (Statistik) sowie Interesse an Klassifizierungsalgorithmen vorausgesetzt.

Betreuer: Alois Sontacchi oder Philipp Aichinger Universitätsklinik HNO Währinger Gürtel 18-20, 1090 Wien

Spektralanalyse mit Zeit-Frequenz Neuzuweisung und Gehör angepasster Frequenzachse

Spectrum Analysis with Time-Frequency Reassignment and Auditory Frequency Scale

a) Einarbeitung in die Zeit-Frequenz-Zuweisungsmethoden zur Lokalisierung zeitlicher und frequenzmäßiger Schwerpunkte im Signal:
- genaue Frequenzzuordnung bei Sinuskomponenten,
- oder genaue Zeitzuordnung bei impulshaltigen Komponenten
b) Einarbeitung in die am Institut gefundene Methode zur Sweepratenschätzung Einarbeitung in die Frequenzachsenverzerrung mit Allpassketten zur Anpassung der Spektralauflösung an das menschliche Gehör
c) Anpassen der Zeit-Frequenzzuweisungsmethoden und Sweepratenschätzung auf die Gehör gerechte Domäne mit verzerrter Frequenzachse
d) Spektrale Klangmodellierung mit der neuen Methode

Betreuer: Alois Sontacchi

Messapplikationen für den IEM Mehrkanalmessplatz

Das IEM verfügt über eine akustisch bedämpfte Messkoje mit großzügigem Mehrkanalinterface, sowie einer großen Anzahl an zugehörigen Mikrofonen. Mit dieser Ausstattung kann eine ganze Palette von Messaufgaben in annehmbarer Qualität bewältigt werden. Als Beispiel bisher getätigter Messungen kann die Schallleistungsbestimmung, die Abstrahlungsmessung und die Vermessung von HRTF Kurven genannt werden.

Die Implementierung der Messroutinen erfolgt in PD. Zu den einzelnen Messapplikationen sind die grundlegenden Programmstrukturen vorhanden. Zur Vereinfachung komplexer Rechenschritte ist eine Anbindung an GNU/octave möglich. Zu den wichtigsten Messanwendungen gehören:

1. Applikation zur Kalibrierung und Entzerrung der Mikrofonpegel einer Mehrkanalanordnung
2. Messapplikation zur Mehrkanal-Impulsantwortmessung (Farina Methode)
a) Mehrkanaleingang, Einkanalausgang
b) Mehrkanalausgang, Einkanaleingang (Multisweepmessung)
c) vollständiges MIMO System (Multisweepmessung)
3. Applikation zur HRTF Analyse (Mehrkanal-Impulsantwortmessung + Drehtellersteuerung)
4. Modul zur Echtzeit-Spektralanalyse für die Mehrkanalumgebung

Betreuer: Franz Zotter