Toningenieur-Projekte

Distanz- und Richtungsabbildung einer ESMA-Hauptmikrofonierung

Bei paarweiser Mehrkanal-Äquivalenzstereophonie wie zum Beispiel Equally Spaced Microphone Array (ESMA) ergeben sich bei Orchesteraufnahmen Abbildungen mit Tiefenstaffelung, die überzeugend sind und von geschulten Tonmeistern als schön und passend empfunden werden. Allerdings gibt es gar nicht viele perzeptive Studien zur Distanz- und Richtungsabbildung, die man in der Literatur darüber finden würde, und zu guter Letzt widersprechen unsere technischen Metriken der gehörten Bevorzugung (Frauscher 2020, phaidra.kug.ac.at/o:104551).

Um über die Vorzüge und Eigenheiten ein besseres Verständnis zu erhalten, ist offenbar die Durchführung fehlender Hörversuche über die Richtungs- und Distanzabbildung eine wertvolle Methode.

Diese sollen auf Aufnahmen/Impulsantwortmessungen von Lautsprechern in verschiedenen Richtungen und Distanzen in einem Raum mit einem ESMA aufbauen. Ein Hörversuch in einem virtuell nachgebildeten Raum (in Unity, mit VR-Brille und Kopfhörer) ermöglicht es, die entstehenden Richtungs- und Distanzabbilder leichter zu erheben. Dazu platziert die Versuchsperson an das jeweils gehörte räumliche Abbild eine Kugel, im Raum, nicht nur in der Richtung sondern auch in der Distanz, was eine detaillierte statistische Auswertung ermöglicht (ähnlich wie Fig. 7 in doi.org/10.3390/app10113747). Dadurch lassen sich etwaige positionsabhängige Abbildungsverzerrungen in Distanz und Richtung feststellen.
Auch solche Abbildungsverzerrungen, die sich durch nicht zentrales Hören innerhalb der (virtuellen) Lautsprecherwiedergabe ergeben lassen sich damit erforschen, um den Einfluss der Hauptmikrofonierung auf die erreichbare Sweetspotgröße herausfinden zu können.

Interessent*innen können sich bei zotter(at)iem.at melden.

Wahrnehmung von Einhüllung und Überdeckung in audiovisueller 6-DOF Binauralwiedergabe

Im Rahmen dieser Projektarbeit soll untersucht werden, inwiefern räumliche Einhüllung (‘Envelopment’) oder Überdeckung (‘Engulfment’) in Augmented-Reality (AR) Virtualisierungen reproduziert werden können. Dazu soll ein bestehendes Framework zur 6-DOF (‘6 degrees of freedom’) Binauralwiedergabe genutzt und adaptiert werden, um einen Hörversuch durchzuführen. Der Versuch soll ein Blindvergleich zwischen der virtuellen Reproduktion über Kopfhörer und der realen Reproduktion über Lautsprecher sein, wobei die Versuchspersonen sich im echten Lautsprecher-System befinden. Das TI-Projekt erlaubt es sich in Spatial Audio und AR/VR Audio einzuarbeiten und fügt sich damit in die Forschungsarbeit am Institut ein.

Kontakt bei Interesse: Stefan Riedel (riedel(at)iem.at)

Auditory perception of vocal fry

Vocal fry is a voice quality that is characterized by the audibility of individual glottal pulses. This voice quality occurs frequently in healthy voice, but it may also be a sign of a voice disorder. Aim of the thesis is to identify properties of the speech signals that cause the auditory temporal separation of the glottal pulses. For single-peaked glottal pulses, it was shown in the past that the pulse rate is the most influential factor. However, the open quotient, i.e., the duty cycle, and the formant bandwidths may also play a role. Less is known about multi-peaked glottal pulses, which are amplitude and frequency modulated sinusoidal carriers. For such signals, it is hypothesized that the modulation depth is highly influential. In addition, peak prominence of loudness-time curves are hypothesized to be causally linked to the perception of vocal fry.
The tasks of the student will be the following. The student will familiarize herself or himself with the relevant scientific literature, computer synthesize stimuli, conduct auditory experiments, and disseminate the results (thesis/paper writing, presentations).

Required skills:
MATLAB, Python, Voice synthesis, Psychoacoustics, Experimental design

Contact:
Robert Höldrich (robert.hoeldrich(at)kug.ac.at)
Philipp Aichinger (philipp.aichinger(at)meduniwien.ac.at)

Auditory perception of diplophonic voice

Diplophonia is a voice quality that may be characterized by the simultaneous vibration of individual glottal oscillators at different frequencies. Most commonly, this results in the presence of two salient pitches in the voice sound. However, the sound may instead also be dominated by the beating of the two vibration frequencies. Aim of the thesis is to identify the physiological parameters of voice production that cause a voice to belong to either of the two types, i.e., the two-pitches type, or the beating type. It is hypothesized that the difference of the vibration frequencies plays a crucial role. Other factors that may influence the type allocation include the level difference, the strength of deterministic co-modulations, and the strength of random modulations of the two glottal oscillators.
The tasks of the student will be the following. The student will familiarize herself or himself with the relevant scientific literature, synthesize stimuli, conduct auditory experiments, and disseminate the results (thesis/paper writing, presentations).

Required skills:
MATLAB, Python, Voice synthesis, Psychoacoustics, Experimental design

Contact:
Robert Höldrich (robert.hoeldrich(at)kug.ac.at)
Philipp Aichinger (philipp.aichinger(at)meduniwien.ac.at)

Schallschutzspezifikation im Musikbereich

In der Bauakustik wird als Spezifikation für den baulichen Schallschutz oft die bewertete Standardschallpegeldifferenz DnT,w als Einzahlwert angegeben. In sensiblen Nutzungsszenarien im Bereich der Musik – wie zB im universitären Kontext - zeigt sich jedoch, dass selbst sehr hohe DnT,w–Werte eine allseits zufriedenstellende Schallschutzsituation nicht sicherstellen können. Dies liegt einerseits an der Tatsache des Einzahlwertes und seiner Ermittlung. Andererseits bleiben auch die spektralen und zeitlichen Charakteristika der konkreten Schallemissionen, die je nach Aktivität (Einzelunterricht versus Ensembleprobe), Instrumentengattung, Ensemblezusammensetzung und Genre variieren, ebenfalls unberücksichtigt.

Ziel dieser Projektarbeit ist es eine Grundlage für eine verbesserte Spezifikation von Schallschutzanforderungen im Musikbereich zu erarbeiten. Dafür sollen einerseits in typischen Nutzungssituationen der Schallpegel und das Schallsignal aufgezeichnet werden, um daraus eine nutzungsspezifische Verteilung von spektraler Charakteristik und Pegel ableiten zu können. Als zweiten Schritt soll ein Verfahren zur Schallschutzspezifikation  vorgeschlagen werden, das zwar auf den gängigen Normen ausbaut und gegebenenfalls die Festlegung ergänzender Forderungen vorsieht.

Da die Schallmessungen und -aufnahmen im Kontext von künstlerischen Lehrveranstaltungen der KUG durchgeführt werden sollen, ist dies während der Sommerferien nicht möglich.

InteressentInnen melden sich bitte am IEM bei Prof. Höldrich -  robert.hoeldrich(at)kug.ac.at

Synchrone Surround-Aufnahme von Bild und Ton mit dynamischer Wiedergabe

Für Bild und Ton existieren diverse technische Ansätze und Umsetzungen für eine Panorama und Surround-Aufnahme. Im Rahmen des Projektes sollten ausgewählte, geeignete Verfahren zur Bild- und Tonaufnahme zu einem 3D-Produktionstool zusammengeführt werden. Zusätzlich zur gewünschten Synchronisierung der beiden Medien soll durch Hinzunahme eines Trackingsystems die interaktive Steuerung richtungsbezogener Inhalte realisiert werden. Für die 3D-Tonaufnahme kommt das Eigenmike (mhacoustics) [1] zur Anwendung. Zur Bildaufnahme kommt die von Peter Venus entwickelte 3D-Kamera zum Einsatz [2]. Bestehende Softwarelösungen für Bild [2] und Ton [4] sind vorhanden und sollten im Rahmen des Projektes zusammengeführt werden, wodurch die besagte Interaktivität bereichert wird.

[1] www.mhacoustics.com/products

[2] http://extendedview.mur.at/

[3] www.matthiaskronlachner.com/

InteressentInnen melden sich bitte bei: Alois Sontacchi - sontacchi(at)iem.at

Klangcharakterisierung zur Unterscheidung von Fahrzeugklassen und deren Binnendifferenzierung

In der Literatur findet man zum Begriff Klangfarbe eine Vielzahl an Definitionen. Diese Begriffserklärungsversuche und Definitionen belegen in Summe aber die Komplexität und Schwierigkeit, eine klar abgegrenzte und eindeutige Eigenschaft zu beschreiben.  Zur Beschreibung der Klangtextur (= wahrgenommene Klangzusammensetzung) wird eine Vielzahl an Indikatoren und Klangbeschreibungsgrößen untersucht, die spektrale und temporale Signaleigenschaften zu einer näheren Klangcharakterisierung zusammenführen, wobei sich das untersuchte Klanguniversum auf Fahrzeuginnen- und -außengeräusche von Verbrennungsmotoren konzentriert. Die gesuchten Indikatoren der Klangcharakterisierung ermöglichen die klangliche Unterscheidung von Fahrzeugklassen und innerhalb deren eine Binnendifferenzierung.

Zusätzlich zu etablierten Beschreibungsgrößen aus dem Automobilbereich werden neue Indikatoren untersucht: die energetische Verteilung auf deterministische und stochastische Signalkomponenten, Intervalle und Akkordstrukturen, sowie die tonale Zuordnung (pitch salience), die globale und drehzahlabhängige Lage von Formanten u. A.

InteressentInnen melden sich bitte bei: Alois Sontacchi - sontacchi(at)iem.at

Analyse und Resynthese von Wind- und Rollgeräuschen bei Fahrzeugen

Der Entwurf und die Evaluierung von Motorklängen für Fahrzeuge mit Verbrennungs- oder Elektromotor setzt eine möglichst realistische Geräuschkulisse voraus. Diese besteht dem dem Motorklang selbst hauptsächlich aus Wind- und Rollgeräuschen. Ziel dieser Arbeit ist einerseits die Analyse von vorhandenen Innengeräuschaufnahmen, wobei der Beitrag des Motorklanges entfernt werden soll (Analyse und Resynthese bereits vorhanden). Andererseits sollen die Wind- und Rollgeräusche effizient und parametrisierbar resynthetisiert werden. Eine einfache Resynthese für Windgeräusche wäre beispielsweise ein Rauschen, das quadratisch mit der Geschwindigkeit ansteigt.

InteressentInnen bitte melden bei: Matthias Frank

Einfluss des Wiedergaberaumes auf räumliche Wiedergabeverfahren

Die Evaluierung räumlicher Wiedergabeverfahren erfolgt meist unter reflexionsarmen Bedingungen, die eine größtmögliche Kontrolle des wiedergegebenen Schallfeldes erlauben. Jedoch erfolgt die Bearbeitung und Wiedergabe räumlicher Aufnahmen meist in Studios und Wohnzimmern, die nicht reflexionsarm sind. In der Theorie tragen reflexionsarme Wiedergaberäume zu einer genauen Lokalisation bei, während Reflexionen zu einer ausgewogeneren Klangfarbe führen. In dieser Arbeit soll der Einfluss von Nachhallzeit und Hallradius des Wiedergaberaumes auf Lokalisation, Klangfarbe und Quellbreite experimentell untersucht werden. Für das Experiment können Lautsprecheraufstellungen mit unterschiedlichen Radien und eine Echtzeitverhallung im IEM CUBE verwendet werden.

InteressentInnen bitte melden bei: Matthias Frank

Lokalisation von horizontalen Phantomschallquellen an dezentralen Hörpositionen

Die Hörereignisrichtung ist einer der wichtigsten räumlichen Parameter bei räumlichen Wiedergabeverfahren. Bisherige Untersuchungen zur Lokalisation von Phantomschallquellen haben sich hauptsächlich mit der Lokalisation in der zentralen Hörposition beschäftigt. Für diesen Fall gibt es mehrere Modelle zur Vorhersage der Hörereignisrichtung, darunter ein sehr einfaches geometrisches Modell. Ziel dieser Arbeit ist die Untersuchung der Lokalisation an dezentralen Hörpositionen und die Erweiterung der Vorhersagemodelle, insbesondere des geometrischen Modells. Als Grundlage dazu dienen Versuchsergebnisse aus der Literatur und dem IEM. Für die Verfeinerung der Modelle sind gegebenenfalls eigene Hörversuche notwendig.

InteressentInnen bitte melden bei Matthias Frank frank(at)iem.at