Toningenieur-Projekte
Entwurf eines 'Head-Mounted Microphone Array' für räumliche Schallfeldaufnahme
Im Rahmen dieses Projekts soll ein 3D-gedruckter Brillenrahmen mit mehreren integrierten Mikrofonkapseln entworfen werden. Der Aufbau einer Vorverstärkerschaltung für die Mikrofonkapseln ist ebenso Teil des Projekts wie die räumliche Vermessung des Arrays. Das Mikrofonarray auf der Brille soll eine räumliche Schallfeldaufnahme sowie Beamforming zur Störgeräuschunterdrückung in Augmented-Reality-Anwendungen ermöglichen.
Kontakt bei Interesse: Stefan Riedel (riedel(at)iem.at)
Distanz- und Richtungsabbildung einer ESMA-Hauptmikrofonierung
Bei paarweiser Mehrkanal-Äquivalenzstereophonie wie zum Beispiel Equally Spaced Microphone Array (ESMA) ergeben sich bei Orchesteraufnahmen Abbildungen mit Tiefenstaffelung, die überzeugend sind und von geschulten Tonmeistern als schön und passend empfunden werden. Allerdings gibt es gar nicht viele perzeptive Studien zur Distanz- und Richtungsabbildung, die man in der Literatur darüber finden würde, und zu guter Letzt widersprechen unsere technischen Metriken der gehörten Bevorzugung (Frauscher 2020, phaidra.kug.ac.at/o:104551).
Um über die Vorzüge und Eigenheiten ein besseres Verständnis zu erhalten, ist offenbar die Durchführung fehlender Hörversuche über die Richtungs- und Distanzabbildung eine wertvolle Methode.
Diese sollen auf Aufnahmen/Impulsantwortmessungen von Lautsprechern in verschiedenen Richtungen und Distanzen in einem Raum mit einem ESMA aufbauen. Ein Hörversuch in einem virtuell nachgebildeten Raum (in Unity, mit VR-Brille und Kopfhörer) ermöglicht es, die entstehenden Richtungs- und Distanzabbilder leichter zu erheben. Dazu platziert die Versuchsperson an das jeweils gehörte räumliche Abbild eine Kugel, im Raum, nicht nur in der Richtung sondern auch in der Distanz, was eine detaillierte statistische Auswertung ermöglicht (ähnlich wie Fig. 7 in doi.org/10.3390/app10113747). Dadurch lassen sich etwaige positionsabhängige Abbildungsverzerrungen in Distanz und Richtung feststellen.
Auch solche Abbildungsverzerrungen, die sich durch nicht zentrales Hören innerhalb der (virtuellen) Lautsprecherwiedergabe ergeben lassen sich damit erforschen, um den Einfluss der Hauptmikrofonierung auf die erreichbare Sweetspotgröße herausfinden zu können.
Interessent*innen können sich bei zotter(at)iem.at melden.
Entwurf und Evaluation von Augmented-Reality In-Ear-Kopfhörern
‘Augmented-Reality’ bezeichnet die computergestützte Erweiterung unserer wahrgenommenen Umgebung. Eine erfolgreiche Augmentierung im auditiven Sinne bedeutet, dass virtuelle Quellen nicht von echten Quellen unterscheidet werden können. Insbesondere sollen echte Schallquellen weiterhin unverändert wahrgenommen werden. Eine Voraussetzung dafür sind akustisch transparente Kopfhörer, welche die Außenohrübertragungsfunktion (engl. HRTF) der hörenden Person möglichst wenig beeinflussen. Hierfür sollen neuartige Geometrien für In-Ear Kopfhörer entwickelt werden, und mittels 3D-Druck umgesetzt werden. Hierbei spielen neben den genannten akustischen Zieleigenschaften die Ergonomie beim Tragen solcher Kopfhörer eine wesentliche Rolle.
Neben dem geometrischen Entwurf stellt sich die Herausforderung eines elektroakustischen Entwurfs der einen Mikrolautsprecher und ein Mikrofon integrieren soll. Aufgrund des Umfangs empfiehlt sich die Bearbeitung des Themas durch ein Team aus zwei Projektant*innen.
Kontakt bei Interesse: Stefan Riedel (riedel(at)iem.at)
Lokalisation vs. Einhüllung
Bei der Tonmischung von Stereo- und Mehrkanalmaterial ist die Signalkorrelation ein wichtiger Signalparameter mit dem die wahrgenommene Lokalisation, Quellbreite und Einhüllung gesteuert werden können. Sind die Signale einer Stereo-Lautsprecheranordnung korreliert und gleichgewichtet, ergibt sich eine einzelne Phantomschallquelle in der Mitte der Anordnung. Liegen hingegen zwei unkorrelierte Signale vor, können sich zwei völlig getrennte Hörereignisse einstellen. Im Rahmen dieses TI-Projekts soll ein Hörversuch entworfen und durchgeführt werden, der Hörereignisse bei Stereo- und Mehrkanalwiedergabe untersucht, wobei neben der Lautsprecheranordung auch der Grad an Signalkorrelation ein wesentlicher Versuchsparameter sein soll.
Die erhobenen Daten schließen eine Wissenslücke im Feld der Psychoakustik und ergänzen bisherige Versuchsergebnisse aus der Literatur.
Kontakt bei Interesse: Stefan Riedel (riedel(at)iem.at)
Auditory perception of vocal fry
Vocal fry is a voice quality that is characterized by the audibility of individual glottal pulses. This voice quality occurs frequently in healthy voice, but it may also be a sign of a voice disorder. Aim of the thesis is to identify properties of the speech signals that cause the auditory temporal separation of the glottal pulses. For single-peaked glottal pulses, it was shown in the past that the pulse rate is the most influential factor. However, the open quotient, i.e., the duty cycle, and the formant bandwidths may also play a role. Less is known about multi-peaked glottal pulses, which are amplitude and frequency modulated sinusoidal carriers. For such signals, it is hypothesized that the modulation depth is highly influential. In addition, peak prominence of loudness-time curves are hypothesized to be causally linked to the perception of vocal fry.
The tasks of the student will be the following. The student will familiarize herself or himself with the relevant scientific literature, computer synthesize stimuli, conduct auditory experiments, and disseminate the results (thesis/paper writing, presentations).
Required skills:
MATLAB, Python, Voice synthesis, Psychoacoustics, Experimental design
Contact:
Robert Höldrich (robert.hoeldrich(at)kug.ac.at)
Philipp Aichinger (philipp.aichinger(at)meduniwien.ac.at)
Auditory perception of diplophonic voice
Diplophonia is a voice quality that may be characterized by the simultaneous vibration of individual glottal oscillators at different frequencies. Most commonly, this results in the presence of two salient pitches in the voice sound. However, the sound may instead also be dominated by the beating of the two vibration frequencies. Aim of the thesis is to identify the physiological parameters of voice production that cause a voice to belong to either of the two types, i.e., the two-pitches type, or the beating type. It is hypothesized that the difference of the vibration frequencies plays a crucial role. Other factors that may influence the type allocation include the level difference, the strength of deterministic co-modulations, and the strength of random modulations of the two glottal oscillators.
The tasks of the student will be the following. The student will familiarize herself or himself with the relevant scientific literature, synthesize stimuli, conduct auditory experiments, and disseminate the results (thesis/paper writing, presentations).
Required skills:
MATLAB, Python, Voice synthesis, Psychoacoustics, Experimental design
Contact:
Robert Höldrich (robert.hoeldrich(at)kug.ac.at)
Philipp Aichinger (philipp.aichinger(at)meduniwien.ac.at)
Schallschutzspezifikation im Musikbereich
In der Bauakustik wird als Spezifikation für den baulichen Schallschutz oft die bewertete Standardschallpegeldifferenz DnT,w als Einzahlwert angegeben. In sensiblen Nutzungsszenarien im Bereich der Musik – wie zB im universitären Kontext - zeigt sich jedoch, dass selbst sehr hohe DnT,w–Werte eine allseits zufriedenstellende Schallschutzsituation nicht sicherstellen können. Dies liegt einerseits an der Tatsache des Einzahlwertes und seiner Ermittlung. Andererseits bleiben auch die spektralen und zeitlichen Charakteristika der konkreten Schallemissionen, die je nach Aktivität (Einzelunterricht versus Ensembleprobe), Instrumentengattung, Ensemblezusammensetzung und Genre variieren, ebenfalls unberücksichtigt.
Ziel dieser Projektarbeit ist es eine Grundlage für eine verbesserte Spezifikation von Schallschutzanforderungen im Musikbereich zu erarbeiten. Dafür sollen einerseits in typischen Nutzungssituationen der Schallpegel und das Schallsignal aufgezeichnet werden, um daraus eine nutzungsspezifische Verteilung von spektraler Charakteristik und Pegel ableiten zu können. Als zweiten Schritt soll ein Verfahren zur Schallschutzspezifikation vorgeschlagen werden, das zwar auf den gängigen Normen ausbaut und gegebenenfalls die Festlegung ergänzender Forderungen vorsieht.
Da die Schallmessungen und -aufnahmen im Kontext von künstlerischen Lehrveranstaltungen der KUG durchgeführt werden sollen, ist dies während der Sommerferien nicht möglich.
InteressentInnen melden sich bitte am IEM bei Prof. Höldrich - robert.hoeldrich(at)kug.ac.at
Synchrone Surround-Aufnahme von Bild und Ton mit dynamischer Wiedergabe
Für Bild und Ton existieren diverse technische Ansätze und Umsetzungen für eine Panorama und Surround-Aufnahme. Im Rahmen des Projektes sollten ausgewählte, geeignete Verfahren zur Bild- und Tonaufnahme zu einem 3D-Produktionstool zusammengeführt werden. Zusätzlich zur gewünschten Synchronisierung der beiden Medien soll durch Hinzunahme eines Trackingsystems die interaktive Steuerung richtungsbezogener Inhalte realisiert werden. Für die 3D-Tonaufnahme kommt das Eigenmike (mhacoustics) [1] zur Anwendung. Zur Bildaufnahme kommt die von Peter Venus entwickelte 3D-Kamera zum Einsatz [2]. Bestehende Softwarelösungen für Bild [2] und Ton [4] sind vorhanden und sollten im Rahmen des Projektes zusammengeführt werden, wodurch die besagte Interaktivität bereichert wird.
[1] www.mhacoustics.com/products
[2] http://extendedview.mur.at/
[3] www.matthiaskronlachner.com/
InteressentInnen melden sich bitte bei: Alois Sontacchi - sontacchi(at)iem.at
Klangcharakterisierung zur Unterscheidung von Fahrzeugklassen und deren Binnendifferenzierung
In der Literatur findet man zum Begriff Klangfarbe eine Vielzahl an Definitionen. Diese Begriffserklärungsversuche und Definitionen belegen in Summe aber die Komplexität und Schwierigkeit, eine klar abgegrenzte und eindeutige Eigenschaft zu beschreiben. Zur Beschreibung der Klangtextur (= wahrgenommene Klangzusammensetzung) wird eine Vielzahl an Indikatoren und Klangbeschreibungsgrößen untersucht, die spektrale und temporale Signaleigenschaften zu einer näheren Klangcharakterisierung zusammenführen, wobei sich das untersuchte Klanguniversum auf Fahrzeuginnen- und -außengeräusche von Verbrennungsmotoren konzentriert. Die gesuchten Indikatoren der Klangcharakterisierung ermöglichen die klangliche Unterscheidung von Fahrzeugklassen und innerhalb deren eine Binnendifferenzierung.
Zusätzlich zu etablierten Beschreibungsgrößen aus dem Automobilbereich werden neue Indikatoren untersucht: die energetische Verteilung auf deterministische und stochastische Signalkomponenten, Intervalle und Akkordstrukturen, sowie die tonale Zuordnung (pitch salience), die globale und drehzahlabhängige Lage von Formanten u. A.
InteressentInnen melden sich bitte bei: Alois Sontacchi - sontacchi(at)iem.at
Analyse und Resynthese von Wind- und Rollgeräuschen bei Fahrzeugen
Der Entwurf und die Evaluierung von Motorklängen für Fahrzeuge mit Verbrennungs- oder Elektromotor setzt eine möglichst realistische Geräuschkulisse voraus. Diese besteht dem dem Motorklang selbst hauptsächlich aus Wind- und Rollgeräuschen. Ziel dieser Arbeit ist einerseits die Analyse von vorhandenen Innengeräuschaufnahmen, wobei der Beitrag des Motorklanges entfernt werden soll (Analyse und Resynthese bereits vorhanden). Andererseits sollen die Wind- und Rollgeräusche effizient und parametrisierbar resynthetisiert werden. Eine einfache Resynthese für Windgeräusche wäre beispielsweise ein Rauschen, das quadratisch mit der Geschwindigkeit ansteigt.
InteressentInnen bitte melden bei: Matthias Frank
Einfluss des Wiedergaberaumes auf räumliche Wiedergabeverfahren
Die Evaluierung räumlicher Wiedergabeverfahren erfolgt meist unter reflexionsarmen Bedingungen, die eine größtmögliche Kontrolle des wiedergegebenen Schallfeldes erlauben. Jedoch erfolgt die Bearbeitung und Wiedergabe räumlicher Aufnahmen meist in Studios und Wohnzimmern, die nicht reflexionsarm sind. In der Theorie tragen reflexionsarme Wiedergaberäume zu einer genauen Lokalisation bei, während Reflexionen zu einer ausgewogeneren Klangfarbe führen. In dieser Arbeit soll der Einfluss von Nachhallzeit und Hallradius des Wiedergaberaumes auf Lokalisation, Klangfarbe und Quellbreite experimentell untersucht werden. Für das Experiment können Lautsprecheraufstellungen mit unterschiedlichen Radien und eine Echtzeitverhallung im IEM CUBE verwendet werden.
InteressentInnen bitte melden bei: Matthias Frank
Lokalisation von horizontalen Phantomschallquellen an dezentralen Hörpositionen
Die Hörereignisrichtung ist einer der wichtigsten räumlichen Parameter bei räumlichen Wiedergabeverfahren. Bisherige Untersuchungen zur Lokalisation von Phantomschallquellen haben sich hauptsächlich mit der Lokalisation in der zentralen Hörposition beschäftigt. Für diesen Fall gibt es mehrere Modelle zur Vorhersage der Hörereignisrichtung, darunter ein sehr einfaches geometrisches Modell. Ziel dieser Arbeit ist die Untersuchung der Lokalisation an dezentralen Hörpositionen und die Erweiterung der Vorhersagemodelle, insbesondere des geometrischen Modells. Als Grundlage dazu dienen Versuchsergebnisse aus der Literatur und dem IEM. Für die Verfeinerung der Modelle sind gegebenenfalls eigene Hörversuche notwendig.
InteressentInnen bitte melden bei Matthias Frank frank(at)iem.at