Abschlussarbeiten
Hier finden Sie die Abschlussarbeiten der Studierenden unserer Abteilung.
Anforderungen an einen virtuellen Treffpunkt für Senior*innen - am Beispiel des Mehrgenerationenhauses Oldenburg
Jana Klaßen
Bachelorarbeit
im Studiengang Assistive Technologien
Betreut durch Prof. Dr. Frauke Koppelin und Alexandra Kolozis
Eingereicht am 13. Mai 2022
Ziel dieser Forschungsarbeit ist es, den Mehrwert eines virtuellen Treffpunkts hinsichtlich möglicher Chancen, Barrieren, Technikakzeptanz und Nutzerbereitschaft von Senior innen im Rahmen des Mehrgenerationenhauses Oldenburg zu untersuchen. Um die Forschungsfragen zu beantworten, wurden Experteninterviews geführt und qualitativ mit der Inhaltsanalyse nach Mayring ausgewertet. Die Untersuchung ergab, dass bereits ein großer Mehrwert bezüglich moderner Kommunikationstechnologien von den Expertinnen wahrgenommen wurde. Trotz der Aufgeschlossenheit konnten Barrieren besser als Chancen identifiziert werden. Obwohl die Hindernisse deutlich sind, ist ein Bedarf und ein Interesse nicht ausgeschlossen. Es ergibt sich, dass die Einrichtung eines virtuellen Treffpunkts im Mehrgenerationenhaus Oldenburg sehr sinnvoll ist.
The aim of this research work is to investigate the additional benefits of a virtual meeting place with regard to possible opportunities, barriers, technology acceptance, and the willingness to use it. The target group in this particular research were senior citizens in the context of Oldenburg’s multigenerational house. To answer the research questions, expert interviews were conducted and qualitatively evaluated using content analysis according to Mayring. The study revealed that a great amount of added value with regard to modern communication technologies could be found. Despite the openmindedness, the number of obstacles was higher than the opportunities which were identified. Although the obstacles are clear, a need and interest for the virtual meeting place are not ruled out. The result is that the establishment of a virtual meeting place in Oldenburg’s multigenerational house is reasonable.
Bewertung von Messumgebung und Aufnahmequalität bei Online-Studien
Jule Pohlhausen
Masterarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Jörg Bitzer und Prof. Dr. Inga Holube
Eingereicht am 8. Mai 2022
In der heutigen Zeit spielt die Einbindung von internetbasierten Testverfahren in die Hörforschung eine wichtige Rolle. Die Möglichkeit, Proband_innen zuhause in ihrer alltäglichen Umgebung zu erreichen, zeichnet sich zunehmend als geeignete Erweiterung von klassischen Labormessungen ab. Jedoch sind Messumgebungen und Equipment individuell und weder vollständig dokumentierbar noch kontrollierbar. Hieraus ergibt sich die Notwendigkeit, die Messumgebung und Aufnahmequalität möglichst unmittelbar zu bewerten, um einschätzen zu können, ob aus akustischer Sicht eine Messung möglich ist. In einer Online-Studie wurden Hintergrundgeräusche, Sprache und Klatschen zum einen in einer möglichst ruhigen Umgebung, zum anderen in einer geräuschvollen Umgebung aufgezeichnet. Diese Aufnahmen dienten als Testmaterial für referenzfreie, objektive Bewertungsmaße. Verglichen wurden objektive Bewertungsmaße aus der Literatur mit Messgrößen, die wenig Rechenleistung erfordern und eine echtzeitnahe Einschätzung ermöglichen. Die Ergebnisse zeigen, dass für eine zuverlässige Bewertung die Aufnahme ohne weitere Signalverarbeitungsalgorithmen erfolgen sollte. Mit den vorgestellten Methoden lassen sich bezüglich der Messumgebung Hintergrundgeräusche und Halligkeit bewerten sowie bezüglich der Aufnahmequalität Übersteuerungen detektieren.
Nowadays, conducting online measurements to reach participants at home plays an important role in hearing research. However, measurement environments and the recording devices vary individually and can neither be documented nor controlled. Hence, non-intrusive, i.e., without a reference signal, low-complex quality measures are needed to ensure a required level of recording quality. In an online study, background sounds, speech and handclaps were recorded. The task was performed in an environment as quiet as possible and an artificially noisy environment. These recordings were analyzed with regard to the degrading factors clipping, background level, and reverberation and were used to develop low-complex quality measures to estimate the level of the degrading factors. It is recommended to record the signal without signal processing to achieve reliable assessments. The developed non-intrusive quality measures are capable of assessing the audio quality and environment.
EEG Kappe vs. cEEGrid - Systemvergleich zur Validierung der Einsatzfähigkeit eines Mobilen Nicht-invasiven EEG Systems im Rahmen eines Oddball-Paradigmas
Lukas Dumic
Bachelorarbeit
im Studiengang Assistive Technologien
Betreut durch Prof. Dr. Frank Wallhoff und Dr. Axel Winneke
Eingereicht am 19. April 2022
EEG Systeme sind bereits weit verbreitet und bieten bei Funktionsstörungen des Gehirns als einfaches und schnelles Mittel für eine Diagnose. Jedoch sind die meisten EEG Systeme nur stationär einsetzbar und weniger für den mobilen Gebrauch entwickelt. Zudem sind die meisten Systeme sehr auffällig und zum Tragen in der Öffentlichkeit nicht geeignet. Das Projekt „MOND“ des Fraunhofer Instituts für Digitale Medientechnologien befasst sich daher mit der Entwicklung eines mobilen unauffälligen Sensorsystems zum aufzeichnen von EEG Daten zum automatisierten detektieren von Hirnfunktionsstörungen in Form von epileptischen Anfällen. Im Zuge dieses Projekts werden in der vorliegenden Arbeit zwei mobile EEG Sensorsysteme mit einander verglichen um zu evaluieren wie Einsatzfähig diese für den mobilen Gebrauch sind. Dabei wird sich zum Einen auf die objektiven Aspekte und zum Anderen auf die subjektiven Aspekte bezogen. Diese Auswertung geschieht mit Hilfe von Ereignis korrelierten Potentialen innerhalb eines Oddball-Paradigmas, welche Probanden akustisch präsentiert werden. Durch diese Präsentation und verschiedenen Datenverarbeitung in Python wird die P300-Welle, welche auf die ERPs beruht, dargestellt. Anhand dieser Welle werden die Systeme technisch mit einander verglichen und somit die mobile Einsatzfähigkeit ermittelt. Für die subjektiven Ergebnisse wurde eine Umfrage gestartet innerhalb des Kollegiums, welche bereits mit beiden Systemen vertraut waren. Diese Ergebnisse sollen die vorherigen Ergebnisse bekräftigen und ergänzen, wodurch ein abschließendes Fazit gezogen werden kann.
EEG systems are already widely used and provide a simple and quick means of diagnosis in cases of brain dysfunction. However, most EEG systems are only stationary and less developed for mobile use. In addition, most systems are very conspicuous and not suitable for wearing in public. The project „MOND“ of the Fraunhofer Institute for Digital Media Technologies is therefore concerned with the development of a mobile unobtrusive sensor system for recording EEG data for the automated detection of brain dysfunction in the form of epileptic seizures. In the course of this project, two mobile EEG sensor systems will be compared to each other in order to evaluate their suitability for mobile use. On the one hand the objective aspects and on the other hand the subjective aspects are compared. This evaluation is done with the help of event correlated potentials within an oddball paradigm, which are presented acoustically to test persons. Through this presentation and various data processing in Python, the P300 wave, which is based on the ERPs, is presented. Based on this wave, the systems are technically compared to each other and thus the mobile usability is determined. For the subjective results, a survey was started within the college who were already familiar with both systems. These results are intended to corroborate and complement the previous results, allowing a final conclusion to be drawn.
Untersuchungen zur Vorhersage akustischer Eingangs- und Transferimpedanzen von Restgehörgängen auf der Grundlage dreidimensionaler Geometriemodelle
Mai Thuc An Pham
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Matthias Blau und Prof. Dr. Martin Hansen
Eingereicht am 19. April 2022
Im Rahmen des Teilprojektes C1 des Sonderforschungsbereichs 1330 „HAPPAA“ wird derzeit ein Datensatz erhoben, welcher digitalisierte Geometrien von Kopf, Torso und dem Außenohr mit Gehörgängen samt Trommelfell umfasst. Letztere sind im „HAPPAA“ für die Entwicklung eines akustisch transparenten Im-Ohr-Hörsystems zur Vorhersage der Eingangs- sowie Transferimpedanz von individuellen Restgehörgängen von großer Wichtigkeit. Aus diesem Grund wurde in der vorliegenden Bachelorarbeit eine halbautomatische Methode zur geometrischen Bestimmung von notwendigen Parametern für die akustische Modellierung mittels dreier Gehörgangsgeometrien entwickelt. Anhand der Parametrisierung des ersten charakteristischen Knickes, des Trommelfells, des Umbo- sowie Endpunkts ließen sich akustische Abweichungen basierend auf eindimensionaler Modellierung und dreidimensionaler Finite-Elemente- Methode-Simulation von den verwendeten Restgehörgängen evaluieren. Die Ergebnisse der Finite-Elemente-Methode-Simulation zeigten kaum einen Unterschied gegenüber einer kleinen Variation des Evaluationspunktes am Ende des Gehörgangs oder am Umbopunkt und gegenüber der Verkleinerung der Trommelfellfläche. Bei der eindimensionalen Modellierung zeigten die Ergebnisse, dass aus der Verschiebung der parametrisierten Umboposition in etwa 0,5mm Schritten bis max. 2mm nach links in Richtung lateral und rechts in Richtung medial unter Verwendung von zwei unterschiedlichen Trommelfellimpedanzmodellen eine Resonanzverschiebung resultiert. Insgesamt konnte gezeigt werden, dass sich die eindimensionale Modellierung gut eignet, um die Ergebnisse der Finite-Elemente-Methode-Simulation zu reproduzieren.
Within the framework of subproject C1 of the Collaborative Research Center 1330 „HAPPAA“, a data set is currently being collected that includes digitized geometries of the head, torso, and the outer ear with ear canals including the tympanic membrane. The latter are of great importance in the „HAPPAA“ for the development of an acoustically transparent in-the-ear hearing system for the prediction of the input as well as transfer impedance of individual residual ear canals. For this reason, a semi-automatic method for geometrically determining necessary parameters for acoustic modeling using three ear canal geometries was developed in this bachelor thesis. Using the parameterization of the first characteristic bend, the eardrum, the umbo as well as the end point, acoustic deviations based on one-dimensional modeling and three-dimensional finite element method simulation from the used residual ear canals could be evaluated. The results of the finite element method simulation showed little difference compared to a small variation of the evaluation point at the end of the ear canal or at the umbo point and compared to the reduction of the tympanic membrane area. For one-dimensional modeling, the results showed that a resonance shift resulted from shifting the parameterized umbo position in approximately 0.5mm increments to a maximum of 2mm to the left in the lateral direction and to the right in the medial direction using two different eardrum impedance models. Overall, it was shown that one-dimensional modeling is well suited to reproduce the results of the finite element method simulation.
Entwicklung eines Wohlklangindex für Kaffeevollautomaten mithilfe von Onlineumfragen
Lennard Quebe
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Martin Hansen und Dipl.-Ing. Johannes Epha
Eingereicht am 3. April 2022
Untersuchung der nichtlinearen Eigenschaften eines Automative Audio Lautsprechers
Leon Hochberger
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Matthias Blau und Dr.-Ing. Sören Keuchel
Eingereicht am 31. März 2022
In dieser Bachelorarbeit wurde das nichtlineare Verhalten eines Automotive Audio Lautsprechers bei Einbau in einen generischen Autoinnenraum untersucht. In einem ersten Schritt wurden dafür die nichtlinearen Parameter eines Lautsprechers bestimmt, welche das Verhalten des Lautsprechers bei hoher Anregung beschreiben. Die Parameter zeigten in einer Simulation eine gute Übereinstimmung mit gemessenen Daten. In einem zweiten Schritt wurden diese Parameter in ein nichtlineares Lautsprecher-Modell eingebaut, welches den Schalldruck in einem Prüfstand simulierte. Dieser sollte einen generischen Autoinnenraum darstellen. Die Simulation der Parameteridentfikation wurde mit dem Lautsprecher-Modell in einem ersten Schritt verglichen. Hierbei zeigte sich eine gute Übereinstimmung ohne und eine mittlere Übereinstimmung mit nichtlinearen Parametern. Mit dem Modell weiterhin durchgeführte Simulationen wurden mit Messdaten von verschiedenen Sweep-Signalen verglichen. Das generelle nichtlineare Verhalten konnte mit dem Modell dargestellt werden. Die Simulationen überschätzten den tieffrequenten und unterschätzten den hochfrequenten Bereich der Messsignale. Beide Versuchsschritte wurden diskutiert und hinsichtlich der Qualität, Genauigkeit und Effizienz untersucht.
This bachelor thesis examined the nonlinear behaviour of an automotive loudspeaker, when built into a generic car interior. A first experiment was conducted to determine the nonlinear parameters of the loudspeaker. These describe the nonlinear behaviour of the loudspeaker. When used in a simulation these parameters coincided closely with measured data. In a second experiment the nonlinear parameters were built into a nonlinear model of a loudspeaker. The model was designed to simulate the sound pressure in a test facility resembling a generic car interior. The loudspeaker model simulations were first compared to the simulations performed with the nonlinear parameters. They showed good agreement without nonlinear parameters, but only semi-good agreement with nonlinear parameters. Furthermore, the model was compared to measured data of different sweep-signals. The model was able to display the general nonlinear behaviour. However it overestimated the low-frequency range and underestimated the higher frequency range compared to the measurement signals. Aspects of quality, accuracy and efficiency were discussed for both experiments.
Individuelle Präferenzen von Personen mit und ohne Hörbeeinträchtigungen bei der Selbstanpassung von Sprache im Störgeräusch unter dem Einfluss von Verzerrungen
Tobias Danneleit
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Inga Holube und Jonathan Gößwein, M.Sc. (Fraunhofer Institut für Digitale Medientechnologie IDMT, Institutsteil Hör-, Sprach- und Audiotechnologie HSA, Oldenburg)
Eingereicht am 21. März 2022
Störgeräuschbefreiungsalgorithmen können die Sprache in einer geräuschvollen Umgebung vom Störgeräusch befreien. Andererseits mögen sie das Sprachsignal auch beschädigen, was zu unerwünschten Verzerrungen des Sprachsignals führen kann. Aus der Literatur geht hervor, dass es hierfür interindividuelle Präferenzen in Form von Persönlichkeitsmerkmalen gibt. Anhand eines Selbstanpassungsverfahrens wurden mit 20 Probanden (14 normalhörend, 6 schwerhörend) die individuellen Präferenzen von Sprachverstehen im Störgeräusch unter dem Einfluss von Verzerrungen untersucht. Dafür stellten die Probanden mehrere Schieberegler (SR) zur Adjustierung des Signal-Rausch-Abstandes (engl. signal-to-noise ratio, SNR) und des Grades der Verzerrungen nacheinander ein. Für die Bestimmung der Bereiche der SR wurden die verwendeten Stimuli mithilfe des PEMO-Q-Modells und der ISO 532-2:2017 (E) vor dem Experiment evaluiert. Auf Schieberegler 1 (SR1) sollten die Probanden den SNR so einstellen, dass die Hörsituation für sie wenig anstrengend war. Entlang Schieberegler 2 (SR2; gleicher SNR-Bereich wie SR1) und Schieberegler 3 (SR3; adaptiver SNR-Bereich bez. SR1) wurde mit dem SNR gleichzeitig der Grad der Verzerrung des Sprachsignals verändert. Indem der SNR erhöht wurde, nahmen auch die Verzerrungen zu. Aus den Differenzen aus SR1 – SR2 bzw. SR1 – SR3 wurden Rückschlüsse auf Persönlichkeitsmerkmale gezogen. Eine große, positive Differenz deutet auf einen „Distortion Hater“ hin, der Verzerrungen vermeiden möchte. Eine kleine oder gar keine Differenz deutet hingegen auf einen „Noise Hater“ hin, der Verzerrungen akzeptiert, um möglichst wenig Störgeräusch wahrnehmen zu müssen. Zusätzlich wurde die Höranstrengung nicht-adaptiv mit einer Methode der kategorialen Skalierung über dem SNR, dem Grad der Verzerrungen von Sprache und der Kombination aus beidem gemessen. Die Ergebnisse zeigten, dass es Probanden anhand der gewählten Methode der Selbstanpassung möglich war, ihre präferierte Einstellung zu finden. Aus den Ergebnissen ließen sich sowohl „Distortion Haters“ als auch „Noise Haters“ klassifizieren. Für die Messungen der Höranstrengung zeigte sich ein absinkender Kurvenverlauf der Höranstrengung gegen den SNR, ein ansteigender Kurvenverlauf mit zunehmendem Grad an Verzerrungen der Sprache ohne Störgeräusch und ein V-förmiger Ver-lauf mit einem Minimum der Höranstrengung über der Kombination aus beiden Szenarien.
Noise reduction algorithms may provide a good way to improve the listening situation for the listener in a noisy environment but could also damage the speech signal. By doing so, they may introduce distortions to the speech signal. It can be assumed that there are personal traits in listeners regarding listening preferences for speech-in-noise scenarios with distortions present as well. In a self-adjusted task with 20 subjects (14 with normal-hearing, 6 hearing-impaired) personal traits were investigated by using sliders (SR) on a graphical user interface (GUI) to adjust their individually preferred setting of the signal-to-noise ratio (SNR), in some cases at the cost of distortions applied to the speech signal. To evaluate the stimuli a model for audio quality assessment (PEMO-Q) and a loudness model (ISO 532-2:2017 (E)) were used. In slider 1 (SR1) the subjects were instructed to adjust the SNR to the point where they felt very little listening effort. Whilst adjusting on slider 2 (SR2; equal SNR range as SR1) and slider 3 (SR3; adaptive SNR range depending on SR1), more distortions were applied to the speech signal when subjects would increase their SNR of choice. From the SNR differences between SR1 – SR2 and SR1 – SR3 conclusions on the personal traits could be drawn: a rather large, positive difference indicating “distortion haters”, who tried to avoid distortions, and “noise haters”, who tried to avoid listening to noise and accept distortions for that purpose. In addition, listening effort (LE) was measured non-adaptively by using a categorical scale for the subjects to evaluate the stimuli in different scenarios: SNR, speech in quiet with varying amounts of distortions applied, and a combination of both. The results show that characterizing “distortion haters” and “noise haters” was possible by using the self-adjustment method. For the LE measurements results indicate a decrease of LE with increasing SNR, an increase of LE with the increasing number of distortions applied to the speech signal, and a V-shaped course of the LE curve for the combination of both scenarios.
Evaluation smarter Gehörschutztechnologien zur Verbesserung der Sprachwahrnehmung
Helen Wolf
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Inga Holube und Dr. Axel Winneke (Fraunhofer IDMT, Institutsteil Hör-, Sprach- und Audiotechnologie)
Eingereicht am 18. März 2022
Gehörschutzsysteme sollen der Entstehung von Gehörschäden durch Einwirkung von Lärm vorbeugen. Ein Nachteil ist, dass beim Tragen von Gehörschützern die Sprachwahrnehmung aufgrund der Dämpfungswirkung der Gehörschützer erschwert wird. Somit bleiben zum einen wichtige Signale ungehört und zum anderen wird die Kommunikation miteinander behindert. In einer Studie, welche im Rahmen der anzufertigenden Bachelorarbeit durchgeführt wurde, wurden Algorithmen der blinden Quellentrennung, die in ein Forschungsgehörschutzsystem implementiert wurden und die Sprachwahrnehmung durch die Hervorhebung von Sprachanteilen verbessern sollen, untersucht. Dabei wurde die Sprachwahrnehmung beim Tragen des entwickelten Systems im Vergleich zu einem aktiven, auf dem Markt erhältlichen Gehörschutz getestet. Die Evaluation wurde mit 20 normalhörenden, deutschsprachigen Proband_innen im Alter von 20 bis 31 Jahren durchgeführt, wobei die Zielgrößen Sprachverständlichkeit, empfundene Höranstrengung und die Anforderung an das Arbeitsgedächtnis in drei industriellen Störgeräuschen mit unterschiedlichen Spektren und Zeitstrukturen erfasst wurden. Neben der Erfassung von Verhaltensdaten (Reaktionszeit und Antwortgenauigkeit) dienten EEG-Messungen zur Beurteilung der Arbeitsgedächtnisbelastung. Sprache und Störgeräusche wurden aus einem Lautsprecher in einer Hörkabine dargeboten. Die Sprachverständlichkeitsmessung wurde adaptiv mit dem Oldenburger Satztest durchgeführt, während die Höranstrengung bei konstanten SNR-Werten subjektiv anhand einer Kategorialskala bewertet wurde. Des Weiteren wurde ein n-back-Task durchgeführt, mit dem der Effekt der Gehörschutzsysteme auf die Arbeitsgedächtnisbelastung in lauten Industrieumgebungen untersucht wurde. Es wurden keine Verbesserungen der Sprachwahrnehmung mit dem Forschungsgehörschutz mit implementierter Quellentrennung festgestellt. Der Grund dafür war ein durch die verzögerte Signalverarbeitung auftretender Echoeffekt, der besonders bei hohen Sprachpegeln wahrgenommen wurde. Trotzdem deuten die Ergebnisse auf das Potenzial blinder Quellentrennung zur Verbesserung der Sprach-wahrnehmung beim Tragen von Gehörschützern hin. Auch ergaben die Messungen einen Einfluss des Störgeräuschtyps auf die erfassten Zielgrößen.
The aim of hearing protecting devices is the prevention of noise-induced hearing losses. Using hearing protectors may be disadvantageous in certain situations as the perception of speech is hindered by high damping effects of the hearing protectors themselves. Therefore, important signals are not recognized anymore and the communication with each other becomes more difficult. In a study conducted for the in-progress bachelor thesis, algorithms of blind source separation were evaluated. They were implemented in a hearing protecting system for research focusing the improvement of speech perception by the accentuation of speech signals. The system was then compared to another active hearing protector which is available on the market. The evaluation was done with 20 normal hearing participants whose mother tongue was German and who were between 20 and 31 years old. Recorded were the target variables speech recognition, subjective listening effort and working memory load in three maskers having different time and frequency spectrums. In addition to the recording of behavioural data (reaction times and response accuracy), EEG-measurements were performed. Speech perception was determined by adaptive measures of Oldenburg sentence test (german: Oldenburger Satztest), while listening effort was rated on a categorical scale using constant signal-to-noise ratios. Furthermore, an n-back task was per-formed in which the impact of the hearing protectors on working memory load in loud industry noises was investigated. No improvements in speech perception using the research hearing protector were found. This was reasoned by an echo effect which was caused by a delayed signal processing and was perceived especially in high speech levels. Nevertheless, the results suggest that the algorithm of blind source separation can improve speech perception when hearing protectors are used. Additionally, the measurements showed that the type of noise signal influences the recorded target variables.
Einsatz eines Reimtestverfahrens zur Ermittlung der Sprachverständlichkeit bei Cochlea-Implantat-Nutzern
Vanessa Mazur
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Inga Holube und Prof. Dr. Uwe Baumann, Klinikum der J.W. Goethe-Universität, Frankfurt/Main
Eingereicht am 16. März 2022
Die Qualität der Einstellung des Prozessors zur Ansteuerung von Cochlea-Implantat-(CI)-Systemen wird in der Regel mit Sprachtestverfahren überprüft. Beispielsweise bei Einsatz des Freiburger Sprachtests bleibt hierbei unklar, welche Parameter der Einstellung des Prozessors für eine Verbesserung der Verständlichkeit von einsilbigen Prüfwörtern verändert werden sollten. In einer ersten Studie wurde das Phonemverstehen bei CI-Trägern (13 unilateral, fünf bilateral versorgt) getestet. Als Sprachmaterial wurde das Reimtestverfahren nach Sotscheck (1982) gewählt. Die Prüfwörter wurden über einen Freifeldlautsprecher in einer schallisolierten Hörprüfkabine dargeboten. Als Ergebnis zeigte sich, dass ein größeres Vokal- als Konsonantenverstehen vorhanden war. In einer zweiten Studie wurde untersucht, ob Veränderungen der CI-Einstellung Auswirkungen auf die Ergebnisse des Reimtests nach Sotscheck haben und welcher der betrachteten Parameter am meisten verändert wurde. Es nahmen zehn unilateral und drei bilateral versorgte Patienten (Altersdurchschnitt: 60,6 Jahre) aus dem Routinebetrieb teil. Es zeigte sich eine Tendenz der Verbesserung des Phonemverstehens bei größerer Einstellungsänderung. Es fiel auf, dass die T-Level in der Anpassung mehr verändert wurden als die C-Level und somit einen Einfluss auf das Phonemverstehen haben.
The quality of the processor setting for the control of cochlear implant (CI) systems is usually checked with speech test procedures. For example, when using the Freiburg speech test, it remains unclear, which parameters of the processor setting should be changed to improve the recognition of monosyllabic test words. In a first study phoneme recognition in CI users (13 unilaterally, five bilaterally fitted) was tested. The rhyme test procedure according to Sotscheck (1982) was chosen as speech material. It was presented via a free-field loudspeaker in a sound-insulated listening booth. The result of the test was a better recognition of vowels than consonants. A second study was conducted to find out which changes in CI settings had an effect on the results of the Sotscheck rhyme test and which of the parameters considered have mostly changed. Ten unilaterally and three bilaterally fitted patients (age average: 60.6 years) from routine surveillance were participating. There was a tendency of improvement in phoneme recognition with higher changes in settings. It was recognized that the T-levels have changed more than the C-levels in the adjustment, thus having an effect on phoneme recognition.
Untersuchung des Zusammenhangs subjektiver und objektiver Parameter von Vigilanz - Association of subjective and objective parameters of vigilance
Rainer Kirchgesner
Bachelorarbeit
im Studiengang Assistive Technologien
Betreut durch Prof. Dr. Frank Wallhoff und Dr. Axel Winneke
Eingereicht am 15. März 2022
Das Aufmerksamsein nimmt in vielen Lebensbereichen einen großen Stellenwert ein und ist eine Voraussetzung, um aktiv und leistungsbereit zu sein. Eine Verringerung von Aufmerksamkeit ist oft ein wichtiger Faktor bei Unfällen und daraus resultierenden Sach- und Personenschäden. Exemplarisch dazu können lange Autobahnfahrten genannt werden, bei denen eine spezielle Form der Aufmerksamkeit gebraucht wird: die Vigilanz. Grundsätzlich handelt es sich bei der Vigilanz um die Daueraufmerksamkeit bei monotonen Tätigkeiten. Oft äußern sich Vigilanzminderungen im subjektiven Erleben zu spät, wohingegen Vigilanzminderungen über objektive Messverfahren früher erfasst werden können. Im Rahmen dieser Thematik wurde daher eine Studie mit 18 gesunden Probanden durchgeführt, in der Vigilanzminderungen erfasst wurden. Die Vigilanzminderungen wurden mit subjektiven und objektiven Messverfahren aufgenommen, um den Zusammenhang von subjektiver und objektiver Vigilanz zu untersuchen. Dazu führten die Probanden einen 40-minütigen Mackworth Clock-Test durch, der Vigilanzminderungen provozieren sollte. Mittels der Stanford Schläfrigkeitsskala haben die Probanden ihren Wachheitszustand vor und nach der Durchführung des Mackworth Clock-Tests beurteilt. Des Weiteren haben die Probanden den NASA-Task Load Index ausgefüllt. Dazu wurden personenbezogene Daten wie der Chronotyp erfasst. Objektive Daten zur Beurteilung des Vigilanzzustands wurden zum einen über Verhaltensdaten aus dem Mackworth Clock-Test und zum anderen über eine EEG-Aufnahme sowie Verhaltensbeobachtung erfasst. Die Analyse der Daten umfasste Hit-Raten, das Sensitivitätsmaß d0 und Reaktionszeiten, generiert durch den Mackworth Clock-Test, sowie das Delta- und Theta-Frequenzband des EEGs. In diesem Zusammenhang wurde auch die P3- Komponente des ereigniskorrelierten Potenzials untersucht. Die Ergebnisse deuten darauf hin, dass erste Vigilanzminderungen bereits in den ersten 10 Minuten während der Durchführung des MCTs auftraten. Die Vigilanzminderungen innerhalb der ersten 10 Minuten sind sowohl in den Verhaltens- als auch EEG-Daten zu erkennen. In den Verhaltensbeobachtungen können teilweise auch vigilanzassoziierte Prozesse beobachtet werden. Es konnte ein Zusammenhang von zunehmender subjektiver Schläfrigkeit und zunehmenden Reaktionszeiten nachgewiesen werden. Ein weiterer Zusammenhang konnte bei einer höheren selbst eingeschätzten Leistung und höherem d0 gezeigt werden. Ein Zusammenhang von subjektiver Schläfrigkeit und EEG-Daten konnte nicht nachgewiesen werden. Vigilanzänderungen können sich somit im subjektiven Erleben anders äußern als in objektiven Messverfahren. Die Ergebnisse dieser Studie können jedoch nicht beantworten, ob Vigilanzänderungen im subjektiven Erleben erst später als in objektiven Daten eintreten.
Being attentive takes on great importance in many areas of life and is a prerequisite for being active and ready to perform. A reduction in attention is often an important factor in accidents and the resulting damage to property and personal injury. An example of this is long freeway journeys, where a special form of attention is needed: vigilance. Basically, vigilance is the sustained attention during monotonous activities. Often, vigilance reductions are expressed too late in the subjective experience, whereas vigilance reductions can be recorded via objective measurement methods. In the context of this topic, a study was therefore conducted with 18 healthy subjects in which vigilance reductions were recorded. Vigilance reductions were recorded using subjective and objective measurement procedures in order to investigate the relationship between subjective and objective vigilance. For this purpose, subjects performed a 40-minute Mackworth Clock test designed to provoke vigilance reductions. Using the Stanford Sleepiness Scale, subjects assessed their state of alertness before and after performing the Mackworth Clock test. Furthermore, subjects completed the NASA Task Load Index. Personal data such as chronotype were collected for this purpose. Objective data to assess vigilance state were collected firstly via behavioral data from the Mackworth Clock-Test and secondly via an EEG recording and behavioral observation. Analysis of the data included hit rates, the sensitivity measure d0, and reaction times generated by the Mackworth Clock-Test, as well as the delta and theta frequency bands of the EEG. In this context, the P3 component of the event-related potential was also investigated. The results indicate that initial vigilance reductions already occurred in the first 10 minutes during the performance of the MCT. The vigilance reductions within the first 10 minutes are evident in both the behavioral and EEG data. In the behavioral observations, vigilance-associated processes can also be partially observed. A correlation of increasing subjective sleepiness and increasing reaction times could be demonstrated. Another correlation could be shown for higher self-assessed performance and higher d0. A correlation of subjective sleepiness and EEG data could not be demonstrated. Thus, vigilance changes may be expressed differently in subjective experience than in objective measures. However, the results of this study cannot answer whether vigilance changes occur later in subjective experience than in objective data.
Weiterentwicklung eines Spracherkennungsalgorithmus für einen geringen Wortschatz und dessen Evaluation
Jordan Alwon
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Jörg Bitzer und Christian Rollwage M.Sc.
Eingereicht am 9. März 2022
Für die Steuerung moderner Geräte über die Stimme ist die Spracherkennung eine Schlüsseltechnik, welche es ermöglicht intelligente Geräte wie Smartphones oder Smart Speaker kontaktlos zu steuern. Zu dieser Spracherkennung zählen auch solche mit geringem Wortschatz, welche sich durch die Detektion bestimmter Wörter oder Phrasen für die Aktivierung des Gerätes nutzen lassen. Mit steigender Popularität von Geräten mit Sprachsteuerung steigt auch das Bedürfnis solche Geräte zu personalisieren. Parnami und Lee (2020) stellten ein System vor, welches es ermöglicht Schlüsselwörter mit nur wenig Aufwand auszutauschen. Dieses System könnte ermöglichen Schlüsselworterkenner durch den Nutzer anzupassen. Diese Arbeit behandelt die Evaluation und Weiterentwicklung des Spracherkennungsalgorithmus von Parnami und Lee. Dabei wird gezeigt, dass der Schlüsselworterkenner gut zwischen Schlüsselwörtern unterscheiden kann, jedoch ein Defizit in der Klassifikation von unbekannten Signalen aufweist. Die daraus resultierende hohe Falsch-Negativ-Rate lässt darauf schließen, dass der Algorithmus nicht für die Sprachsteuerung geeignet ist. Mit der Weiterentwicklung der Vorhersagemethode wird gezeigt, dass eine Klassifikation von unbekannten Wörtern auch ohne eine vorherige Definition dieser durchgeführt werden kann.
Speech recognition is a key technology for device control via voice. It enables handless control of smart devices such as smartphones or smart speakers. This speech recognition also includes those with a small vocabulary, which can be used to activate the device by detecting certain words or phrases. With the increasing popularity of devices with voice control, the desire to personalize such devices also increases. Parnami und Lee (2020) presented a system that makes it possible to exchange keywords with little effort. This system could allow users to customize the keyword recognizers. This work deals with the evaluation and further development of the speech recognition algorithm by Parnami and Lee. It is shown that the keyword recognizer is good at distinguishing between keywords, but has a deficit in the classification of unknown signals. The resulting high false-negative rate suggests that the algorithm is not suitable for voice control. With the further development of the prediction method, it is shown that a classification of unknown words can also be carried out without a prior definition of them.
Wirkung absorbierender Fassadenflächen und Balkonuntersichten auf die raumakustische Aufenthaltsqualität in Innenhöfen von Wohnbauten
Tilljan Jansohn
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Matthias Blau und Dr.-Ing. B. Schäffer
Eingereicht am 8. März 2022
Die Akustik in Innenhöfen gewinnt zunehmend an Bedeutung, da beim Bau in lärmbelasteten Gebieten, wie es bei der Städteverdichtung oft der Fall ist, besonders auf Blockrandbebauung gesetzt wird. Diese Arbeit soll einen Beitrag dazu leisten, die Frage zu klären, wie stark absorbierende Fassaden und Balkonuntersichten die raumakustische Aufenthaltsqualität in Innenhöfen vonWohnbauten beeinflussen. Dazu werden mehrere generische Innenhofmodelle erstellt und mittels einer raumakustischen Software (Odeon) simuliert. Es wird systematisch der Einfluss auf ausgewählte raumakustische Parameter beim geschossweisen Hinzufügen absorbierender Fassadenflächen und beim Hinzufügen absorbierender Balkonuntersichten untersucht. Zu den untersuchten Parametern gehören early decay time, Nachhallzeit, Stärkemaß, Sprachübertragungsindex und das Echokriterium. Die Übertragbarkeit der Ergebnisse wird anhand von zwei Modellen existierender Innenhöfe validiert. Die Ergebnisse zeigen, dass mit einer komplett absorbierenden Fassade die early decay time und die Nachhallzeit in den Bereich des jeweiligen Zielwertes gesenkt werden können. Das Stärkemaß nimmt um 2 - 4 dB ab. Die absorbierenden Balkonuntersichten dagegen mindern die early decay time und die Nachhallzeit kaum. Die Verringerung des Stärkemaßes beträgt 1 - 2 dB. Allerdings verschlechtert sich dabei das Echokriterium, weshalb diese Maßnahme nicht empfohlen wird.
The acoustics of inner yards is becoming increasingly important since the urban design of noisy areas, e.g., due to urban densification, is based on perimeter development. This bachelor thesis studies the effect size of absorbing facade surfaces and balcony ceilings on the room-acoustical quality of inner yards of residential buildings. For this purpose, several generic inner yard models are created and simulated using a room acoustic software (Odeon). The influence on selected room acoustic parameters when adding floor-wise absorbing facade surfaces and additional absorbing balcony ceilings is systematically evaluated. Evaluated parameters include early decay time, reverberation time, strength, speech transmission index, and the echo criterion. The applicability of the results is checked using two models of existing inner yards. The results show that the early decay time and reverberation time can be reduced to the range of respective target values with a fully absorbent facade. At the same time, strength decreases by 2 - 4 dB. Absorbing balcony ceilings, on the other hand, cannot reduce the early decay time and reverberation time sufficiently. The reduction of strength is 1 - 2 dB. However, since the echo criterion worsens, this measure is not recommended.
Einfluss der Insertionstiefe auf die Frequenzwahrnehmung von Cochlea-Implantat-Tragenden
Nathalie Wilken
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Inga Holube und Dr. Jana Müller (Evangelisches Krankenhaus Oldenburg)
Eingereicht am 26. Februar 2022
Cochlea-Implantat-Tragende (CI-Tragende) besitzen im Vergleich zu normalhörenden Menschen eine veränderte Frequenzwahrnehmung. Im Rahmen dieser Bachelorarbeit wurde untersucht, inwieweit die Insertionstiefe des Elektrodenträgers die Frequenzwahrnehmung von CI-Tragenden beeinflusst. Dabei stand der Vergleich der beiden CI-Hersteller MED-EL und Cochlear im Vordergrund, da MED-EL mit einem längeren Elektrodenträger wirbt. Die Versuchspersonen (VPn) bestanden aus einseitig ertaubten CI-Tragenden mit einem maximal mittelschweren Hörverlust im relevanten Frequenzbereich auf dem Gegenohr, damit ein Frequenzvergleich zwischen dem nicht-implantierten und dem implantierten Ohr erfolgen kann. Um die Frequenz des tiefsten wahrnehmbaren Klanges der VPn zu bestimmen, wurde ein Messverfahren aus vorangegangener Literatur ausgewählt. Die VPn konnten mithilfe eines Drehreglers die Frequenz des akustisch dargebotenen Tones steuern und auf die Frequenz des CIs anpassen, sodass sich eine Matching-Frequenz ergab. Für ein aussagekräftiges Ergebnis wurden 15 VPn mit einem Implantat des Herstellers MED-EL und 15 VPn mit einem Implantat von Cochlear gemessen. Die MED-EL-VPn erreichten signifikant tiefere Matching-Frequenzen als die Cochlear-VPn. Dies wird auf die signifikant größere Insertionstiefe der MED-EL-Elektrodenträger zurückgeführt. Ein Zusammenhang zwischen der Matching-Frequenz und der Ertaubungs- oder Implantationsdauer wurde nicht gefunden.
Cochlear implant users (CI users) have an altered frequency perception compared to normal hearing people. This bachelor thesis investigated to what extent the insertion depth of the electrode array influences the frequency perception of CI users. The focus was on the comparison of the two CI manufacturers MED-EL and Cochlear, since MED-EL advertises a longer electrode array. The subjects (VPn) consisted of unilaterally deafened CI users with a maximum moderately severe hearing loss in the relevant frequency range on the opposite ear, so that a frequency comparison between the non-implanted and the implanted ear can be made. To determine the frequency of the lowest perceptible sound of the VPn, a measurement procedure was selected from previous literature. The VPn were able to use a rotary control to control the frequency of the acoustically presented sound and match it to the frequency of the CI, resulting in a matching frequency. For a meaningful result, 15 VPn were measured with an implant from the manufacturer MED-EL and 15 VPn with an implant from Cochlear. The MED-EL VPn achieved significantly lower matching frequencies than the cochlear VPn. This is attributed to the significantly greater insertion depth of MED-EL electrode arrays. A correlation between matching frequency and deafness or implantation duration was not found.
Sprachverstehen im Fernsehen – Evaluation von Technologien zur Verringerung der Höranstrengung von Personen mit Hörbeeinträchtigung
Julia Thomas
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Inga Holube und Dr. Jan Rennies-Hochmuth (Fraunhofer Institut für Digitale Medientechnologie IDMT Institutsteil Hör-, Sprach- und Audiotechnologie HSA, Oldenburg)
Eingereicht am 22. Februar 2022
Das Verstehen von Dialogen in Film und Fernsehen ist für Menschen mit Hörminderung eine große Herausforderung. In dieser Untersuchung wurden daher Technologien analysiert, die auf eine Verringerung der Höranstrengung abzielen und bereits für normalhörende Menschen eine signifikante Verbesserung erreicht hatten. Als Stimuli dienten Audioaufnahmen von Sendungen verschiedener öffentlich-rechtlicher Sender. Die Signale wurden mit Algorithmen zur blinden Quellentrennung, die den Dialog von den Hintergrundgeräuschen trennen, bezüglich des Signal-Rausch-Verhältnisses (engl. Signal-to-Noise Ratio, SNR) modifiziert. Dabei wurden unterschiedliche Arten der Signalmanipulation durchgeführt. Diese beinhalteten eine adaptive Absenkung des Hintergrunds, die durch die Vorhersage eines Modells gesteuert wurde und nur dann in das Originalsignal eingriff, wenn die Höranstrengung zu hoch war. Dadurch wurde die ursprüngliche Klanggestaltung so wenig wie möglich beeinflusst. Da neben der Höranstrengung für Anwendungen im Bereich der Fernsehsignale auch die Sprach- und Klangqualität von sehr großer Bedeutung ist, umfasste die Evaluation die Bewertung dieser Größen mittels einer an das MUSHRA-Verfahren angelehnten Methodik bei Personen mit Hörbeeinträchtigung. Instrumentelle Maße für Audioqualität und Höranstrengung dienten dabei zum einen zur Auswahl von Audioausschnitten, die eine starke Veränderung der Audioqualität bzw. der Höranstrengung durch die Algorithmen erwarten ließen. Zum anderen wurden die verarbeiteten Audiosignale auch mit den Maßen bewertet, um die modellbasierte Vorhersagbarkeit der Ergebnisse zu analysieren. Die Auswertungen der modellgestützten Studien zeigten, dass die Ergebnisse des PEMO-Q-Modells vom SNR der Signale abhängig sind. Zudem wurde deutlich, dass die Messdaten der Höranstrengung normalhörender Personen durch das LEAP-Modell gut abbildet werden können. Bezüglich der Audioqualität, die über das PEMO-Q-Modell ermittelt wurde, ist dies z. T. jedoch nicht der Fall. Die Probandenstudie mit Personen mit Hörminderung bestätigte die Möglichkeit zur Verringerung der Höranstrengung durch die Nutzung entsprechender Algorithmen. Allerdings muss der Eingriff in das Signal zu den Präferenzen der Probanden passen sowie von ausreichender Größe sein. Anderenfalls nehmen die Personen keine Verbesserung des Signals wahr oder bevorzugen das Originalsignal. Außerdem zeigte der geschätzte SNR der selbsteingestellten Mischungsverhältnisse große interindividuelle Abweichungen. Dies deutet darauf hin, dass die Möglichkeit zur individuellen Einstellung des SNRs intensiv genutzt wurde und somit von Interesse war.
Understanding dialogues in movies and television is a major challenge for hearing-impaired people. This thesis analyzed technologies that aim to reduce listening effort, which had already been shown to provide a significant improvement for normal-hearing people. The stimuli were audio recordings of different public TV broadcasters’ programs. The signals were modified with respect to the signal-to-noise ratio (SNR) using algorithms for blind source separation, which separated dialog from background noise. Different types of signal manipulation were performed. These included adaptive attenuation of the background level. This process was controlled by model prediction and only intervened in the original signal in case the listening effort was rated too high. In this way, the original sound design was affected as little as possible. Since, in addition to listening effort, speech quality and sound quality are also very important in the context of TV broadcast signals, the evaluation of hearing-impaired people included an assessment of all these variables using a method based on the MUSHRA procedure. On the one hand, instrumental measures of audio quality and listening effort were used to select audio excerpts that were expected to show a clear change in audio quality or listening effort resulting from the algorithms. On the other hand, the processed audio signals were also evaluated with these measures to analyze the model-based predictability of the results. The evaluations of the model-based study showed that the results of the PEMO-Q model depend on the SNR of the signals. In addition, it became clear that the outcomes regarding the listening effort of normal-hearing subjects could be well predicted by the LEAP model. However, this was not always the case with respect to audio quality, which was determined using the PEMO-Q model. The experimental study with hearing-impaired individuals confirmed the possibility of reducing the listening effort by using appropriate algorithms. However, the intervention in the signal must match the subjects’ preferences as well as be of sufficient magnitude. Otherwise, subjects do not perceive any improvements or prefer the original signal. In addition, the estimated SNR of the self-adjusted signal showed large interindividual deviations. This indicates that the opportunity to individually adjust the SNR was intensively used, which implies that it was of interest.
Entwicklung und Evaluation eines neuronalen Netzes zur objektiven Bestimmung der Höranstrengung
Daniel-José Alcala Padilla
Bachelorarbeit
im Studiengang Hörtechnik und Audiologie
Betreut durch Prof. Dr. Jörg Bitzer und Christian Rollwage M.Sc.
Eingereicht am 15. Februar 2022
Ziel dieser Arbeit ist die Entwicklung eines neuronalen Netzes zur objektiven Bestimmung der Höranstrengung. Dieses wird auf die Bewertungen eines bereits bestehenden Systems (LEMaß) hin trainiert, um dieselben Bewertungen mit dem neuronalen Netz bei einer niedrigeren Latenz erzeugen zu können. Im Training werden ca. 1000 Stunden deutschsprachige Daten verwendet, denen unter anderem Hall und Störgeräusche beigemischt sind. Das neuronale Netz arbeitet primär mit time-channel separated convolutions, die eine vergleichsweise niedrige Anzahl an Netzparametern erfordern. Somit ist es günstiger bzgl. der benötigten Rechenleistung und zeitlich effizienter als vergleichbare Netzstrukturen. Mit deutscher Sprache werden insgesamt akzeptable Ergebnisse erreicht. Die Korrelation zum LE-Maß beträgt zwischen 0,85 und 0,9. Zu von Probanden getätigten Bewertungen der Höranstrengung wird im Mittel eine Korrelation zwischen 0,76 und 0,85 erreicht. Aus einer Evaluation mit englischsprachigen Daten ließen sich keine eindeutigen Schlüsse ziehen, da sie auf fehlerhaft erzeugten Labels beruht. Es wird von einer ausreichenden Verkürzung der Latenz ausgegangen, obwohl hierzu keine Messung erfolgt. Vorschläge zur weiteren Verbesserung der Latenz sowie der Performance des Netzes liegen vor.
The goal of this work is the development of a neural network for objective predictions of listening effort. The network is trained on outputs of an existing system for predicting listeing effort (LEMaß). The goal of thiswork is to attain a neural network of similar performance and reduced latency compared to LE-Maß. Training occurs using roughly 1000 hours of german speech, augmented with noise and reverb. The proposed network is mainly comprised of time-channel separated convolutions, which allow for a low number of parameters. Therefore inference is computationally less expensive and less time-consuming when compared to similar models. Performance with german speech is overall satisfactory. Concerning LE-Maß, the network yields a correlation of 0,85 to 0,9. Mean scores and subject ratings correlate at 0,76 to 0,85. A secondary evaluation using english speech fails due to invalid labels. Improvements in latency are not measured but are expected to suffice concerning the intended purpose of the model. Recommendations for further improving both latency and overall performance are given.