Psychoakustische Maskierung

1. Was bedeutet Maskierung in der Akustik?

Wir alle kennen die folgende Situation: Wir gehen an einer Straße entlang, unterhalten uns in der Gruppe und werden darin vom Lärm des Verkehrs gestört. Es scheint, als ob die Wörter vom Lärm einzelner vorbeikommender Fahrzeuge verschluckt werden, obwohl sie natürlich physikalisch vorhanden sind, da sie gesprochen werden - nur können wir sie nicht mehr heraushören. Dieses Verschlucken der Wahrnehmbarkeit von Schallen durch andere, lautere Schalle wird Maskierung genannt und bildet eine der wichtigen Grundlagen für Gehörmodelle. Wir können zwischen spektralen und zeitlichen Maskierungseffekten unterscheiden, die im folgenden kurz erläutert werden.

2. Spektrale Maskierung

Spektrale Komponenten ähnlicher Frequenz können sich gegenseitig beeinflußen, so daß eine der Komponenten unhörbar, also maskiert wird. Abb. 1 stellt den Zusammenhang in Form eines Mithörschwellenmusters dar. Nehmen wir an, daß "A" ein 1kHz-Sinuston mit einem Pegel von 60dB SPL ist. Ein simultan dargebotener Sinuston "B" der leicht höheren Frequenz 1.1kHz, aber mit dem geringeren Pegel von 30dB SPL ist nicht hörbar, da er unter der Schwelle zur Hörbarkeit, der sogenannten Mithörschwelle liegt, die der kräftigere 1kHz-Ton vorgibt. Ein Ton "C" ist dagegen hörbar, wenn er oberhalb der Mithörschwelle liegt, was wie in Abb. 1 dargestellt, durch einen höheren Pegel geschehen kann. Mit größerem Frequenzabstand zwischen beiden Tönen sinkt die Maskierung ebenfalls, wobei starke Nichtlinearitäten in Abhängigkeit vom Pegel des Maskiererschalls auftreten. Da die Maskierung nur im spektralen Nahbereich des maskierenden Tones wirkt, wurde das Konzept der Frequenzgruppen entwickelt. Nach dem Frequenzgruppenkonzept werden Schalle, die in das selbe Frequenzband fallen, auch gemeinsam vom auditorischen System verarbeitet. Für die Schallanalyse wird daher häufig eine spektrale Zerlegung in Filterbänken vorgenommen, bei denen die Filterbandbreiten denen des Gehörs angeglichen sind.

Spektrale Maskierung

Abb. 1: Schematische Darstellung der spektralen Maskierung eines Tones "A" auf andere Töne in einem Mithörschwellenmuster. Da Ton "B" unterhalb der Mithörschwelle (schwarz) von Ton "A" liegt, ist er nicht hörbar, während der darüber liegende Ton "C" hörbar ist.

3. Zeitliche Maskierung

So wie ein Ton in seiner spektralen Umgebung Maskierung hervorruft, tut er dies auch in zeitlicher Hinsicht. Abb. 2 stellt dies schematisch dar. Die Maskierungswirkung eines Schalls auf kurze Schalle vor dem Maskiererbeginn ist gering und auf wenige Millisekunden beschränkt. Dagegen spielt die Nachverdeckung, die ein Schall noch bis 100ms nach seinem Abschalten auf später einsetzende kurze Töne ausübt, eine deutlich größere Rolle. Folgen Schalle mit geringem Pegel einem Schall mit höherem Pegel können sie unhörbar sein.

Audiodemonstrationen zur Maskierung sind hier zu finden.

Zeitliche Maskierung

Abb. 2: Schematische Darstellung der zeitlichen Maskierung vor, während und nach einem Schall. Kurze Töne im Bereich der Nachverdeckung nach einem Schall sind unhörbar.

4. Vom FFT-Spektrogram zum auditiven Spektrogram

Die bekannte zeitdiskrete Fouriertransformation (FFT) führt eine Spektralanalyse mit konstanter Bandbreite, also unabhängig von der Frequenz, durch. Die Spektralanalyse des Hörsystems weist dagegen insbesondere an höheren Frequenzen relativ konstante Filterbandbreiten auf, die im festen Verhältnis zur Filtermittenfrequenz stehen (constant-Q). Sollen die spektralen Maskierungsphänomene nachgebildet werden, so muß der Schall zunächst eine Filterbank mit relativ konstanter Bandbreite ähnlich der Frequenzgruppenbreite durchlaufen. In einer weiteren Stufe kann die zeitliche Maskierung durch Integrationstiefpässe berücksichtigt werden. Alternativ kann die Impulsantwort der Filter zeitliche und spektrale Maskierungseffekte nachbilden. Abb. 3 zeigt das Ergebnis einer derartigen Vorverarbeitung. Eine solche Vorverarbeitung bildet den ersten Verarbeitungsschritt in den meisten Gehörmodellen und damit auch die Grundlage für viele Anwendungen, auf die im nächsten Abschnitt eingegangen wird.

Auditives Spektrogram

Abb. 3: Darstellung eines auditiven Spektrograms für einen 2s-Ausschnitt aus Gershwin's "Rhapsody in blue". Zu Beginn spielt das Orchester eine abfallende Melodielinie, was insbesondere im tiefen Frequenzbereich zu sehen ist. Ab knapp der Hälfte des Ausschnitts agiert das Orchester als Rhythmusinstrument und wiederholt viermal den selben Akkord, gefolgt von einem Akkord einen Ganzton tiefer am Ende des Ausschnitts. Aufgrund der gehörgerechten Frequenzauflösung nimmt die Detailreiche in der Darstellung an höheren Frequenzen nicht zu. Da an diesen Frequenzen weniger Energie vorhanden ist, tritt jedoch die zeitliche Struktur deutlicher hervor.

5. Anwendungen

Vielfältige Anwendungen berücksichtigen die zeitliche und spektrale Maskierung. Die Berechnung der wahrgenommenen Lautstärke von Schallen spielt im Lärmschutz als auch im Produktdesign eine große Rolle. Algorithmen zur Lautstärkeberechnung berücksichtigen die zeitliche und spektrale Maskierung, da maskierte Schallkomponenten nicht zur wahrgenommenen Lautstärke beitragen.
Cochlea Implante sind die derzeit erfolgreichste neuronale Prothese. Sie ersetzen die Funktion des Innenohres durch direkte elektrische Reizung des Hörnerven. Da das Innenohr umgangen wird, muß seine Filterfunktion mit Hilfe einer Filterbank nachgebildet werden, die auf den oben genannten Konzepten aufbaut. Auf Cochlea Implantate wird auf einer separaten Seite eingegangen.
Audiokompressionstechniken, wie z.B. mp3, besitzen sicherlich den größten Bekanntheitsgrad von Verfahren, welche die Maskierungswirkung ausnutzen. Durch gezielte Berechnung der zeitlichen und spektralen Maskierung ist es möglich, maskierte Schallkomponenten von der Übertragung auszuschließen und somit wertvolle Bandbreite zu sparen. Kompressionsfaktoren größer 10 sind ohne hörbare Qualitätseinbußen möglich.