Faltungshall

Der Faltungshall ist ein akustischer Hall-Effekt, der mit Hilfe der Faltung Abbilder real existierender Räume per Computersystem auf Audiosignale errechnet.

Inhaltsverzeichnis

1 Allgemeines
2 Besonderheiten
3 Grundprinzip
4 Faltung
5 Rendering und Datenreduktion
6 Literatur
7 Siehe auch
8 Weblinks

Allgemeines

Im Gegensatz zum synthetischen Hall, der durch künstlich erzeugte Reflexionen bestimmte Raumtypen nachbildet, hat der Faltungshall eine Probe eines akustischen Raumes als Grundlage. Durch Erzeugen eines Geräusches (Idealer Impuls bzw. Dirac-Stoß oder Sinussweep) kann der individuelle Nachhall jedes beliebigen Raumes als Impulsantwort mit einem Stereomikrofon aufgenommen werden. Es ergibt sich ein typischer Signalverlauf, der auch als "Fingerabdruck" des individuellen Raumklanges bezeichnet wird. Mit diesem individuellen Raumklang kann dann jedes Audiosignal versehen werden. Dieses trockene Audiosignal soll theoretisch dann so klingen, als wäre das Ereignis in dem entsprechenden Raum passiert. Praktisch klingt es bei akustischen Signalen jedoch nicht genauso. Die Hörperspektive entspricht der Mikrofonposition (Stereomikrofonie) bei der Impulsanwort-Aufnahme.

Besonderheiten

Als Vorteile bieten sich ein realistischer Klang sowie die kostenlose Verfügbarkeit vieler Impulsantworten im Internet. Außerdem ist die Technik billiger als die alternativen HiEnd-Effektgeräte.

Ein Nachteil ist, dass VST-basierte Plug-ins sehr viel CPU-Leistung brauchen. Zudem sind Impulsantworten starr und nicht editierbar (z. B. Position im Raum). Leichte Latenzen (individuell, je nach Datenreduktion bzw. Näherungsgrad und Rechenleistung) sind ein weiterer Negativaspekt.

Grundprinzip

Die Umrechnung zwischen Ortsraum und Frequenzraum per FFT und IFFT

Jeder Klang bzw. jedes Audiosignal außer Sinustönen kann als ein Gemisch aus mehreren Sinustönen (Einzelfrequenzen) gesehen werden. Das Audiosignal ist eine Gesamtschwingung. Tontechniker sprechen hier vom Highlander-Prinzip der Schwingungen; "Es kann nur eine geben".

Der Klang eines Audiosignals, beispielsweise der eines Instrumentes, resultiert aus dem momentanen Vorhandensein all seiner Frequenzen zum jeweiligen Zeitpunkt. Diese Frequenzen haben alle je eine bestimmte Schalldruck-Amplitude mit einer bestimmten Phasenlage.

Durch die Fast Fourier Transformation (FFT) kann ein Zeitpunkt eines Audiosignals (Ortsraum) im Frequenzraum dargestellt werden. Umgekehrt kann jede Konstellation im Frequenzraum durch die Inverse FFT einen Zeitpunkt eines Audiosignals darstellen. Jede Veränderung im Frequenzraum (z. B. Veränderung der Amplitude einer Frequenz) hat, durch die IFFT auf den Ortsraum übertragen, eine typische Klangveränderung zur Folge.

Faltung

Rein theoretisch wäre die Multiplikation der Frequenzbilder im Frequenzraum nicht nötig. Man könnte stattdessen jeden Zeitpunkt des zu verhallenden Signals mit jedem Zeitpunkt der Impulsantwort multiplizieren. Die Rechenmethode dafür heißt Faltung:

$(f*g)(t) = \int_D f(\tau)g(t-\tau)\mathrm{d}\tau\,$ .

Da die Berechnung auf digitaler Ebene erfolgt, sind beide Signale (zu Verhallendes und Impulsantwort) diskrete Signale. Diskret bedeutet, sie haben eine endliche Anzahl an Werten. Sie bestehen aus einer endlichen Anzahl sogenannter Audio-Samples. Damit ist auch die Anzahl an Berechnunsvorgängen begrenzt. Bei einer Samplingfrequenz (Abtastrate) von 44,1 kHz hat jeder Audiokanal 44.100 Samples pro Sekunde. Die Faltung auf diskreter Ebene ist definiert durch

$y(i) = \sum_{j=0}^{N-1} x(i-j) h(j)$ .

Diese Faltung ist aber rechenaufwändig. Daher werden die Signale nicht wie hier dargestellt im Ortsraum berechnet, sondern durch Multiplikationen im Frequenzraum.

Sowohl für den Gesamtverlauf (Ortsraum) des zu Verhallenden Signals, als auch für den der Impulsantwort werden für jeden Zeitpunkt per FFT die Frequenzspektren gebildet

Beim Faltungshall wird jeder Zeitpunkt des zu verhallenden Signals in den Frequenzraum übertragen. Ebenso liegt jeder Zeitpunkt der sogenannten Impulsantwort (siehe Einleitung) im Frequenzraum vor. Im Frequenzraum wird jeder Zeitpunkt des zu verhallenden Signals mit jedem Zeitpunkt der Impulsantwort multipliziert und das Ergebnis wieder (an der zeitlich richtigen Position) per IFFT in den Ortsraum übertragen. Das Ergebnis ist wieder ein Verlauf im Ortsraum; das verhallte Signal.

Auf digitaler Ebene bedeutet das, jedes Sample des ursprünglichen Audiosignals wird mit jedem Sample der Impulsantwort skaliert.

Genau wie bei den beiden Ausgangssignalen besteht das neue Signal aus einer individuellen Funktion für jeden Zeitpunkt. Ein Klang bzw. ein Audio-Gesamtsignal ergibt sich nicht aus einer periodischen Funktion. Es weist für jeden Zeitpunkt eine andere mathematische Funktion auf. Darum ist für die Faltung dieser relativ hohe Rechenaufwand nötig, bei dem jeder Zeitpunkt (bzw. jedes Sample) des einen Signals mit jedem Sample des anderen Signals verrechnet werden muss.

Jeder Zeitpunkt des einen Signals wird mit jedem Zeitpunkt des anderen Signals verrechnet und das Ergebnis per IFFT wieder in den Ortsraum übertragen

Rendering und Datenreduktion

Die Faltungshall-Berechnung kann durch Echtzeitberechnung (Echtzeit-Effekt) stattfinden oder durch Rendering. Echtzeitberechnung bedeutet, das verhallte Signal wird während des Abspielens errechnet. Wegen der großen Rechenkapazität ergibt sich dabei immer eine bestimmte Zeitverzögerung (Latenz). Rendering bedeutet, das Hallsignal bzw. dessen Audiodatei wird offline berechnet. Das Abspielen ist dann latenzfrei möglich.

Wenn beispielsweise die Impulsantwort, also die Nachhallzeit, fünf Sekunden beträgt und das zu verhallende Signal (z. B. ein Instrument) eine Minute dauert, beträgt bei einer Abtastrate von 44,1 kHz die Anzahl an Faltungsoperationen für ein Stereosignal:

60 x 44.100 x 5 x 44.100 x 2 = 1.166.886.000.000

Das sind über eine Billion Verrechnungen zweier Frequenzspektren für eine Minute Stereo eines verhallten Signals.

Bei den heutigen Rechenleistungen kann Faltungshall bei der Echtzeitberechnung immer nur genähert werden, sonst wäre die Latenz inakzeptabel lang. Selbst das Rendering erfolgt heute wegen der großen Rechenkapazitäten nur in Annäherung. Die bisher genaueste Simulation bietet die MIR-Anwendung der Vienna Symphonic Library. Dabei werden Instrumente eines Orchesters je einzeln verhallt. Die individuelle Abstrahlcharakteristik jedes einzelnen Instrumentes findet dabei Berücksichtigung.

Literatur

Glen M. Ballou: Handbook for Sound Engineers, Third Edition, Elsevier / Focal Press, 2002, ISBN 0-240-80758-8
Michael Dickreiter: Handbuch der Tonstudiotechnik Band 1, 6. Auflage, Saur Verlag, München, 1997, ISBN 3-598-11321-8
Mathworld Wolfram - engl.
Logic Pro 7 (Apple) Plug-in-Referenz

Siehe auch

Weblinks

Kategorien:

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

Audio-Fachbegriffe — A 1/f Rauschen 1/r Gesetz 3:1 Regel Abbildungsbereich Abbildungsbreite A Bewertung Abfallzeit Abhörlautstärke Abhörraum Abhörverstärker Abklingkonstante Abklingzeit AB … Deutsch Wikipedia
Auralisation — Modell eines auralisierten Raumes Das dazugehörige Early Echogram Auralisation („Hörbarmachung“ von lat. auris … Deutsch Wikipedia
Auralisierung — Modell eines auralisierten Raumes Das dazugehörige Early Echogram Auralisation („Hörbarmachung“ von lat. auris = dt. Ohr = aurikular) ist ein Verfahren, das unter Verwendung von Simulation von Spiegelschal … Deutsch Wikipedia
Gewichtsfunktion — Die Impulsantwort, auch Gewichtsfunktion genannt, ist das Ausgangssignal eines Systems, bei dem am Eingang ein Dirac Impuls zugeführt wird. Sie wird in der Systemtheorie zur Charakterisierung linearer, zeitinvarianter Systeme benutzt. Der… … Deutsch Wikipedia
Impulsantwortfunktion — Die Impulsantwort, auch Gewichtsfunktion genannt, ist das Ausgangssignal eines Systems, bei dem am Eingang ein Dirac Impuls zugeführt wird. Sie wird in der Systemtheorie zur Charakterisierung linearer, zeitinvarianter Systeme benutzt. Der… … Deutsch Wikipedia
Liste der Audio-Fachbegriffe — A 1/f Rauschen 1/r Gesetz 3:1 Regel Abbildungsbereich Abbildungsbreite A Bewertung Abfallzeit Abhörlautstärke Abhörraum Abhörverstärker Abklingkonstante Abklingzeit AB … Deutsch Wikipedia
Logic — Pro Entwickler: Apple Inc. Aktuelle Version: 8.0.2 (20. Mai 2008) Betriebssystem: Mac OS X Kategorie … Deutsch Wikipedia
Logic Audio — Logic Pro Entwickler: Apple Inc. Aktuelle Version: 8.0.2 (20. Mai 2008) Betriebssystem: Mac OS X Kategorie … Deutsch Wikipedia
Notator Logic — Logic Pro Entwickler: Apple Inc. Aktuelle Version: 8.0.2 (20. Mai 2008) Betriebssystem: Mac OS X Kategorie … Deutsch Wikipedia
Optimale Nachhallzeit — Die Nachhallzeit mit dem Formelzeichen T60 oder auch einfach T, im Englischen meistens RT (reverberation time), ist die bekannteste raumakustische Kenngröße. Unter der Nachhallzeit versteht man das Zeitintervall, innerhalb dessen der Schalldruck… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Faltungshall

Inhaltsverzeichnis

Allgemeines

Besonderheiten

Grundprinzip

Faltung

Rendering und Datenreduktion

Literatur

Siehe auch

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Faltungshall

Inhaltsverzeichnis

Allgemeines

Besonderheiten

Grundprinzip

Faltung

Rendering und Datenreduktion

Literatur

Siehe auch

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link