Signale und Messungen

Aus REW-Wiki.de Das deutschsprachige Wiki
Wechseln zu: Navigation, Suche

"Was bedeutet das alles eigentlich?" Um die Messungen zu verstehen, die mit REW ausgeführt werden können, ist es hilfreich, ein Verständnis dafür zu haben, was diese Messungen eigentlich sind. Dieses Thema gibt einen Überblick über die Grundlagen von Signalen und Messungen und erklärt, wie die verschiedenen Graphen in REW generiert werden und wie sie bei der Messung entstehen.


Signale, Abtastrate und Auflösung

Als erstes gilt es zu verstehen, was ein Signal im Kontext einer akustischen Messung ist. Die Signale, um die es geht, sind Schallwellen, die von einem Mikrofon oder Schallpegelmesser empfangen werden. Das Schallpegelmessgerät/Mikrofon wandelt die wahrgenommenen Schallwellen in elektrische Signale um, die von der Soundkarte aufgenommen werden.

Die Soundkarte misst die Spannung am Eingang. Jede Messung ist bezogen auf einzelne Abtastvorgänge. Wie oft die Soundkarte den Eingang dabei "abtastet", wird bestimmt von der Abtastrate. REW unterstützt Abtastraten von 44,1 kHz oder 48 kHz - was bedeutet, dass die Soundkarte die Eingangskanäle entweder 44100 oder 48000 mal pro Sekunde abtastet. Drei Sekunden von einem Signal, das bei einer Abtastrate von 48 kHz aufgenommen wurde, entsprechen einer Sequenz von 3*48000=144000 einzelnen Messergebnissen.

Die höchste Frequenz, die aufgenommen werden kann, ist immer die Hälfte dieser Abtastrate - um eine Frequenz zu reproduzieren, benötigt es mindestens zwei Abtastvorgänge für jeden Durchlauf der Frequenz. Bei 48 kHz ist demnach die höchste aufnehmbare Frequenz 24 kHz. Frequenzen, die höher sind als die Hälfte der Abtastrate verursachen Aliasing, d.h., sie würden niedriger erscheinen, als sie es tatsächlich waren. Zum Beispiel würde ein 25 kHz-Signal, das mit einer Abtastrate von 48 kHz aufgenommen wurde, wie ein 1 kHz-Signal aussehen. Um dem vorzubeugen, haben die Eingänge von Soundkarten Anti-Aliasing-Filter, die versuchen, Signale zu blockieren, die zu hoch sind, um aufgenommen zu werden. Allerdings sind diese Filter nicht sehr effektiv, also muss immer das Frequenzspektrum des Signals bedacht werden, das aufgenommen werden soll.

Die Auflösung einer Messung mit einer Soundkarte liegt typischerweise bei 16 oder 24 bit. 16 bit ist die typische Auflösung einer Audio-CD und wird auch von REW unterstützt. 16 bit-Auflösung bedeutet, dass die Werte der einzelnen Messergebnisse von -32768 bis +32767 reichen können (Zahlen, die mit 15 binären Stellen dargestellt werden können, plus die 16. binäre Stelle, mit der das Vorzeichen der Zahl definiert wird). Anstatt diese Zahlen direkt zu verwenden, ist es üblich, ein Ergebnis nach seiner Nähe zur größtmöglichen Zahl einzuordnen, also sich an der Vollaussteuerung (engl: "Full scale", abgekürzt als "FS") zu orientieren. Der Wert einer Vollaussteuerung beträgt -32768 und +32767. Der kleinstmögliche Messwert ungleich einer Nullmessung ist 1, was in prozentualer Relation zu einer Vollaussteuerung 100*(1/32768) oder ungefähr 0,003% FS entspricht. Alles, was kleiner als 0,003% der maximalen Aussteuerung ist, wird von der Soundkarte als eine Null wahrgenommen.

Der Wert einer Vollaussteuerung steht im Zusammenhang mit einer bestimmten Spannung am Eingang der Soundkarte, die üblicherweise bei ungefähr einem Volt liegt. Soundkarten mit höherer Auflösung, wie zum Beispiel 24 bit, haben üblicherweise die gleiche maximale Spannung am Eingang (1 Volt); können diese aber in einen viel größeren Wertebereich unterteilen. Die Werte einer Vollaussteuerung bei 24 bit betragen -8388608 und +8388607. Bei immer noch einem Volt (typischer) Maximalspannung kann eine 24 bit-Soundkarte also viel höher auflösen; der kleinstmögliche Wert in Relation zur Vollaussteuerung beträgt 100*(1/8388608) Prozent bzw. 0,000012% FS. Besonders sehr leise Signale profitieren von der höheren Auflösung. Der Wert der Vollaussteuerung wird oft umgewandelt in den Wert einer 1, und alle anderen Werte in Relation dazu gesetzt. Die Hälfte einer Vollaussteuerung wäre demnach 0,5 usw.

Clipping

Wenn der Wert eines Signals größer wird als der Wert der Vollaussteuerung, ist die Soundkarte nicht in der Lage, dies aufzunehmen - denn unabhängig davon, was am Eingang geschieht, kann der Messwert nicht höher als die Vollaussteuerung sein. Wenn das Signal diesen Wertebereich überschreitet, spricht man von clipping. Clipping zeigt sich im Eingangssignal als flache Linie; wenn das Clipping am Eingang der Soundkarte passiert, wird der Wert 100% oder -100% FS sein und REW wird eine Warnmeldung ausgeben. Es kann aber auch passieren, dass das Signal schon vor dem Eingang clippt (zum Beispiel in einem Mikrofonvorverstärker mit zu hoch eingestellter Verstärkung). In diesem Fall wird der Messwert vielleicht nie die maximal mögliche Aussteuerung der Soundkarte erreichen, aber das Signal ist trotzdem geclippt.

Clipping muss während eines Messvorgangs verhindert werden, weil das aufgenommene Signal nicht mehr repräsentiert, was tatsächlich vom Empfänger wahrgenommen wurde, und so die ganze Messung verdirbt.

Die Signale betrachten

Eine Möglichkeit, die Signale zu betrachten, ist es, sie im Verhältnis zur Zeit darzustellen. Wenn aufgenommene Signale in REW als Scope-Graph gezeigt werden, sind sie in der Einheit % FS dargestellt. Ein Signal, das 100% FS erreicht, wäre das Maximum, das die Soundkarte aufnehmen kann. Ein Beispiel eines REW Scope-Graphen ist unten zu sehen, es zeigt das Sweep-Signal, das von REW generiert wurde und (in rot) das resultierende Signal, wie es von einem Mikrofon aufgenommen wurde.

REW Oszilloskop


Man möchte jedoch mehr erfahren als nur die abgetasteten Werte, beispielsweise die Frequenzen, aus denen sich das Signal zusammensetzt. Der Bereich von Einzelfrequenzen, aus dem sich das Signal bildet, nennt man das Spektrum. Es lässt sich mithilfe einer Schnellen Fouriertransformation (Fast Fourier Transformation, FFT (engl.)) errechnen. Eine FFT berechnet die Verstärkung und Phase von einer Reihe Cosinus-Wellen die, wenn sie zusammenaddiert werden, das gleiche Messergebnis liefern würden wie das Zeitsignal. Die Verstärkung und Phase dieser Cosinusignale sind ein anderer Weg, das Zeitsignal darzustellen, eher im Bezug auf die Frequenzen, die es beinhaltet, und weniger auf die gemessenen Werte bezogen. Die Verstärkung ist einfach zu verstehen: Je größer die Verstärkung ist, desto größer ist auch die Cosinuswelle. Die Phase markiert den Startwert der Cosinuswelle in dem Moment, wo der erste Abtastvorgang in der gemessenen Sequenz stattfand. Ein Phasenwert von Null würde bedeuten, dass der Startwert Verstärkung*cos(0) = Verstärkung war. Ein Phasenwert von 90° würde einen Startwert von Verstärkung*cos(90) = 0 bedeuten. Die eigentliche Verstärkung ist oft von größerer Bedeutung, aber man sollte die Phase nicht komplett außer Acht lassen - sie enthält ungefähr die Hälfte der Informationen über die Form des ursprünglichen Zeitsignals.

Wenn eine FFT benutzt wird, um das Spektrum zu berechnen, kommt eine Reihe von Frequenzen zum Einsatz, die gleichmäßig vom Nullpunkt bis zu der Hälfte der Abtastrate (dem Maximum, das sauber reproduziert werden kann) reichen. Der Abstand hängt von der Länge des Signals ab, das mithilfe der FFT analysiert wird. FFT-Berechnungen sind am effizientesten, wenn die Längen Zweierpotenzen wie 16k (16384), 32k (32768) oder 64k (65536) sind. Um ein 64k-FFT von einem Signal zu berechnen, das mit 48 kHz abgetastet wurde, braucht es 65536/48000 oder 1,365 Sekunden des Signals. Die Frequenzen wären geteilt in 24000/65536 = 0,366Hz. Wenn die FFT von einen 16k-Signal berechnet würde, wäre die Teilung 1,465Hz. Je weniger einzelne Messwerte zur Verfügung stehen, um so größer ist der Abstand zwischen den Frequenzen; desto niedriger ist die Auflösung. Um eine hohe Auflösung für ein detailliertes Ergebnis zu erhalten, muss ein langes Signal analysiert werden.


RTA

Eine gängige Möglichkeit, das Spektrum eines zeitlichen Signals zu betrachten, ist die Verwendung einer Echtzeit-Analyse ("RTA" Real Time Analysis). Das RTA zeigt einen Graphen der Verstärkung der einzelnen Frequenzen, aus denen sich das Signal zusammensetzt das analysiert wird. Während das FFT Signale produziert, die gleichmäßige Abstände zwischen den Frequenzen haben, gruppiert das RTA sie in Bereiche einer Oktave. Eine Oktave bedeutet das verdoppeln der Frequenz - der Bereich von 100 Hz bis 200 Hz oder der Bereich von 1 kHz bis 2 kHz ist demnach eine Oktave. Die Frequenzspanne einer Oktave wird also um so höher, desto höher die Oktave liegt. Für ein 1/3-Oktaven-RTA ist die Frequenzspanne ungefähr 4,6 Hz bei 20 Hz, aber 4,6 kHz bei 20 kHz. Für ein 1/24-Oktaven-RTA sind die Frequenzspannen 1/8 so groß wie der Bereich der Oktave. In dem Bereich einer Oktave können viele verschiedene Einzelwerte aus dem FFT genommen werden, um den Signalwert darzustellen, der von einem RTA diesem Frequenzband zugewiesen wird.

Hier ist ein RTA-Diagramm aus REW zu sehen, in welchem das Spektrum eines 1 kHz-Tons mitsamt den harmonischen Verzerrungen dargestellt wird.

REW-Spektrogramm

Systeme und Transferfunktionen

Das Spektrum eines Signals zu betrachten hat seinen Nutzen, aber es ist ebenfalls interessant, wie das verwendete Equipment das Signal verändert. Die Art, wie ein Signal von einem System verändert wird, das es durchläuft, nennt man die Transferfunktion des Systems. Die Transferfunktion setzt sich aus zwei Komponenten zusammen: dem Frequenzgang und dem Phasenverlauf. Der Frequenzgang zeigt, wie sich die Verstärkung der einzelnen Frequenzen durch das System verändert, der Phasenverlauf zeigt, wie sich die Phase der einzelnen Frequenzen verändert. Eine komplette Beschreibung des Systems benötigt beide Messgrößen. Sehr unterschiedliche Systeme können den gleichen Frequenzgang haben, lassen sich aber anhand des Phasenverlaufes unterscheiden.

Es ist wichtig, das Frequenzspektrum des Systems nicht mit dem Ausgangsspektrum des Systems zu verwechseln. Das Spektrum eines Signals zeigt, woraus das Signal besteht (in diesem Falle, aus welchen Frequenzen es besteht). Das Frequenzspektrum der Transferfunktion zeigt, wie das System das Frequenzspektrum eines Signals verändert. Die Absicht hinter Messungen mit Software wie REW ist es, die Transferfunktion zu messen. Der Graph SPL & Phase in REW zeigt das Frequenzspektrum und den Phasenverlauf der Transferfunktion. Die Verstärkung der einzelnen Frequenzen wird als Verlauf dargestellt.

Im folgenden sieht man eine Darstellung des Frequenzspektrums (obere Spur, bezogen auf die linke vertikale Achse) und des Phasenverlaufs (untere Spur, bezogen auf die rechte vertikale Achse) bis 200 Hz.

REW Frequenzgang (oben) und Phase (unten)


Die Impulsantwort

Die Transferfunktion zeigt durch den gemessenen Frequenzgang und Phasenverlauf, wie das System, das vom Signal durchlaufen wurde, das Spektrum des Signals verändert. Sie beschreibt den Frequenzbereich des Systems. Aber was ist mit dem Signal selbst? Wie kann beschrieben werden, wie die einzelnen Bestandteile (Samples) des Signals von dem System verändert wurden, das Verhalten im Zeitbereich? Die Art, wie ein System die einzelnen Teile eines Signals verändert, nennt man Impulsantwort. Der Grund für diese Benennung wird sich gleich klären. Die Impulsantwort ("Impulse response", IR (engl.)) ist selbst ein Signal, bestehend aus einer Reihe von Samples. Signale, die in den Eingang eines Systems geschickt werden, überlappen mit der IR, die sie durchlaufen, gleiten ein Sample nach dem anderen entlang. Wenn ein Signal das erste Mal erscheint, ist das erste Sample des Signals gleichauf mit dem ersten Sample der IR. Das Resultat für das erste Sample, was vom gesamten System ausgegeben wird, ist das erste Sample der IR, multipliziert mit dem ersten Sample des Signals:

Ausgabe[1] = Eingang[1]*IR[1]


Ein Sampleintervall später überlappt das Eingangssignal schon zwei Samples mit der IR. Die Ausgabe im Moment des zweiten Samples besteht dann aus dem zweiten Sample des Eingangssignals, multipliziert mit dem zweiten Sample der IR plus dem ersten Sample des Signals mal dem ersten Sample der IR:

Ausgabe[2] = Eingang[2]*IR[1] + Eingang[1]*IR[2]


Ein weiteres Intervall später ist das Eingangssignal dreifach mit der IR überlappt. Das Resultat ist dann:

Ausgabe[3] = Eingang[3]*IR[1] + Eingang[2]*IR[2] + Eingang[1]*IR[3]


Und so geht es weiter, je mehr Samples vom Eingangssignal dazukommen. Diesen Prozess, das Eingangssignal mit der IR zu multiplizieren, nennt man convolution. Im Schnitt hat die IR eine relativ kurze Dauer - deutlich weniger als eine Sekunde beim Messen eines Gerätes und eine oder zwei Sekunden beim Messen eines durchschnittlichen Zimmers. Also besteht die Ausgabe schlussendlich immer aus der Länge der IR multipliziert mit der selben Länge des Eingangssignals, inklusive allen individuellen Bestandteilen, die hinzugefügt wurden, um die Ausgabe für diesen Zeitraum zu erzeugen.

Wieso wird es als "Impulsantwort" bezeichnet?

Was würde passieren, wenn das Eingangssignal aus einem Sample mit Vollaussteuerung (die hier den Wert 1 zugewiesen bekommt) bestehen würde, nur noch gefolgt von Samples mit dem Wert 0 (ohne Aussteuerung)? Das Ausgangssignal des initialen Samples wäre:

Ausgabe[1] = Eingang[1]*IR[1]


Das nächste Sample der Ausgabe wäre dann:

Ausgabe[2] = Eingang[2]*IR[1] + Eingang[1]*IR[2] = 0*IR[1] + 1*IR[2] = IR[2]


Das dritte:

Ausgabe[3] = Eingang[3]*IR[1] + Eingang[2]*IR[2] + Eingang[1]*IR[3] = 0*IR[1] + 0*IR[2] + 1*IR[3] = IR[3]


und so weiter. Die Ausgabe würde aus dem jeweiligen Sample der Impulsantwort bestehen. Ein Eingangssignal, das aus einen Sample mit Vollaussteuerung gefolgt von nullwertigen Samples besteht, nennt man einen Impuls. Das Ausgangssignal eines Systems, das als Eingangssignal einen solchen Impuls bekam, nennt man die Impulsantwort.


Der Bezug zwischen Transferfunktion und Impulsantwort

Nachdem die Transferfunktion und die Impulsantwort das gleiche System beschreiben, liegt die Vermutung nahe, dass sie in Bezug zueinander stehen. Die Transferfunktion ist die Fast Fourier Transormation (FFT) der Impulsantwort, und die Impulsantwort ist die invertierte FFT der Transferfunktion. Beides sind Perspektiven auf das gleiche System, einmal bezogen auf den Frequenzbereich und einmal auf den Zeitbereich. Die Transferfunktion ist vereinfacht gesagt das Spektrum der Impulsantwort.


Das Betrachten der Impulsantwort

Der REW-Impulsgraph (Impulse) stellt die Impulsantwort dar. Dort werden Werte entweder in % FS oder db FS angegeben. Die db-Skala ist nützlich, um einen größeren Dynamikbereich des Signals zu sehen. Anstelle die Werte direkt darzustellen, wird der Logarithmus zur Basis 10 (Logarithmus naturalis) des Wertes mit 20 multipliziert dargestellt. Das Maximum der db-Darstellung ist 0 db FS, was im Bezug zu 100% FS steht (Vollausschlag). Ein Wert von 50% FS wäre 20*log10(0,5) = -6db FS. 10% FS wären 20*log10(0.1) = -20dB FS. Die db FS-Skala ist nützlich, um zu sehen, wie sich die niedrigsten Werte des Impulses verhalten, und wo sie sich unterhalb des Levels des Hintergrundrauschens während der Messung bewegen.

Die Bilder unten zeigen eine Impulsantwort mit % FS als Einheit der Y-Achse sowie dieselbe Impulsantwort mit db FS skaliert. Im zweiten Bild ist zu erkennen, dass der Impuls länger benötigt, um auf das Niveau des Grundrauschens abzuklingen, als es anhand der ersten Grafik scheint.


REW Impulsantwort mit Aussteuerungsanzeige in Prozent.


REW Impulsantwort mit Aussteuerungsanzeige in Prozent.

Fensterfunktionen bei der Impulsantwort

Das zu messende System könnte ein Gerät wie beispielsweise ein Lautsprecher sein, aber das System, das tatsächlich gemessen wird, beinhaltet jedes einzelne Teil sowie die Umgebung, die zwischen dem Punkt liegt, an dem das Testsignal generiert wird, und dem Punkt, an dem es wieder aufgenommen wird. Das beinhaltet Verstärker, das Mikrofon, die Soundkarte und vor allem den Raum selbst. Das gemessene System beinhaltet all diese Elemente. Also bedarf es einer Methode, die Einflüsse derjenigen Elemente zu entfernen, die nicht gemessen werden sollen.


Der Einfluss der Soundkarte kann 'herauskalibriert' werden, indem er einzeln gemessen wird. Ebenso kann das Mikrofon kalibriert werden. Die Neutralisierung des Raumeinflusses stellt sich jedoch weitaus schwieriger dar. Es kann auch sein, dass der Raumeinfluss der Aspekt ist, der gemessen werden soll, besonders, wenn es um die Frage geht, was man an der Abhörposition in einem Raum tatsächlich hört. Aber wenn es darum geht, das Verhalten eines Lautsprechers zu messen, kann der Raumeinfluss wichtige Details davon verdecken.


Das Signal, das am Mikrofon ankommt, folgt zunächst dem direkten Weg, also der kürzesten Distanz zum Lautsprecher, die zugleich auch der schnellste Weg ist. Der Schall vom Lautsprecher nimmt zusätzlich aber auch andere Wege und prallt an den Oberflächen im Raum ab. Die Reflektionen von diesen Oberflächen legen einen weiteren Weg zurück, bis sie das Mikrofon erreichen, und benötigen für diesen Weg entsprechend länger. Wenn das Signal ein Impuls war, würde man davon ausgehen, das Direktsignal zuerst zu sehen und erst dann die Ankunft der reflektierten Signale. Die kürzeste Verzögerung ist bedingt durch die Zeit, die der Schall benötigt, um die nächstgelegene Oberfläche zu erreichen. Wenn die nächstgelegene Oberfläche zum Beispiel 90 cm entfernt wäre, würde der Schall mindestens drei Millisekunden länger brauchen als das direkte Signal vom Lautsprecher, um das Mikrofon zu erreichen (in der Praxis wäre es ein wenig mehr, weil die Distanz etwas größer als 90 cm wäre).


Wenn nur die ersten Millisekunden der Impulsantwort untersucht würden, wäre der Teil zu sehen, der sich auf das Direktsignal bezieht, das ohne Raumeinfluss zum Mikrofon kam. Einen kleinen Ausschnitt der Impulsantwort auf diese Art zu betrachten heisst, eine Fensterfunktion auf die Impulsantwort anzuwenden (in den Grafiken des Absatzes weiter oben ist das Fenster als blaue Linie zu sehen). Wenn die FFT für diesen markierten Abschnitt berechnet wird, zeigt sie die Transferfunktion für das Direktsignal, was der Transferfunktion für den Lautsprecher alleine entspricht. Leider gibt es aber auch einen Nachteil: Wenn die FFT an einem sehr kurzen Signal angewandt wird, kann sie nur bis zu einer bestimmten Frequenz berechnet werden. Bei einer ganzen Sekunde eines Signals kann der Frequenzgang bis 1 Hz reichen, bei einer Zehntelsekunde nur noch bis 10 Hz. Generell ist, wenn die Länge des Signals "T" in Sekunden entspricht, die tiefste berechenbare Frequenz 1/T - also ergibt sich bei einem Bereich von 3 ms eine untere Grenzfrequenz von 1/0,003 = 333Hz. Um tieffrequente Ergebnisse frei von Raumeinflüssen zu erhalten, sollten die nächsten Oberflächen so weit wie möglich entfernt sein. Die Fensterfunktionen in REW lassen sich unter IR Windows einstellen. Im unkonfigurierten Zustand wendet REW Fenstereinstellungen an, die mehr als eine halbe Sekunde der Impulsantwort beinhalten, damit der Raumeinfluss sichtbar ist.

Wasserfalldiagramme

Der 'SPL % Phase'- und der 'Impulse'-Graph sind wohl die nützlichsten, um die Transferfunktion zu studieren, die aufgenommen wurde. Aber es gibt noch ein weiteres Diagramm, das nützliche Informationen darüber zeigt, was der Raum mit dem Schall macht, der in ihm wiedergegeben wird - das Wasserfall-Diagramm. Der Wasserfall ist eine Darstellung des Spektrums der Impulsantwort und wie es sich im Zeitverlauf verändert. Es wird errechnet, indem der Anfangsbereich der Impulsantwort (bei einer Raummessung üblicherweise wenige hundert Millisekunden) dargestellt wird und von diesem Bereich die FFT berechnet wird. Der Zeitpunkt der Betrachtung wird schrittweise entlang der Impulsantwort bewegt und die FFT erneut berechnet, um die zweite Scheibe der Darstellung zu erzeugen. Den Zeitpunkt noch einen Schritt weiter zu bewegen führt zu der dritten Scheibe - und so weiter und so fort. Je weiter man sich entlang des Wasserfalls bewegt, desto mehr verliert man die Beteiligung des Lautsprechers aus den Augen und sieht nur noch den Raumeinfluss. Der Raumeinfluss ist besonders stark bei Frequenzbereichen, in denen Raummoden liegen. Das sind Frequenzen, die zwischen zwei Oberflächen im Raum hin- und herschwingen und sich dabei selbst verstärken, was stabile langsam abfallende Töne erzeugt. Diese Frequenzen stechen aus dem Wasserfalldiagramm als Erhöhung heraus, wobei die größten Erhöhungen die ausgeprägtesten Raummoden zeigen, also diejenigen, die am längsten brauchen, um abzuklingen.

REW Wasserfalldiagramm



Das war eine sehr kurze Einführung in das grundlegende Konzept hinter Signalen und Messungen. Diese Informationen werden benötigt, um das Kapitel Wie REW Messungen vornimmt besser zu verstehen.



Copyright © 2010 John Mulcahy All Rights Reserved

← Zurück zur Hauptseite