Dan Lavry: Clock-Jitter und Taktpräzision in digitalen Audiosystemen

Dan Lavry: Clock-Jitter und Taktpräzision in digitalen Audiosystemen
Lavry Engineering stellt mit den Digitalwandlern der Gold-Serie die Referenz im Stereo-Mastering dar. Das Blue-Wandlersystem bietet einen flexiblen modularen Aufbau für Mehrkanalanwendungen, die AD- und DA-Wandler der Black-Serie sind ideal zur Aufnahme und Wiedergabe des Masterbus.

Anlässlich der Vorstellung der neuen Lavry Synchrony-16 Masterclock hat Dan Lavry in einem Beitrag aufgezeigt, was Jitter im Audiobereich bedeutet und wie sich kurzzeitiger Jitter von langzeitiger Taktgenauigkeit unterscheidet.



Dan Lavry: Clock-Jitter und Taktpräzision in digitalen Audiosystemen

In der Theorie dauert ein einzelner Taktzyklus bei einer perfekten Taktreferenz exakt genau so lang wie jeder andere Taktzyklus an. In der Praxis weisen solche Taktreferenzen jedoch zwei getrennte Fehlerquellen auf: hinsichtlich ihrer absoluten Präzision (einschließlich einer Langzeitdrift) und hinsichtlich kurzzeitiger Schwankungen (Jitter).


Jitter

Bei digitalen Audiosignalen verlässt man sich auf serielle Datenformate, bei denen jedes Bit über eine festgelegte Zeitdauer verfügt. So beträgt die Dauer eines Bit-Samples bei 192 kHz/Stereo (AES/EBU oder S/PDIF) 81 Nanosekunden. Wenige Nanosekunden Jitter reichen nicht aus, um die meisten digitalen Operationen zu stören, etwa Signalverarbeitungen, Speichervorgänge oder Datentransfers. Wandler werden hingegen durchaus bereits durch geringen Jitter beeinträchtigt. Bei der Audioproduktion ist es deshalb erstrebenswert, den Jitter der Wandler auf einen Wert unterhalb der menschlichen Wahrnehmbarkeit zu reduzieren.

Digitale Audiosignale basieren auf Sampling. Die unten stehende Grafik zeigt eine Wellenform (rot), die korrekten Samplewerte (blau) und ein einzelnes Sample mit einem Zeitfehler (schwarz). Sample 8 hat einen Signalwert von 0,4. Ein Zeitfehler von 0,3 bei Sample 8 resultiert in einem Signalwert von 0,6. In diesem Fehler führt der Zeitfehler zu einer Abweichung von 0,2 des Signalwerts, was 10 Prozent des vollen Wertebereichs entspricht.

Lavry Jitter 1

Je steiler der Anstieg in der Wellenform, desto größer der Fehler. Die Steilheit hängt von zwei Faktoren ab: der Amplitude und der Frequenz. Signale mit lauteren, höheren Frequenzen werden daher höhere Fehler aufweisen.

In der Praxis ist der Sampling-Vorgang nie völlig perfekt. Daher weisen nahezu sämtliche Samples einen geringen Zeitfehler auf, der als Jitter bezeichnet wird. Diese Signalfehler führen zu einer Verzerrung der Wellenform. Im Audiobereich muss es das Ziel sein, diese Verzerrungen unterhalb der Grenze einer möglichen Wahrnehmung zu belassen.

Bei einer Audiobandbreite von 20 kHz ist der maximale theoretische Anstieg (bezogen auf das voll ausgesteuerte Signal) eine bekannte Größe. Die unten stehenden Grafiken basieren auf diesem Wert, um das schlechtestmögliche Ergebnis abzudecken.

Die Grafik zeigt das Verhältnis von Jitter und den zugehörigen prozentualen Fehler bezogen auf eine Vollaussteuerung.
Bei einem Jitterwert von 200 Pikosekunden liegen die Verzerrungen oberhalb einer perfekten Audio CD. Dazu liegen die Verzerrungen hochwertiger Analogtechnik bei einem derart geringen Wert, dass ihr Einfluss bei 20 Pikosekunden vernachlässigbar ist.

Lavry Jitter 2


Die unten stehende Grafik zeigt das Verhältnis von Jitter und Signalfehler in Dezibel (relativ in Bezug auf Vollaussteuerung).

Lavry Jitter 3

Beachten Sie, dass -120 dB einen Wert mit einer Genauigkeit von einem Millionstel darstellt (0,0001%). Bei hohen Pegeln und Frequenzen ist diese Genauigkeit schwer zu erreichen, selbst mit einer einstufigen Analogschaltung.

Letztlich zählt der Jitter an den Wandlern. Selbst bei der Annahme einer theoretischen Taktreferenz ohne Jitter, involviert der Signalweg zu einem Wandler in der Praxis einige elektronische Bauteile, die Jitter verursachen. In den meisten Fällen benötigt eine Taktreferenz einen PLL-Schaltkreis innerhalb des Wandlers, der den Hauptverursacher von Jitter darstellt.

Es gibt vier gängige Methoden zur Quantifizierung von Jitter:

1.
EBR (Fehlerrate pro Bit) ist ein indirekter Messwert für Jitter. Hierbei wird ein Vergleich der Daten vor und nach der Übertragung vorgenommen. Eine Methode, die in der Hochfrequenz-Datenübertragung regelmäßig eingesetzt wird. EBR bietet die geringsten Informationen über den Jitterursprung unter den hier vorgestellten vier Methoden.

2.
Ein breitbandiges Oszilloskop ermöglicht eine Messung, die als "eye pattern" bezeichnet wird. Diese Methode ist bei hohen Frequenzen effektiv, nicht jedoch bei Abtastfrequenzen im Audiobereich.

3.
Regelmäßig nutzen Hersteller von Taktgeräten eine Spektralanalyse, um den Zusammenhang zwischen Jitter und Frequenz zu untersuchen. Die Ergebnisse werden dabei oft als detaillierte Grafik (dBc vs. Frequenz) gezeigt.

4.
Single-Shot-Zyklusmessungen, in der viele Einzelmessung einzelner Taktzyklen vorgenommen werden. Aus diesen Daten werden statistische Informationen gewonnen. Unter anderem ergibt sich aus dem Mittelwert die Abtastfrequenz und aus der Standardabweichung der Jitterwert. Diese Methode liefert die detailliertesten Informationen für die Art der Jitterfehler.

Die unten stehende Grafik zeigt eine Taktreferenz von 100 kHz (rot und zwei ausgewählte Einzelzyklen (blau). Ein Zyklus startet bei 520 usec und endet bei 530 usec. Die Andere dauert von 570 bis 580 usec.

Lavry Jitter 4

Anmerkung: Das menschliche Gehör ist bezüglich eines einzelnen Samplefehlers nicht besonders empfindlich. Es ist vielmehr gegenüber einer Gruppe fehlerhafter Werte, die sich über einige Millisekunden erstrecken, sensibel. Die Eigenschaften des menschlichen Hörens werden in der Psychoakustik erforscht und reichen über den Inhalt dieser Ausführungen hinaus.


Taktgenauigkeit

Die Qualität einer Taktung besteht in der Messung von Unterschieden zwischen einer theoretischen und praktischen Abtastfrequenz. Ingenieure bewerten die Genauigkeit im Frequenzbereich in "Parts per Million" (ppm).

Beispiel 1: Der Timer einer zeitgesteuerten Geschirrspülmaschine ist auf eine Stunde gestellt, aber der Start erfolgt eine Sekunde zu spät. Die Zeitabweichung beträgt 278 ppm und ist mehr als akzeptabel.
Beispiel 2: Die Messung eines zehnminütigen Sportereignisses mit einer Auflösung von 0,01 Sekunden erfordert eine Genauigkeit von 17 ppm.

Ein Mensch kann einen Zeitfehler von einer Sekunde über eine Stunde (278 ppm) nicht wahrnehmen. Mit heutiger Technik lassen sich leicht Genauigkeiten von deutlich unterhalb 100 ppm erreichen. Indem man die Audiotaktung um einen Wert von 100 ppm erhöht, verkürzt sich die Dauer einer einstündigen Darbietung um 0,36 Sekunden. Verlangsamt man einen dreiminütigen Titel um 100 ppm, werden 0,018 Sekunden ergänzt - eine Zeitdauer, die ebenfalls nicht wahrnehmbar ist.

In der Audioproduktion ist es erforderlich, dass sämtliche Spuren zum gleichen Zeitpunkt starten und enden sowie identisch schwanken, um mögliche Probleme zu vermeiden. Das Gehör ist bezüglich eines fehlerhaften Zeitversatzes zwischen Spuren äußerst empfindlich. In einigen Fällen führen bereits wenige Millisekunden Versatz zu einem hörbaren Fehler in Form einer Kammfilterung. Die Bearbeitung von Spuren mit unsynchronisierten, unabhängigen Taktreferenzen führt zu unrealistischen Anforderungen an die Taktqualität.

Die Einschränkung einer Drift zwischen zwei Spuren auf eine Schwankung innerhalb einer Mikrosekunde über eine Länge von drei Minuten erfordert einen Gesamtfehler in einem Bereich um 0,0056 ppm. Der Erhalt der gleichen Drift über einen längeren Zeitraum erfordert eine erhöhte Genauigkeit, die eine unabhängige Taktung unpraktisch gestaltet. Das Hinzufügen weiterer Spuren erhöht das Problem. Im Unterschied dazu sorgt eine gemeinsame Taktreferenz für eine samplegenaue Synchronisation ohne Einschränkungen der Dauer und bei der Spuranzahl.

Ungenauigkeiten der Taktung äußern sich zudem in einem Tonhöhenversatz. Das Gehör weist eine begrenzte Empfindlichkeit bei der Wahrnehmung von Tonhöhen auf. Ein Versatz unterhalb von 1 Cent (weniger als 500 ppm) liegt unterhalb dieser Wahrnehmungsgrenze. Selbst Werte von maximal 100 ppm lassen sich mit heutiger Technik leicht erreichen.

Der Einsatz unabhängig getakteter Spuren kann zu hörbaren Effekten führen, die auf Tonhöhenverschiebungen beruhen. Zwei Töne mit einer geringen Tonhöhenabweichung können zu hörbaren Schwebungen führen. Die Synchronisation aller Spuren zu einer einzigen Taktreferenz garantiert, dass sich eventuelle Tonhöhenverschiebungen immer auf alle Spuren auswirken und damit nicht hörbar auswirken.

Taktgenauigkeit und Jitter sind unterschiedliche Sachverhalte. Eine hohe Genauigkeit garantiert keine niedrigen Jitterwerte und umgekehrt. Beispielsweise bieten Atomuhren eine extreme Präzision, sind aber für den Einsatz mit Audiofrequenzen nicht konzipiert. Sie arbeiten mit 10 MHz und anderen Frequenzen für den allgemeinen Einsatz. Die notwendigen Schaltkreise, die die Taktung in den Audiobereich übertragen, fügen Jitter hinzu. Es handelt sich dabei typischerweise um PLL-Schaltungen.

Von einem technischen Standpunkt betrachtet, ist es nicht besonders aufwendig, die Anforderungen an eine Taktgenauigkeit im Audiobereich zu erfüllen oder sogar zu übertreffen. Hingegen ist die Erfüllung der Anforderungen an entsprechende Jitterwerte eine durchaus herausfordernde Aufgabe.

Das Verständnis der Konzepte von Taktgenauigkeit und Jitter und ihre Einflussnahme auf Audiosignale erlauben es dem Ingenieur, zu besseren Ergebnissen zu gelangen.
2017-07-19 00:00:00
Posted in: Pro Audio Guide