ReplayGain (Lautstärkeanpassung) (Seite 1) - Grundlagen und Hintergrundwissen - AudioHQ

Sie sind nicht angemeldet. Bitte melden Sie sich an oder registrieren Sie sich.


[ Geschlossen ]

AudioHQ » Grundlagen und Hintergrundwissen » ReplayGain (Lautstärkeanpassung)

Seiten 1

Sie müssen sich anmelden oder registrieren, um eine Antwort zu verfassen

RSS Thema Feed

Beiträge [ 1 ]



1 bearbeitet von Frank Bicking (Original: 2004-11-17 18:24)

Thema: ReplayGain (Lautstärkeanpassung)

ReplayGain ist ein von David Robinson entwickelter Vorschlag für einen Standard zur Berechnung der wahrgenommenen Lautstärke digitaler Audiosignale, zum Abspeichern von Informationen zur Lautstärkeanpassung in Audiodateien, und zur Umsetzung dieser Anpassung beim Abspielen. Ziel ist es, das häufige Korrigieren der Abspiellautstärke auf eine möglichst flexible Art überflüssig zu machen.

Die Grundidee ist, neu zum Archiv hinzugefügte Dateien einmalig einer Analyse zu unterziehen, um beim späteren Abspielen bestimmen zu können, ob und auf welche Weise eine Lautstärkeanpassung stattfinden soll.


Inhaltsverzeichnis.

Die ReplayGain-Analyse
Albumbasiertes ReplayGain
Clipping vermeiden
Referenzlautstärke
Abgespeicherte Informationen, ReplayGain-Tags
Aktivieren der Lautstärkeanpassung beim Abspielen
Unterstützte Audioformate
Software- und Harwareunterstützung
Wobei handelt es sich nicht um ReplayGain?
Warum nicht normalisieren?
Sonderfall MP3Gain
Empfohlene Software und Anleitung


Die ReplayGain-Analyse.

Das ReplayGain-Verfahren bestimmt zunächst für den gesamten Audiotrack einen repräsentativen durchschnittlichen Lautstärkewert. Die Audiodateien werden zu diesem Zweck decodiert. Dabei muss etwa berücksichtigt werden, dass bestimmte Frequenzen lauter wahrgenommen werden als andere, und dass lautere Stellen stärker zur Wahrnehmung von Lautstärke beitragen als leisere. Man profitiert dabei also aus Erkenntnissen und Erfahrungen aus der Psychoakustik. Wer sich für die technischen Details interessert, sei auf die ReplayGain-Seite verwiesen, die das Verfahren genauer erläutert.

Um eine Lautstärkeanpassung zu ermöglichen, wird die berechnete Lautstärke anschließend in Verhältnis zu einem Referenzlevel von 89 dB gesetzt, das dem Verfahren fest vorgegeben ist. Dort ist übrigens noch von 83 dB die Rede; in der Praxis wird meist ein Wert von 89 dB eingesetzt, der wesentlich näher an der Realität von Audio-CDs liegt.

Ermittelt der ReplayGain-Algorithmus also für eine Audiodatei eine Lautstärke, die z.B. um 6 dB oberhalb des Referenzlevels liegt, dann beträgt der Wert, der für die Korrektur der Lautstärke zur normalen Lautstärke des Tracks hinzuaddiert werden muss, -6 dB. Er ist negativ, weil die Lautstärke um 6 dB verringert werden muss, um die Ziellautstärke zu erreichen. Dieser Korrekturwert wird mit "Track Gain" bezeichnet.

Eine andere Audiodatei mit einem ermittelten Track Gain von +3 dB wäre demzufolge um 3 dB leiser als das Referenzlevel und müsste beim Abspielen um 3 dB erhöht werden, um mit der gleichen Lautstärke wie andere ebenfalls angepasste Dateien wiedergegeben zu werden.

Diese trackbasierte Form der Lautstärkeanpassung wird meist ebenfalls als "Track Gain" bezeichnet.


Albumbasiertes ReplayGain.

Die albumbasierte Lautstärkeanpassung betrachtet ein Album als durchgängiges Stück und berechnet dessen gesamte durchschnittliche Lautstärke. Im Gegensatz zur trackbasierten Anpassung bleiben hier die absichtlichen Lautstärkeunterschiede zwischen den einzelnen Tracks eines Albums erhalten. Dies ist insbesondere bei pausenlosen Trackwechseln spürbar. Track Gain kann hier zu einem abrupten Anstieg oder Abfall der Lautstärke führen. Album Gain richtet sich also besonders an die Nutzer, die bevorzugt komplette Alben hören.

Um die Lautstärke eines Albums zu berechnen, muss der Anwender der Software zum Zeitpunkt der Analyse der Dateien mitteilen, welche Dateien als ein zusammenhängendes Album betrachtet werden sollen. Die existierenden ReplayGain-Implementationen sind so ausgereift, dass dies automatisch erkannt werden kann, etwa anhand der Tags (Interpret und Albumname identifizieren ein Album eindeutig) oder anhand der Verzeichnisstruktur (alle Dateien in einem Ordner gehören zu einem Album).

Bei der albumbasierten Berechnung der Lautstärkekorrektur werden gleichzeitig immer auch die trackbasierten Werte berechnet. Der Anwender kann sich so beim Abspielen zwischen den beiden Varianten entscheiden.


Clipping vermeiden.

Mit Clipping bezeichnet man den Umstand, dass Signalspitzen über das Maximum hinausragen und abgeschnitten werden.

https://www.audiohq.de/articles/foobar/replaygain/clipping.png

Der hörbare Effekt wird von vielen als "Kratzen" beschrieben. Für Clipping gibt es drei Ursachen:

Loudness Race: schlecht produzierte CDs

Die erste und zugleich häufigste ist die schlechte Produktion der CDs. Was vielen CD-Hörern schlichtweg nicht bewusst ist: trotz des großen möglichen Signal-Rausch-Abstands von Audio-CDs und der damit verbundenen großen möglichen Dynamik werden CDs heutzutage sehr nahe am Lautstärkelimit produziert. Die obige Abbildung stammt von einer solchen CD und wurde von Rip Rowan in seinem Artikel Over the Limit (zur Zeit leider offline; Kopie im Internet Archive) zur Veranschaulichung verwendet. Für die generelle Problematik hat der Begriff Loudness Race Eingang in den Sprachgebrauch gefunden.

Gegen durch schlechtes Mastering verursachtes Clipping, das bereits auf der CD vorhanden ist, kann ReplayGain nichts unternehmen. Vielmehr sei an dieser Stelle der CD-Käufer selbst aufgefordert, seinem Unmut über diese Handlungen Ausdruck zu verleihen.

Clipping durch Audiokompression

Eine zweiter Grund für Clipping in digitalen Audiodateien ist die verlustbehaftete Audiokompression. Dabei bildet MP3 keine Ausnahme, dieser Effekt tritt bei allen derartigen Verfahren auf. Die Informationen gehen hier nicht verloren, das Signal ragt beim Abspielen in der vorgesehenen Lautstärke jedoch häufig über das Maximum hinaus. Um dem entgegenzuwirken, muss die Lautstärke verringert werden.

ReplayGain schlägt zu diesem Zweck vor, den Spitzenpegel ("Peak") des Tracks und des gesamten Albums zu ermitteln, um die Lautstärke beim Abspielen soweit zu verringern, bis an keiner Stelle mehr Clipping auftritt.

Bei Audiodaten direkt von der CD bzw. den dazu natürlich identischen verlustfrei komprimierten Dateien sind diese Werte immer kleiner gleich dem Maximum. Bei verlustbehaftet komprimierten Tracks können sie dagegen darüber hinausgehen. Peaks wie z.B. 1,069497 sind hier nichts Ungewöhnliches. Nur bei Werten oberhalb des Maximums wird die Lautstärke gesenkt, sonst bleibt sie unangetastet.

Clipping durch Erhöhen der Lautstärke

Drittens kann Clipping auch beim Anwenden des ReplayGain-Verfahrens selbst auftreten. Soll im Rahmen der Lautstärkeanpassung die Lautstärke einer leisen Datei erhöht werden, deren Signalspitzen bereits nahe am Maximum liegen, dann führt dies unweigerlich dazu, dass die Spitzen über die Skala hinausragen werden. Verhindern könnte man dies, soll die Lautstärke unbedingt erhöht werden, nur durch die Anwendung einer Dynamikkompression, also durch Verringerung der Lautstärkeunterschiede. Doch das ist ein anderes Thema.

ReplayGain schlägt an dieser Stelle eine Kombination aus Lautstärkeanpassung und Clippingvermeidung vor: zunächst wird die Lautstärke entsprechend der berechneten Werte auf Track- oder Albumbasis angepasst, und anschließend wird das Signal wieder soweit verringert, bis kein Clipping mehr auftritt. Dadurch kann es natürlich dazu kommen, dass Tracks eben nicht mehr gleich laut klingen. Ob dies gewünscht ist, kann der Anwender selbst festlegen, näheres dazu weiter unten.

Die Clippingvermeidung kann ebenfalls albumbasiert erfolgen. Zu diesem Zweck wird der Spitzenpegel des gesamten Albums berechnet, um später beim Abspielen die Lautstärke aller Tracks des Albums gleichmäßig soweit zu verringern, dass kein einziger Track auf dem Album mehr clippt. Vorteil ist gleichzeitig, dass gegenüber trackbasierter Clipping-Prävention die absichtliche Dynamik zwischen den einzelnen Tracks erhalten bleibt.


Nochmal zur Referenzlautstärke.

Nachdem Clipping nun eingeführt ist, lässt sich folgender Aspekt leichter nachvollziehen:

Da der Spitzenpegel in der Regel sehr nahe beim Maximum liegt, schlägt ReplayGain bewusst eine vergleichsweise geringe Referenzlautstärke vor. Tendenziell werden Tracks von CD in ihrer Lautstärke verringert, da eine Erhöhung aus genannten Gründen nicht empfehlenswert ist, möchte man Clipping vermeiden. Dies ist der Grund, aus dem mit ReplayGain abgespielte Audiodateien häufig als zu leise empfunden werden. Das Gegenteil ist der Fall: heutige CDs sind einfach zu laut.

Die generelle Empfehlung lautet an dieser Stelle, einfach den Lautstärkeregler am Verstärker oder an den Lautsprechern etwas weiter aufzudrehen. Während eine Erhöhung der Referenzlautstärke von 89 dB auf 92 dB eventuell noch erwägenswert ist, z.B. bei portablen Playern mit nicht hinreichend großen Lautstärkereserven, sollten Sie Empfehlungen ignorieren, die Lautstärke auf noch höhere Werte anzuheben.


Welche Informationen werden abgespeichert?.

In der Regel werden von der ReplayGain-Analyse vier Angaben erfasst:

  • die Differenz zur Referenzlautstärke für den Track (Track Gain)

  • die Differenz zur Referenzlautstärke für das gesamte Album (Album Gain)

  • der höchste Pegel innerhalb des Tracks (Track Peak)

  • der höchste Pegel innerhalb des gesamten Albums (Album Peak)

Bei losen Einzeltracks fallen die albumbasierten Werte natürlich weg.

Optional ist vorgesehen, die Referenzlautstärke selbst zu speichern. Davon macht jedoch bisher keine Implementation Gebrauch, vielmehr geht man wie oben bereits erläutert von einer festen Referenz von 89 dB aus.

Die Informationen zur Lautstärkeanpassung werden schließlich in den Tags der Audiodateien hinterlegt. Das konkrete Format und die verwendeten Feldnamen können sich je nach Audiocodec unterscheiden. So wird etwa bei MP3-Dateien ein ID3v2-Tag verwendet, bei Vorbis- und FLAC-Dateien die formateigenen VorbisComments. Eine Besonderheit gibt es bei MPC-Dateien, hier werden die Daten nicht in den APEv2-Tag geschrieben, sondern in einen dafür reservierten Bereich am Dateianfang. Näheres zum Thema Tags und Tagging-Formate können Sie diesem Artikel entnehmen.


Aktivieren der Lautstärkeanpassung beim Abspielen.

Zur Erinnerung: Ziel war es, die Audiodateien einmalig zu analysieren, um sich erst beim Anhören oder beim Brennen auf eine Audio-CD entscheiden zu müssen, ob die ermittelten Korrekturen angewandt werden sollen oder nicht. Die Audiodateien werden nicht direkt verändert, sondern lediglich mit Tags versehen. Erst direkt im Player oder CD-Brennprogramm entscheidet sich der Nutzer, welche der gespeicherten Werte angewandt werden sollen. Es ist ebenfalls möglich, die Werte komplett zu ignorieren und die Datei damit in Originallautstärke abzuspielen. Dieses Konzept wird gelegentlich als "flexibles ReplayGain" bezeichnet, obgleich ReplayGain selbst bereits auf Flexibilität ausgelegt ist.

Die typische Konfiguration sieht so aus, dass sich der Nutzer einmal entscheidet, ob die Werte auf Trackbasis oder auf Albumbasis genutzt werden sollen, und zum zweiten bestimmt, was passieren soll: Lautstärkeanpassung, Clippingvermeidung, oder beides zusammen. Hier beispielhaft zwei Screenshots aus foobar2000:

https://www.audiohq.de/articles/foobar/replaygain/source_mode.png

https://www.audiohq.de/articles/foobar/replaygain/processing.png

Werden bei eingestelltem Album-Modus keine albumbasierten Werte in den Dateien gefunden, weil diese ursprünglich nur als Einzeltracks analysiert wurden, dann werden die trackbasierten Werte verwendet. Der umgekehrte Fall kann nicht eintreten, da bei der albumbasierten Analyse immer auch Track Gain und Track Peak ermittelt werden. Befinden sich in einer Datei keine ReplayGain-Informationen, dann bleibt ihre Lautstärke unangetastet.


Unterstützte Audioformate.

Von den Entwicklern vorgesehen ist ReplayGain unter anderem bei den verlustbehafteten Formaten Ogg Vorbis und MPC sowie den verlustfreien Codecs FLAC und WavPack. Vorgesehen bedeutet, dass entweder in der Spezifikation des Formates selbst festgelegt ist, wo in einer Datei und in welcher Form Daten zur Lautstärkeanpassung abgelegt werden können. Zu diesem Zweck werden meist die Tags verwendet.

Anderen Formaten wie etwa MP3, bei denen in der Entwicklung nicht an eine Anpassung der Lautstärke gedacht wurde, lässt sich ReplayGain quasi aufzwingen, indem man die Infos in selbstdefinierten Feldern geeigneter Tagging-Formate hinterlegt. Bei Formaten ohne derartige Festlegungen und ohne Unterstützung für Tags ist flexibles ReplayGain nicht realisierbar.

Die letztendliche Unterstützung steht und fällt aber immer mit der eingesetzten Software:


Softwareunterstützung.

Bei allem Komfort für den Anwender hat die flexible Lautstärkeanpassung einen entscheidenden Nachteil: die zum Decodieren (Abspielen, Brennen) verwendete Software, dabei kann es sich auch um die Firmware auf einem portablen Gerät handeln, muss in der Lage sein, die gespeicherten ReplayGain-Tags auszulesen, dem Nutzer Optionen zur Wahl der bevorzugten Anpassungsart anbieten, und die Korrekturen entsprechend durchführen.

Da es sich bei ReplayGain um die Initiative einer Privatperson handelt und dementsprechend nicht den Rückhalt eines großen Herstellers oder einer Standardisierungsorganisation besitzt, ist die Unterstützung für ReplayGain eher mager.

Die ersten ReplayGain-Implementationen, damals noch auf das reine Anwenden bereits vorhandener ReplayGain-Tags beim Abspielen beschränkt, die Berechnung musste von gesonderten Tools übernommen werden, fanden sich in den Winamp-Plugins für MPC von Frank Klemm und Ogg Vorbis von Peter Pawlowski.

Letzterer war es dann im Herbst 2002, der mit foobar2000 (Anleitung) den ersten Player mit ReplayGain-Unterstützung für nahezu alle Audioformate vorstellte. Gleichzeitig vereint er die losen Kommandozeilentools, die damals zum Analysieren existierten und immer nur für ein Audioformat geeignet waren, unter einer Oberfläche und bietet mit dem ReplayGain-Scanner eine foobar2000-Komponente an, welche die ReplayGain-Analyse für alle Audioformate durchführen kann.

Bei Winamp hat man erst zum Jahresende 2006 auf die zahlreichen Wünsche der Nutzer reagiert und ebenfalls einen ReplayGain-Scanner eingebaut, der sich jedoch auf eine Handvoll verlustbehafteter Audioformate beschränkt, darunter immerhin MP3 und Ogg Vorbis. Zudem ist er im Vergleich zu foobar2000 sehr langsam. Winamp-Nutzern sei an dieser Stelle empfohlen, die Analyse mit foobar2000 durchführen zu lassen.

Der unter Linux populäre Player Amarok (Review) unterstützt ReplayGain über ein zusätzliches Plugin. Zu weiteren Programmen mit ReplayGain-Unterstützung zählen u.a.: Helium Music Manager, MediaMonkey, XMMS, Music Player Daemon, Muine Music Player für GNOME, und das Xbox Media Center.


Hardwareunterstützung.

Das Rockbox-Projekt bietet für eine Reihe von portablen Playern eine alternative Firmware an, die ReplayGain unterstützt.


Wobei handelt es sich nicht um ReplayGain?.

Nicht jede Lautstärkeanpassung richtet sich nach den von ReplayGain gemachten Vorschlägen. Vielmehr haben einige Softwarehersteller eigene Lösungen entwickelt, die oft bestimmten Einschränkungen unterliegen (z.B. iTunes, das keine albumbasierte Anpassung kennt), die die berechneten Werte nur in einer programmeigenen Datenbank und nicht in den Audiodateien selbst abspeichern, oder die aus sonstigen Gründen inkompatibel sind (z.B. J.River Media Center, das ein anderes Format zum Speichern benutzt).


Warum nicht normalisieren?.

Viele Anwender sind nach wie vor der Meinung, die in CD-Rippern und Brennprogrammen angebotene Funktion "Peak-Normalisierung" (Normalisierung anhand des Spitzenpegels) würde die Lautstärke anpassen. Dem ist allerdings nicht so.

Die Peak-Normalisierung ist ein Prozess, bei dem der Pegel einer Audiodatei verschoben wird, bis der Spitzenpegel (Peak) an einem bestimmten Prozentsatz vom möglichen Maximum angekommen ist. Typisch dabei ist ein Zielwert von 98%. Es geht also darum, eine Datei so laut wie möglich zu machen, ohne dass Clipping auftritt. Der Peak-Wert allein lässt allerdings keine Rückschlüsse auf die hörbare Lautstärke zu, und ist damit ungeeignet, diese auf einen bestimmten Wert zu setzen oder die Lautstärke verschiedener Tracks anzugleichen. Dies wird bei Betrachtung folgender Abbildungen deutlich, die zwei Aufnahmen mit ungefähr gleichem Spitzenpegel, aber völlig unterschiedlicher durchschnittlicher Lautstärke zeigen:

https://www.audiohq.de/articles/replaygain/uncompressed.png https://www.audiohq.de/articles/replaygain/compressed.png

(Quelle:deutschsprachige MP3Gain-Hilfedatei, erstellt von Dominic Jefferies).

Die zweite Aufnahme ist übrigens nicht künstlich erzeugt, heutige CDs sehen tatsächlich so aus.

Problematisch beim Normalisieren ist ebenfalls die Tatsache, dass die absichtliche Dynamik zwischen leiseren und lauteren Stücken eines Albums zerstört wird. Gerade bei klassischer Musik ist dieser Umstand sofort hörbar und sehr ärgerlich, bei ohnehin stark dynamikkomprimierter Musik fällt er nicht so stark ins Gewicht. Dazu kommen plötzliche Lautstärkeschwankungen beim Trackwechsel in Remix- oder Konzeptalben, bei denen die Tracks ohne Pause ineinander übergehen.

Neben der Peak-Normalisierung bieten Wave-Editoren und einige CD-Ripper auch eine Funktion an, welche anhand von Durchschnittswerten normalisiert. Dabei werden im Gegensatz zu ReplayGain jedoch keine psychoakustischen Gesichtspunkte berücksichtigt, so dass das Resultat keine als gleich laut wahrgenommenen Dateien sind. Es sei an dieser Stelle noch einmal betont, dass ReplayGain nicht einfach nur einen Durchschnittswert berechnet, auch wenn es zum leichteren Verständnis für den Endbenutzer manchmal so dargestellt wird.

Allgemein ist bei allen Normalisierungsverfahren problematisch, dass sie die Audiodateien direkt verändern und keine Informationen zur Wiederherstellung der ursprünglichen Lautstärke abspeichern. Auf verlustbehaftet komprimierte Audiodateien angewandt bedeutet dies sogar einen zusätzlichen Qualitätsverlust, da diese nicht direkt bearbeitet werden können, sondern beim Speichern nochmals encodiert werden müssen. Weiterhin ist keine Unterscheidung zwischen Track- und Album-Gain beim Abspielen möglich, eine Normalisierung also endgültig und nicht flexibel.


Sonderfall MP3Gain.

MP3Gain war verfügbar, bevor sich foobar2000 als Lösung für flexibles ReplayGain etablierte. Es basiert auf der gleichen Methode zur Berechnung der Lautstärke, geht anschließend aber einen anderen Weg. Anstatt die berechneten Werte in den Tags zu hinterlegen, werden die Audiodaten direkt verändert.

Dies ist bei MP3-Dateien ohne Neuencodieren möglich, da die Lautstärke für jeden Frame (kleiner Abschnitt innerhalb einer MP3-Datei) durch ein Feld namens "Global Gain" festgelegt wird. Verändert man diese Werte gleichmäßig, dann verringert oder erhöht sich die Abspiellautstärke der gesamten Datei. Dieser verlustfreie Prozess wirkt sich bei jedem MP3-Decoder aus, und damit jedem Software- und Hardwareplayer. Technische Details dazu und warum diese Änderungen auf 1,5 dB-Schritte beschränkt sind, können Sie der MP3Gain-Hilfedatei entnehmen.

Im Gegensatz zum flexibleren ReplayGain muss sich der Anwender hier bereits zum Zeitpunkt der Anwendung von MP3Gain darauf festlegen, ob er die Dateien lautstärkeangepasst hören möchte und ob sie trackbasiert oder albumbasiert angeglichen werden sollen. MP3Gain hinterlässt in den Tags der Dateien Informationen, um die Anpassung ohne Verluste wieder rückgängig machen zu können.

MP3 und AAC (siehe AACGain) sind die einzigen verlustbehafteten Audioformate, für die ein solches Tool existiert. Erst bei später konzipierten Audioformaten hat man den Aspekt der Lautstärkeangleichung berücksichtigt, und sich dabei häufig nach ReplayGain gerichtet. Das bedeutet aber wie bereits erwähnt gleichzeitig, dass die Verbreitung vom Willen der Hardware- und Softwarehersteller abhängig ist.


Empfohlene Software und Anleitung.

Als Anwendung zum Hinzufügen von ReplayGain-Tags zu Audiodateien aller Formate eignet sich wie im Abschnitt "Softwareunterstützung" erwähnt foobar2000 hervorragend, da die Vorgehensweise für jedes Format identisch ist, und man sich deshalb vorher keine Gedanken darüber machen muss, in welchem Format die Dateien vorliegen. Auch für die Anpassung von MP3-Dateien für portable Player kann es eingesetzt werden. Wie man dabei vorgeht, erklärt unsere Anleitung.

Beiträge [ 1 ]

Seiten 1

Sie müssen sich anmelden oder registrieren, um eine Antwort zu verfassen

AudioHQ » Grundlagen und Hintergrundwissen » ReplayGain (Lautstärkeanpassung)

Ähnliche Themen