MP3, AAC und Streaming

MP3s und andere datenreduzierte Formate sind ein doppelschneidiges Schwert: auf der einen Seite ergeben sich für den Konsumenten schön kleine Dateien, auf der anderen bleibt die Angst vor möglichen Klangveränderungen und einem hörbaren Qualitätsverlust. Ein guter Codec, eine ordentliche Datenrate und natürlich ein gelungenes Mastering vorausgesetzt, müssen wir allerdings keine gravierenden Nachteile befürchten. Ein viertel Jahrhundert nach dem ersten MP3 sind die Encoder mittlerweile so ausgereift, dass selbst Bob Katz’s goldene Ohren bekennen: „320 Kbps sound amazingly good“. Diese Tatsache zeigt sich auch an den schwindenden CD-Verkäufen – im Internet, auf PC und transportablen Geräten ist MP3 schon lange Standard.

Hintergrund

Der Ablauf beim Mastering für MP3 unterscheidet sich, abgesehen von der abschließenden Encodierung, nicht von einem typischen CD-Master und kann am Ende direkt aus den fertigen WAV-Files erstellt werden. Hören wir jedoch ganz genau hin und analysieren das fertige Produkt, fallen eventuell leichte Unterschiede in Klang, Pegel und Frequenzgang auf.

Höhenverluste

Mit abnehmender Datenrate sinkt die maximale Übertragungsfrequenz und hohe Töne werden abgeschnitten. Das „Standard-MP3“ mit 128 kBit pro Sekunde verliert bereits ab 16 kHz seine Informationen, während es 192 Kbps mit etwas über 19 kHz knapp unter CD-Niveau schafft. Um das Spektrum bis 20 kHz zu bedienen müssen es hingegen 320 kbps.

Mastering Mp3 Max Frequenz Hoehenverlust
Sichtbare Höhenbegrenung im Analyzer

Was im Analyzer gravierend erscheint, ist in der Praxis nicht annähernd so wild. Mit zunehmendem Alter interessiert sich unser Gehör nur noch selten für die Bereiche über 16-18 kHz, viele günstige Lautsprecher übertragen hohe Frequenzen mehr schlecht als recht und generell sind die Obertöne der meisten Instrumente über 10 kHz schon lange verstummt. Davon abgesehen bietet nahezu jeder kommerzielle Musikdienst MP3s mit 320 Kbps zum Download an.

Klangveränderungen

Neben Höhenverlusten bewirkt die ausgedünnte Datenmenge auch andere, nicht vorhersehbare Klangänderungen die sich in schmälerer Stereobreite, verringerter Tiefenstaffelung, Verzerrungen oder einer anderen Spektralverteilung zeigen.

Um dies zu überprüfen wandeln wir den unkomprimierten Track in ein MP3 und reimportieren es im Sequenzer auf eine neue Spur. Durch Vergleichshören beider Versionen bei laufender Wiedergabe offenbaren sich  die Unterschiede und eventuell notwendige Korrekturmaßnahmen.

Kodieren - Anhören - Verbessern und das ganze wieder von Vorne bis es passt
Kodieren – Anhören – Verbessern und das ganze wieder von Vorne bis es passt
Vergleichshören Original gegen MP3
Vergleichshören Original gegen MP3

Um das lästige encodieren und importieren zu umgehen, gibt es auch Spezialtools wie den Sonnox Pro-Codec oder Ozone der als Plugin gängige Frauenhofer Codecs in Echtzeit berechnet.

Einfacher und schneller geht es mit Tools wie Ozone oder Sonnox.
Einfacher und schneller geht es mit Tools wie Ozone oder Sonnox.

Pegel und RMS

Während Klangveränderungen bei hoher Bitrate meist marginal und keiner Korrektur wert sind, kann eine Pegeländerung technisch bedenklich werden. Mpegs tendieren nach dem Encoding zu höheren Pegeln als die Ursprungsdatei und damit bei bereits perfekt ausgesteuertem Ausgangsmaterial zu Clipping.

Die Stärke der Pegelerhöhung hängt neben dem Ausgangsmaterial vom Codec und der gewählten Qualitätsstufe ab. Für geringe Bitraten von 128 Kbits und weniger kann ein Headroom von über 3 dB notwendig sein, wobei wir den genaue Wert für jeden Einzelfall erneut ermitteln müssen.

Als MP3 besitzt die Datei eine höhere Aussteuerung.
Als MP3 besitzt die Datei eine höhere Aussteuerung.
    • Nimm beliebige unkomprimierte Audiotracks (CD-Rip), limitiere sie auf -0.1 dBFS und wandle sie anschließend in ein MP3 mit 128 kpbs oder darunter.
    • Reimportiere das MP3 in den Sequenzer und überprüfe die Spitzenpegel. Wetten du findest überall Werte über -0.1 dBFS?
    • Nimm die selbe Datei und überprüfe die Spitzenpegel für verschiedene Qualitätseinstellungen. Je geringer die Datenrate, desto stärke sollte die Veränderung ausfallen.

Tagging

Wie der CD-Text beim PQ-Editing gehört zum MP3 das Taggen der ID3. Dieses Kürzel steht für Identify MP3 und besteht aus Metadaten die zusätzlich zum Audiostream in die Datei geschrieben sind. Ein Player oder Musikdatenbank kann so Titel, Interpret, Album, Erscheinungsjahr, Genre und einen zusätzlichen Kommentar auslesen.

Tagging geschieht entweder direkt im MP3 Encoder, so zum Beispiel beim Export aus dem Sequenzer, oder nachträglich über ID3-Editoren wie iTunes.

MP3 Export mit ID3 Tag Editor in Cubase
MP3 Export mit ID3 Tag Editor in Cubase

Zusammenfassung und Überlegungen

Der wichtigste Punkt beim MP3 Premastering ist ein zusätzlicher Headroom für den Encoder. Ohne diesen riskieren wir Verzerrungen, platte Transiten und bei der Wiedergabe über empfindliche DA-Wandler hörbare Artefakte.

Leider wird diese Tatsache von Kunden gerne ignoriert. Ein Headroom von bis zu 3 dB suggeriert in Zeiten des Loudness Wars ein viel zu leises und nicht konkurrenzfähiges Ergebnis. Die großen Labels, aber auch viele Künstler entscheiden sich lieber für geringe klangliche Nachteile anstelle verminderter Lautheit.

Denken wir als Mastering Engineer noch einen Schritt weiter, müssten selbst CD-Master mit einem deutlich Headroom ausgeliefert werden. Früher oder später wird der Käufer seine perfekt auf 0.1 dBFS ausgesteuerte CD zu einem MP3 wandeln und fängt sich so unbewusst die genannten Probleme ein. Vermutlich ist dies auch ein Grund, warum manche MP3 als „schlechter“ ablehnen.