Audioformate – MP3

Großer Sound aus kleinen Dateien muss kein Widerspruch sein. Dank empirischen Forschungen über die Wahrnehmung akustischer Signale wissen wir, dass viele Schallereignisse für unser Hörerlebnis unerheblich sind und in der komplexen Summe untergehen. So verdecken etwa laute Töne nachfolgende leise Stellen, oder mehrere, benachbarte Frequenzen werden zu einem einzelnen Ton summiert.

Nicht alles was an unser Ohr gelangt wird genau so weitergegeben

Diese Eigenschaften nutzen Wissenschaftler wie Karlheinz Brandenburg vom Fraunhofer Institute in einem psychoakustisches Modell, das in Software umgesetzt, Audiodateien vom unnötigen Ballast befreit. Einmal durch den Encoder gejagt, schrumpft ein MP3 auf knapp ein Zehntel der ursprünglichen PCM Version und benötigt in Stereo umgerechnet 1 Megabyte pro Minute.

Encodieren

Der wohl meist genutzte Encoder hört auf das Kürzel LAME (LAME Ain’t an Mp3 Encoder) und arbeitet als kostenlose Library im Hintergrund vieler Audioprogramme. Wer möchte, kann ihn natürlich auch per Kommandozeile direkt einstellen, aufgrund der Vielzahl an Parametern ist eine passende GUI mehr als hilfreich.

Datenrate

Wie so oft gilt: Qualität kostet! In diesem Fall mehr Speicherplatz oder eine höhere Bandbreite für die Übertragung. War in der Anfangszeit, dank kleiner Speicher und und langsamer Modems, 128 kBit pro Sekunde der heimliche Standard, darf und sollte der Datenstrom heute mindestens 192 kBit/s betragen um “CD-Standard” zu erreichen. Fehlen die Höhen, zerrt der Sound oder klirrt es in den Obertönen, war die Bitrate definitiv zu gering.

Datenrate Qualität Sparfaktor Frequenzen
128 kBit/s Kann im Abhängigkeit des Materials und des Wiedergabesystems gut klingen. Optimal für Streams und mobilen Konsum auf Bluetooth Brüllwürflen und weißen iPhone Kopfhörern. etwa 1:10 bis ca. 16.5 kHz
192 kBit/s Guter Kompromiss zwischen Qualität und Datenmenge. Unter normalen Umständen optimal für jede Lebenslage. etwa 1:6 bis ca. 19 kHz
320 kBit/s CD oder MP3? Selbst in einem direkten Vergleich offenbart sich kein Unterschied. etwa 1:3 bis ca. 20 kHz

Bitrate Modi

CBR (konstante Bitrate)

Im ältesten und “dümmsten” Modus, verwendet unser Encoder immer die vorgegebene Bitrate. Dies bedeutet für Streaming oder dem Speichern eine stets zuverlässige Datengröße, verbraucht jedoch bei hohen Einstellung unnötige Kapazität oder liefert umgekehrt nicht immer die beste Qualität. Galt CBR früher als der Standard um auf allen Geräten kompatibel zu sein, ist dieses Merkmal mittlerweile vernachlässigbar.

VBR (variable Bitrate)

Das quasi beste Preis-Leistungsverhältnis bietet uns die variable Encodierung. In Abhängigkeit des Materials und einer einstellbaren Zielqualität, entscheidet der Codec, ob die volle Bitrate von 320 kbps oder vielleicht auch nur 64 kbps notwendig ist. Komplexe Abschnitte behalten so die maximale Qualität, während dynamisch und spektral anspruchslose Bereiche nicht unnötig Platz durch “übercodierung” beanspruchen. Die tatsächliche Dateigröße lässt sich allerdings nicht im Vorfeld berechnen und entspricht im Extremfall einer durchgängigen Codierung mit 320 kbps.

ABR (durchschnittliche Bitrate)

Bilden wir den Kompromiss aus konstanter und variabler Bitrate erhalten wir mit der ABR eine adaptive Codierung, die den vorgebenden Durchschnittswert jedoch möglichst genau einhalten wird. Auf eventuell leichten Kosten der Klangqualität, erhalten wir vorhersagebare Dateigrößen, so dass dieses Methode zumindest der CBR vorzuziehen ist.

Die beste Qualität bei geringstem Speicherverbrauch erhalten wir mit VBR und einer hohen Zielqualität (8 oder 9).

Channel Mode

Stereo

Der schlicht als “Stereo” oder auch “True Stereo” bezeichnete Modus, erscheint im ersten Moment die beste Wahl, um die Stereoinformationen der beiden Kanäle ohne Verluste zu erhalten. Hierzu werden Links und Rechts als getrennte Spuren betrachtet und individuell quantisiert. Dies wäre eigentlich hervorragend, müssten sich beide Kanäle nicht die maximale verfügbaren Bits aufteilen. Bei 160 kbps erhält jede Seite gerade einmal 80 kbps Bandbreite und damit zu wenig um heikle Stellen in guter Qualität darzustellen.

Intensity Stereo

Nicht alle Frequenzen zwischen 20 und 20.000 Hertz eigenen sich gleich gut, um Richtungsinformationen zu vermitteln. Ist ein Signal zu tief oder zu hoch, können wir nur sagen dass es da ist, aber nicht genau woher es stammt. Diese psychoakustische Eigenschaft verwendet “Intensity Stereo” um Daten verlustbehaftet auszudünnen, indem die betroffenen Bereiche auf einen Kanal zusammen gelegt werden.

 

 

Nochmals eine Stufe schlechter präsentiert sich “Intensity Stereo” als verlustbehaftetes Verfahren speziell für geringe Bandbreiten unter 128 kbps. Da unsere Ohren Richtungsinformationen mit zunehmender Frequenz immer schlechter erfassen1, legt Intensity Stereo einfach beide Kanäle ab etwa 2 kHz zusammen und spart jede Menge Bandbreite.

Breites Stereo wird zwar oft mit brillanten, luftigen Höhen in Verbindung gebracht, mit zunehmender Frequenz ignoriert unser Ohr jedoch die eigentlichen Richtungsinformationen. Intensity Stereo als verlustbehaftetes Verfahren nutzt dieses Phänomen und legt die Informationen aus beiden Kanälen teilweise zusammen.

Joint Stereo

klingt zwar irgendwie böse, ist aber eine verlustfreie Möglichkeit Daten in den beiden Audiokanälen einzusparen. Nach einer Kodierung von Links-Rechts nach Mitte-Seite, finden wir üblicherweise nur noch wenige Informationen im Seitenkanal, die sich entsprechend mit wenig Bit begnügen. Die überschüssigen Bits erhöhen die verfügbare Qualität in der Mitte.

 

der damit weniger Bits benötigt und eine höhere Qualität in der Mitte ermöglicht. Ohne dieses Verfahren (True Stereo Mode) würde Links und Rechts jeweils genau die hälfte der verfügbaren Bitrate erhalten und an komplexen Stellen unnötig Qualität verspielen.

 

 

 

 

 

MP3s und andere datenreduzierte Formate lassen sich zwar jederzeit wieder zurück in Pulse Code wandeln, jedoch bleibt ihr Inhalt weiterhin verlustbehaftet. Ihr Einsatz ist nur sinnvoll, wenn bereits alle Klangbearbeitungen abgeschlossen sind und die Datei allein für die Wiedergabe bestimmt ist.

 

  1. Quelle: