MP3

Vorlage:Infobox Dateiformat/Wartung/Entwickler fehltVorlage:Infobox Dateiformat/Wartung/Website fehlt

MPEG Audio Layer III
Mp3.svg
Dateiendung: .mp3
MIME-Type: audio/mpeg[1]
audio/MPA[2]
audio/mpa-robust[3]
Magische Zahl:

FFFB hex
\xFF\xFB (ASCII-C-Notation)

Art: Audio
Standard(s): ISO/IEC 11172-3, ISO/IEC 13818-3

MP3 (Bezeichnung nach der Dateinamenserweiterung;[4] eigentlich: MPEG-1 Audio Layer III oder MPEG-2 Audio Layer III) ist ein Verfahren zur verlustbehafteten Kompression digital gespeicherter Audiodaten. MP3 bedient sich dabei der Psychoakustik mit dem Ziel, nur für den Menschen bewusst hörbare Audiosignale zu speichern. Dadurch wird eine Reduzierung der Datenmenge möglich, die die wahrgenommene Audioqualität nicht oder nur kaum verringert. MP3 ist das dominierende Verfahren zur Speicherung und Übertragung von Musik auf Computern und im Internet, obwohl es mittlerweile eine Anzahl von technisch weiterentwickelten Alternativen gibt.

Inhaltsverzeichnis

Geschichte

Grammophon, Tonband und MP3: deutschen Briefmarke von 2011 aus der Serie "In Deutschland zu Hause: Einfallsreichtum – Deutsche Erfindungen"

Entwickelt wurde das Format MP3 ab 1982 unter der Leitung von Prof. Dr.-Ing. Hans-Georg Musmann von einer Gruppe um Karlheinz Brandenburg am Fraunhofer-Institut für Integrierte Schaltungen (IIS) in Erlangen sowie an der Friedrich-Alexander-Universität Erlangen-Nürnberg in Zusammenarbeit mit AT&T Bell Labs und Thomson. Ab 1989 wurde die Entwicklung innerhalb der ISO/IEC JTC1 SC29 WG11 (MPEG) fortgeführt. 1992 wurde es als Teil des MPEG-1-Standards festgeschrieben. Die Geschichte der Standardisierung und die Würdigung der Beiträge der Forscher ist in Genesis of the MP3 Audio Coding Standard by Hans Georg Musmann in IEEE Transactions on Consumer Electronics, Vol. 52, Nr. 3, pp. 1043-1049, August 2006 dargestellt. Die Dateiendung .mp3 (als Abkürzung für ISO MPEG Audio Layer 3) wurde am 14. Juli 1995 nach einer institutsinternen Umfrage festgelegt; vorher wurde intern die Extension .bit verwendet.[4] Wie bei vielen der aktuellen Kodierverfahren sind Kernbereiche von MP3 durch Patente geschützt. Brandenburg wurde für die Entwicklung dieses Datenformates mehrfach ausgezeichnet.

Bereits Mitte der 1990er Jahre waren schon Abspielgeräte und Software für PCs im Umlauf, die es ermöglichten, komprimierte MP3-Dateien zu speichern und abzuspielen. Auch der Austausch solcher Dateien über das Internet vereinfachte sich: Selbst bei einfacher ISDN-Geschwindigkeit benötigte man für die Übertragung lediglich das 2-3fache der Abspielzeit; mit DSL-Leitungen lag die Übertragung sogar unterhalb der Spieldauer. Dies führte bald zu einem regen Tauschhandel ohne Beachtung des Urheberrechts. Versuche der Musikindustrie, dagegen vorzugehen, sind bis heute von nur mäßigem Erfolg geprägt, zumal sich auch die Tauschsysteme immer weiter entwickeln und nach dem Peer-to-Peer-Prinzip ohne zentrale, kontrollierbare Instanzen auskommen. Ende der 90er entstanden bereits große Ansammlungen von Musikdateien im Internet, wie zum Beispiel bei MP3.com oder Napster, was die Anzahl der Nutzer erheblich steigen ließ. Ab 1998 erschienen im Handel die ersten portablen MP3-Player.

Patente und Lizenzstreitigkeiten

Die Fraunhofer-Gesellschaft und andere Unternehmen besitzen Softwarepatente auf Teilverfahren, die für MPEG-Kodierung eingesetzt werden. Ein alles umfassendes MP3-Patent gibt es nicht. Die Fraunhofer-Gesellschaft hat den größten Teil zur Entwicklung des MP3-Standards beigetragen und sich einige Verfahren zur MP3-Kodierung patentieren lassen. In einem Zusammenschluss mit Thomson besitzen beide Unternehmen 18 MP3-bezogene Patente. Seit September 1998, nachdem sich der MP3-Standard sechs Jahre lang hatte unbelastet etablieren können, verlangt FhG/Thomson Lizenzgebühren für die Herstellung von Hard- und Software, die das MP3-Format verwenden.

Bei der Entwicklung des Formats soll auf Patente der Bell Laboratories zurückgegriffen worden sein. Diese Rechte liegen derzeit bei Alcatel-Lucent, die Bell Labs übernommen haben. Das Unternehmen hat vor einigen Jahren Patentklagen gegen Microsoft, Dell und Gateway eingereicht. Im Verfahren gegen Microsoft wurden Lucent im Februar 2007 erstinstanzlich 1,52 Milliarden US-Dollar zugesprochen.[5] Dieses Urteil wurde allerdings im August 2007 vom Bundesbezirksgericht in San Diego aufgehoben.[6] Das Unternehmen Sisvel erhebt im Auftrag von Philips ebenfalls Patentansprüche.

Verfahren

Eine Spektralanalyse des unkomprimierten Liedes Yesterday zeigt eine volle Bandbreite bis etwa 21 kHz...
...während eine Spektralanalyse desselben mp3-komprimierten (128 kbit) Liedes nur eine Bandbreite bis etwa 15 kHz aufzeigt.

Wie die meisten verlustbehafteten Kompressionsformate für Musik nutzt MP3 psychoakustische Effekte der Wahrnehmung aus. Zum Beispiel kann der Mensch zwei Töne erst ab einem gewissen Mindestunterschied der Tonhöhe voneinander unterscheiden, und er kann vor und nach sehr lauten Geräuschen für kurze Zeit leisere Geräusche schlechter oder gar nicht wahrnehmen. Man braucht also nicht das Ursprungssignal exakt abzuspeichern, sondern es genügen die Signalanteile, die das menschliche Gehör auch wahrnehmen kann. Die Aufgabe des Kodierers ist es, das Signal so aufzuarbeiten, dass es weniger Speicherplatz benötigt, aber für das menschliche Gehör noch genauso klingt wie das Original.

Der Dekoder erzeugt aus diesen MP3-Daten dann ein für die überwiegende Anzahl von Hörern original klingendes Signal, das aber nicht mit dem Ursprungssignal identisch ist, da bei der Umwandlung in das MP3-Format Informationen entfernt wurden.

Während die Dekodierung stets einem festgelegten Algorithmus folgt, kann die Kodierung nach verschiedenen Algorithmen erfolgen (z. B. Fraunhofer-Encoder, LAME-Encoder) und liefert dementsprechend unterschiedliche akustische Ergebnisse. Die hörbaren Verluste hängen von der Qualität des Kodierers, von der Komplexität des Signals, von der Datenrate, von der verwendeten Audiotechnik (Verstärker, Verbindungskabel, Lautsprecher) und schließlich auch vom Gehör des Hörers ab. Das MP3-Format erlaubt, neben festen Datenraten von 8 kbit/s bis zu 320 kbit/s, im freeformat-Modus auch beliebige freie Datenraten bis zu 640 kbit/s (Freeform-MP3). Allerdings sind nur wenige MP3-Player-Decoder für höhere Bit-Raten als den ISO-Standard (derzeit bis 320 kbit/s) ausgelegt.

Die Qualitäts-Eindrücke sind recht subjektiv und von Mensch zu Mensch sowie von Gehör zu Gehör unterschiedlich. Die meisten Menschen können ab einer Bitrate von etwa 160 kBit/s und bei Nutzung eines ausgereiften Enkodierers auch bei konzentriertem Zuhören das kodierte Material nicht mehr vom Ausgangsmaterial unterscheiden. Bei Menschen mit „unnormalem“ Gehör (z. B. mit Hörschäden durch Knalltrauma) greifen die eingesetzten Mechanismen aber mitunter nicht wie vorgesehen, sodass ihnen Unterschiede zwischen kodiertem und Ausgangsmaterial eher auffallen (z. B. weil laute Töne, die das geschädigte Gehör schlecht hört, andere Töne nicht mehr gut verdecken können).[7]

Neben der Kodierung mit konstanter Datenrate (und damit schwankender Qualität) ist auch eine Kodierung mit konstanter Qualität (und damit schwankender Datenrate) möglich. Man vermeidet dadurch (weitgehend) Qualitätseinbrüche an schwierig zu kodierenden Musikstellen, spart jedoch andererseits bei ruhigen oder gar völlig stillen Passagen des Audiostromes an der Datenrate und somit an der endgültigen Dateigröße. Man gibt die Qualitätsstufe[8] vor und erhält auf diese Art die dafür minimal notwendige Datei.

Datenkompression

Mit zwei verschiedenen Bitraten komprimiertes Rechtecksignal
  • Ein erster Schritt der Datenkompression beruht zum Beispiel auf der Kanalkopplung des Stereosignals durch Differenzbildung. Das ist ein verlustloses Verfahren, die Ausgangssignale können vollständig reproduziert werden (Mid/Side-Stereo).
  • Entsprechend der menschlichen Hörkurve werden Signalanteile in weniger präzise wahrnehmbaren Frequenzbereichen mit weniger Präzision dargestellt, indem das fouriertransfomierte Datenmaterial entsprechend quantisiert wird.
  • Sogenannte Maskierungseffekte werden ausgenutzt, um für den Höreindruck minderwichtige Signalanteile mit verringerter Präzision zu speichern. Das können etwa schwache Frequenzanteile in der Nähe von starken Obertönen sein. Ein starker Ton bei 4 kHz kann aber auch Frequenzen bis zu 11 kHz maskieren. Die größte Ersparnis bei der MP3-Enkodierung liegt daher darin, dass die Töne nur gerade so genau (mit so vielen Bits) abgespeichert werden, dass das dadurch entstehende Quantisierungsrauschen noch maskiert wird und nicht hörbar ist.
  • Die Daten, die in sogenannten Frames vorliegen, werden schließlich Huffman-entropiekodiert.

Bei starker Kompression werden auch hörbare Frequenzen von der Kompression erfasst, sie sind dann als Kompressionsartefakte hörbar.

Ein Designfehler ist, dass das Verfahren blockweise angewandt wird und so am Ende einer Datei Lücken entstehen können. Das stört beispielsweise bei Hörbüchern, in denen ein zusammenhängender Vortrag zum besseren Auffinden der Passagen in einzelne Tracks zerlegt wurde. Hier fallen die letzten Blöcke als störende Pausen auf. Abhilfe schafft die Verwendung des LAME-Encoders, der exakte Längeninformationen hinzufügt, in Kombination mit einem Abspielprogramm, das mit diesen umgehen kann, etwa foobar2000 oder Winamp. Einige Abspielprogramme wie Windows Media Player unterstützen Gapless Playback für MP3 immer noch nicht. Apple iTunes unterstützt es ab Version 7[9].

Kompression im Detail

Der Vorgang wird am Beispiel eines digitalisierten monauralen Audiosignals beschrieben. Zu Beginn wird das Eingangssignal für jeden Frame mittels einer Mehrphasen-Filterbank in 32 Subbänder verschiedener Breite aufgeteilt.[10] Ein solcher Frame beinhaltet 1152 Samples und ist somit in 36 Zeiteinheiten unterteilt (1152/32 = 36). Oft kommt es vor, dass Frequenzen in mehreren (benachbarten) Bändern gespeichert werden. Diese Redundanzen werden zu einem späteren Zeitpunkt wieder herausgefiltert.

Jedes Subband wird nun separat durch eine eindimensionale Kosinustransformation (MDCT) in eine Frequenzdarstellung übertragen. Die MDCT bringt eine fünfzigprozentige Überlappung mit sich. Transformiert und rücktransformiert man einen einzelnen Frame, so hat man ein abweichendes Ergebnis. Addiert man den vorherigen und nachfolgenden Frame partiell, so kürzen sich diese Fehler weg. Aus diesem Grund kann man die 36 Zeitwerte auf 18 reduzieren. Es entstehen somit 18 Frequenzbänder pro Subband. Der gesamte Frame enthält dann ein Spektrum von 576 (32 × 18) Frequenzbändern. Die dadurch entstehende Verschlechterung der zeitlichen Auflösung kann zu Pre-Echo-Effekten führen.

Als nächstes werden nun die entstandenen Redundanzen mittels der „Butterfly“-Berechnung (im MPEG-Standard enthalten) eliminiert. Dabei werden alle Frequenzen in den Subbandrändern miteinander verrechnet.

Die Daten für das psychoakustische Modell werden mittels einer Fast-Fourier-Transformation (FFT) erzeugt. Das geschieht zeitgleich zu der Aufspaltung des Signals in Subbänder, da die Daten des psychoakustischen Modells (Maskierungskurven) helfen, den bei der MDCT auftretenden Pre-Echo-Effekt auszugleichen.

Im nächsten Schritt findet die eigentliche Kodierung statt. Als Eingangsparameter dienen hier die von der MDCT erzeugten Frequenzbänder, die Maskierungskurven aus dem psychoakustischen Modell und die vom Anwender eingestellte Bitrate. Aus der Signal to Mask Ratio (Verhältnis von Signal zu maskiertem Bereich) kann hier die notwendige Menge an Bits zur Verfügung gestellt werden, also nur so viele Bits, wie notwendig sind, um den Teil zu kodieren, der nicht maskiert wird (Mask to Noise Ratio). Die Datenrate wird für jeden Frame separat gespeichert. Das ermöglicht eine Kodierung mit variabler Datenrate. Die Frequenzbänder werden nun nicht-linear quantisiert (diskretisiert) und anschließend Huffman-kodiert (komprimiert). Hier findet also eine erhebliche Datenreduktion statt. Anhand der Maskierungskurve des psychoakustischen Modells lässt sich die Quantisierungsqualität beurteilen.

Ein fertig kodiertes MP3-Frame besteht nun aus einem 32 Bit großen Header, der zum Hin- und Herspringen in der MP3-Datei benötigt wird (also zum Vor- und Zurückspulen). Im Kapitel Spezifikation wird der Header im Detail aufgeschlüsselt. Diesem Header folgen dann die Seiteninformationen, die zur Dekomprimierung benötigt werden. Diese setzen sich aus den Huffman-Tabellen, der Quantisierungschrittgröße und den MDCT-Blockgrößen zusammen. Danach folgen die eigentlichen Audio-Daten, also die kodierten Frequenzen.

Dekompression

Bei der Dekompression werden die Schritte der Kompression in umgekehrter Reihenfolge ausgeführt. Nach der Huffman-Dekodierung werden die Daten mittels inverser Quantisierung für die inverse modifizierte Cosinustransformation (IMCT) aufbereitet. Diese leitet ihre Daten weiter zu einer inversen Filterbank, die nun die ursprünglichen Samples berechnet (verlustbehaftet durch die Quantisierung im Kodierprozess).

Weiterentwicklung

MP3 ist ein besonders im Internet viel verwendetes Format. In der Industrie wird es hauptsächlich für PC-Spiele-Software verwendet. Es handelt sich um ein proprietäres Format, das als Nachfolger von MP2 entwickelt und in letzter Minute in den ISO-Standard aufgenommen wurde.

In der Industrie wurde zu dieser Zeit schon an dem MDCT-basierten AAC gearbeitet, das sauberer entworfen ist und bei vergleichbarem Aufwand bessere Ergebnisse liefert. Manche sehen daher AAC als Weiterentwicklung von MP2.

Neben dieser Weiterentwicklung (in Richtung einer hochqualitativen Kodierung) gibt es auch Weiterentwicklungen, um bei sehr niedrigen Datenraten (weniger als 96 kbit/s) noch eine akzeptable Klangqualität zu erreichen. Vertreter dieser Kategorie sind mp3PRO sowie MPEG-4 AAC HE beziehungsweise AAC+. Transparenz ist mit diesen Verfahren allerdings nur durch High Definition (HD-) AAC erreichbar (AAC LC + SLS).

Zeichen für 5.1-Klang

Die Erweiterung um Multikanalfähigkeiten bietet das MP3-Surround-Format des Fraunhofer-Instituts für Integrierte Schaltungen IIS. MP3-Surround erlaubt die Wiedergabe von 5.1-Ton bei Bitraten, die mit denen von Stereoton vergleichbar sind, und ist zudem vollständig rückwärtskompatibel: So können herkömmliche MP3-Decoder das Signal in Stereo decodieren, MP3-Surround-Decoder aber vollen 5.1-Surround-Klang erzeugen.

Dafür wird das Multikanal-Material zu einem Stereosignal gemischt und von einem regulären MP3-Encoder kodiert. Gleichzeitig werden die Raumklanginformationen aus dem Original als Surround-Erweiterungsdaten in das „Ancillary-Data“-Datenfeld des MP3-Bitstroms eingefügt. Die MP3-Daten können dann von jedem MP3-Decoder als Stereosignal wiedergegeben werden. Der MP3-Surround-Decoder nutzt die eingefügten Erweiterungsdaten und gibt das volle Multikanal-Audiosignal wieder. Vergleichbar ist das Verfahren mit Dolby Pro Logic.

Weitere Entwicklungen betreffen Verfahren zum Urheberschutz (engl. Digital Rights Management, kurz DRM), das nach verschiedenen Quellen in zukünftigen Versionen implementiert werden soll.

Anwendung

Audio-Rohmaterial benötigt viel Speicherplatz (1 Minute Stereo in CD-Qualität benötigt etwa 10 MB) und zum Transfer (beispielsweise über das Internet) hohe Datenübertragungsraten und/oder viel Zeit. Die verlustlose Kompression reduziert die zu übertragenden Datenmengen nicht so stark wie verlustbehaftete Verfahren, die für die meisten Fälle (Ausnahmen sind beispielsweise Studioanwendungen oder Archivierung) noch annehmbare Qualität liefern. So erlangte das MP3-Format für Audio-Daten schnell den Status, den die JPEG-Komprimierung für Bilddaten hat.

MP3 wurde in der breiten Öffentlichkeit vor allem durch Musiktauschbörsen bekannt. In der Warez-Szene wird bei vielen DVD-Rips als Tonspur das Audioformat MP3 verwendet. Mit sogenannten CD-Ripper-Programmen ist es möglich, die Musik von Audio-CDs zu extrahieren und in MP3-Dateien auszugeben. Auch gibt es viele Programme, die es ermöglichen, MP3 durch eine Konvertierung in ein anderes Format zu verwandeln, aber auch umgekehrt (Beispiel: Audiospur eines YouTube-Videos (FLV) wird in eine MP3-Datei umgewandelt).

Ein weiterer Anwendungsschwerpunkt sind die sogenannten MP3-Player, mit denen man auch unterwegs Musik hören kann. MP3-Player unterscheiden sich untereinander im Wesentlichen in der Speichertechnik, so gibt es Abspielgeräte mit Festplatten (beispielsweise iriver und die frühen iPod-Modelle), mit Festspeicher (Flash-Speicherung), mit verschiedenen Speicherkarten und mit CD oder Mini-CD als Speichermedium.

Im WWW finden sich zahlreiche Anwendungen zur MP3-Technik, von selbstkomponierter Musik über (selbst)gesprochene Hörbücher, Hörspiele, Vogelstimmen und andere Klänge bis hin zum Podcasting. Musiker können nun auch ohne einen Vertrieb ihre Musik weltweit verbreiten und Klangaufnahmen ohne großen Aufwand (abgesehen von den GEMA-Gebühren, auch auf eigene Kompositionen, die bei der GEMA angemeldet sind) auf einer Website zur Verfügung stellen. Nutzer können über Suchmaschinen alle erdenklichen (nicht kommerziellen) Klänge und Musikrichtungen finden.

Auch bei multimedialer Software, vor allem bei PC-Spielen, werden die oft zahlreichen Audiodateien im MP3-Format hinterlegt. Zudem findet MP3 bei zahlreichen, meist kleineren Online-Musikläden Anwendung.

Tagging

Im Gegensatz zu moderneren Codecs boten MP3-Dateien ursprünglich keine Möglichkeit, Metadaten (beispielsweise Titel, Interpret, Album, Jahr, Genre) zu dem enthaltenen Musikstück zu speichern.

Unabhängig vom Entwickler des Formats wurde dafür eine Lösung gefunden, die von fast allen Soft- und Hardwareplayern unterstützt wird: Die ID3-Tags werden einfach an den Anfang oder das Ende der MP3-Datei gehängt. In der ersten Version (ID3v1) werden sie am Ende angehängt und sind auf 30 Zeichen pro Eintrag und wenige Standard-Einträge beschränkt. Die wesentlich flexiblere Version 2 (ID3v2) wird allerdings nicht von allen MP3-Playern (insbesondere Hardware-Playern) unterstützt, da hier die Tags am Anfang der MP3-Datei eingefügt werden. Auch innerhalb von ID3v2 gibt es noch beträchtliche Unterschiede. Am weitesten verbreitet sind ID3v2.3 und ID3v2.4, wobei erst ID3v2.4 offiziell die Verwendung von UTF-8-kodierten Zeichen zulässt (vorher waren nur ISO-8859-1 und UTF-16 zulässig). Viele Hardwareplayer zeigen aber UTF-8-Tags nur als wirre Zeichen an. Da ID3v2-Tags am Anfang der Datei stehen, lassen sich diese Daten beispielsweise auch bei der Übertragung über HTTP lesen, ohne erst die ganze Datei zu lesen oder mehrere Teile der Datei anzufordern. Um zu vermeiden, dass bei Änderungen die ganze Datei neu geschrieben werden muss, verwendet man üblicherweise Padding, das heißt man reserviert im Vorfeld Platz für diese Änderungen.

Die Metadaten aus dem ID3-Tag können beispielsweise genutzt werden, um Informationen zum gerade abgespielten Stück anzuzeigen, die Titel in Wiedergabelisten (Playlists) zu sortieren oder Archive zu organisieren.

Spezifikation

Frame-Header
Element Größe Beschreibung
Sync 11 Bit alle Bits sind auf 1 gesetzt
ID 2 Bit 0 = MPEG Version 2.5
1 = reserviert
2 = MPEG Version 2
3 = MPEG Version 1
Layer 2 Bit 0 = reserviert
1 = Layer III
2 = Layer II
3 = Layer I
Protection 1 Bit 0 = 16-Bit CRC nach dem Header
1 = keine CRC
Bitrate 4 Bit gemäß Bitraten-Tabelle
Samplingfrequenz 2 Bit gemäß Sampling-Tabelle
Padding 1 Bit 0 = Frame wird nicht aufgefüllt
1 = Frame mit Extraslot gefüllt
Slotgröße: Layer I = 32 Bits; Layer II+III 8 Bits
Private 1 Bit nur informativ
Kanalmodus 2 Bit 0 = Stereo
1 = Joint Stereo
2 = 2 Mono Kanäle
3 = ein Kanal (Mono)
Mode-Extension 2 Bit (nur für Joint Stereo)
gemäß Mode-Extension-Tabelle
Copyright 1 Bit 0 = ohne Copyright
1 = mit Copyright
Original 1 Bit 0 = Kopie
1 = Original
Emphasis 2 Bit 0 = keine
1 = 50/15 ms
2 = reserviert
3 = ITU-T J.17

Tabelle Bitraten (Angaben in kbps)
Wert MPEG 1, Layer I MPEG 1, Layer II MPEG 1, Layer III MPEG 2/2.5, Layer I MPEG 2/2.5, Layer II/III
0 freies Format
1 32 32 32 32 8
2 64 48 40 48 16
3 96 56 48 56 24
4 128 64 56 64 32
5 160 80 64 80 40
6 192 96 80 96 48
7 224 112 96 112 56
8 256 128 112 128 64
9 288 160 128 144 80
10 320 192 160 160 96
11 352 224 192 176 112
12 384 256 224 192 128
13 416 320 256 224 144
14 448 384 320 256 160
15 nicht erlaubt

Tabelle Samplingfrequenz
Wert MPEG 1 MPEG 2 MPEG 2.5
0 44.100 Hz 22.050 Hz 11.025 Hz
1 48.000 Hz 24.000 Hz 12.000 Hz
2 32.000 Hz 16.000 Hz 8.000 Hz
3 reserviert

Tabelle Mode-Extension
Wert Layer I/II Layer III
0 Subbänder 4 bis 31 Intensity-Stereo: aus; M/S-Stereo: aus
1 Subbänder 8 bis 31 Intensity-Stereo: ein; M/S-Stereo: aus
2 Subbänder 12 bis 31 Intensity-Stereo: aus; M/S-Stereo: ein
3 Subbänder 16 bis 31 Intensity-Stereo: ein; M/S-Stereo: ein

Auf den Frame-Header folgen die Frame-Daten (gegebenenfalls zunächst CRC), in denen die kodierten Audio-Daten enthalten sind.

Verbreitete Implementierungen

Zum Codieren von MP3-Dateien stehen der lizenzpflichtige Encoder der Fraunhofer-Gesellschaft und der Encoder des Open-Source-Projektes LAME zur Verfügung. Daneben existieren der Referenzencoder der ISO dist10 und weitere Projekte wie beispielsweise Xing, blade und Gogo.

Als Decoder stehen mpg123, MAD, libavcodec und weitere zur Verfügung.

Alternative Formate

Eine ~128kBit/s-MP3-Datei im direkten Vergleich durch Spektralanalysen mit anderen verlustbehafteten Audiodatenkompressionsverfahren, das unkomprimierte Lied The Power of Thy Sword zeigt im Gegensatz zu der MP3-Datei eine volle Bandbreite bis etwa 21 kHz, wogegen die MP3-Datei nur etwa eine Bandbreite bis etwa 16 kHz aufweisen kann, dies heißt allerdings nicht sofort, dass sich die Audioqualität drastisch verändert hat

Neben MP3 existieren zahlreiche weitere Audioformate. Das Format Vorbis ist quelloffen und wird von den Entwicklern als im Gegensatz zu MP3 patentfrei bezeichnet. Vorbis hat sich bei technischen Analysen und in Blindtests gegenüber MP3 vor allem in niedrigen und mittleren Bitratenbereichen als überlegen erwiesen, während im hohen Bereich (um 256 kbit/s) der Vorsprung minimal ist. Außerdem bietet Ogg-Vorbis Mehrkanal-Unterstützung, und das Containerformat Ogg erlaubt zudem auch Video- und Textdaten.[11]

RealAudio von RealMedia wurde vorwiegend für Audio-Datenströme (Streaming Audio) eingesetzt.

Das freie, auf MP2-Algorithmen basierende Musepack (früher MPEGPlus) wurde entwickelt, um bei Bitraten über 160 kbit/s noch bessere Qualität als das MP3-Format zu ermöglichen. Es konnte sich aber nicht breit durchsetzen, da es auf die Anwendung im High-End-Bereich abzielt und im kommerziellen Bereich kaum unterstützt wird. Dateien im Musepack-Format erkennt man an der Erweiterung mpc oder mp+.[12]

Free Lossless Audio Codec (FLAC) ist ein weiterer freier Audiocodec und bietet eine verlustfreie Audiodatenkompression.

Advanced Audio Coding (AAC) ist ein im Rahmen von MPEG-2 und MPEG-4 standardisiertes Verfahren, das von mehreren großen Unternehmen entwickelt wurde. Apple und RealMedia setzen dieses Format für ihre Online-Musikläden ein, und die Nero AG stellt einen Encoder für das Format bereit. Mit faac ist auch ein freier Encoder erhältlich.[13] AAC ist bei niedrigen Bitraten bis etwa 160 kbit/s MP3 in der Klangqualität überlegen – je niedriger die Bitrate, desto deutlicher –, erlaubt Mehrkanal-Ton und wird von der Industrie (zum Beispiel bei Mobiltelefonen und MP3-Playern) breit unterstützt.

Windows Media Audio (WMA) ist ein von Microsoft entwickeltes Audioformat und wird häufig für DRM-geschützte Downloads verwendet. Obwohl es auf vielen üblichen Plattformen abgespielt werden kann, hat es sich nicht gegen das MP3-Format behaupten können.

Wissenswertes

Das Team um Brandenburg machte die ersten Praxistests mit der A-cappella-Version des Liedes Tom’s Diner von Suzanne Vega. Brandenburg hörte das Lied durch Zufall und empfand das Stück sogleich als geeignete Herausforderung für eine Audiodatenkompression.

Siehe auch

Einzelnachweise

  1. RFC 3003
  2. RFC 3555
  3. RFC 5219
  4. a b MP3 wird 10 Jahre. 12. Juli 2007, abgerufen am 3. Februar 2011.
  5. heise.de: Microsoft sieht Hunderte von Firmen von MP3-Patentstreit betroffen
  6. heise.de: Microsoft erringt Erfolg im Streit um MP3-Patente
  7. heise.de, Carsten Meyer: Kreuzverhörtest, c't 6/2000, Abschnitt Siegerehrung
  8. http://audiohq.de/?showtopic=20 AudioHQ über MP3-Qualität
  9. Apple.com: What is Gapless Playback (englisch)
  10. Henning, Peter A.: Taschenbuch Multimedia. 4. Aufl., Fachbuchverlag Leipzig, 2007, ISBN 978-3-446-40971-2.
  11. Digit-Life.com: OGG vs. LAME (englisch)
  12. hydrogenaudio.org: MPC vs VORBIS vs MP3 vs AAC at 180 kbps, 2nd checkup with classical music (englisch)
  13. SourceForge.net: Freeware Advanced Audio Coder (englisch)

Literatur

  • Roland Enders: Das Homerecording Handbuch. 3. Auflage, Carstensen Verlag, München, 2003, ISBN 3-910098-25-8.
  • Hubert Henle: Das Tonstudio Handbuch. 5. Auflage, GC Carstensen Verlag, München, 2001, ISBN 3-910098-19-3.
  • Thomas Görne: Tontechnik. 1. Auflage, Carl Hanser Verlag, Leipzig, 2006, ISBN 3-446-40198-9.

Weblinks

Wiktionary Wiktionary: MP3 – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • MP3+G — is a karaoke file format that was created to allow CD+G karaoke to be played from a personal computer easily and quickly. MP3+G is consideredthe de facto standard of karaoke on the PC and was created from the combination of the MP3 audio file… …   Wikipedia

  • mp3.de — war das erste deutsche Musikportal. Der Name ist eine Kombination aus dem Dateiformat MP3 und der deutschen Top Level Domain .de. Inhaltsverzeichnis 1 Geschichte 2 Positionen zum digitalen Rechtemanagement 3 Mobilfunk …   Deutsch Wikipedia

  • MP3 — 〈n.; , ; EDV; Abk. für〉 MPEG Audio Layer 3, ein Datenformat zur Audiokomprimierung von Klangdateien (MP3 Format) * * * MP3, das; [s], s [mp3 = Dateiendung für das Datenformat MPEG Audio Layer 3; MPEG = Abk. für engl. Moving Picture Expert Group …   Universal-Lexikon

  • Mp3.de — ist das erste und älteste deutsche Musikportal. Der Name ist eine Kombination aus dem Dateiformat MP3 und der deutschen Top Level Domain .de. Geschichte mp3.de ging 1997 online. War es zunächst ein rein technisches Forum für das damals neue… …   Deutsch Wikipedia

  • MP3 — formatas statusas T sritis informatika apibrėžtis Muzikos ↑failų ↑glaudinimo formatas, kurio pagrindinis tikslas – sumažinti muzikos kūrinių failų dydį, kad juos būtų galima ekonomiškiau siųsti ↑internetu. Garso bangos gali būti nusakytos… …   Enciklopedinis kompiuterijos žodynas

  • MP3 SX — (Stereo eXtended) is a program that allows users to upgrade mp3 stereo files to MP3 Surround files. mp3 SX analyzes the existing natural ambience of the stereo material and plays it back through the rear channels. The sound sources remain in the… …   Wikipedia

  • MP3 — Bendroji  informacija Rūšis: naujai skolinta santrumpa Rašybos variantai: mp3. Kilmė: anglų, MP3. Giminiškas naujažodis: mptrioškė. Pateikta: 2011 11 18. Atnaujinta: 2014 01 07. Reikšmė ir vartosena Apibrėžtis: garso įrašų glaudinimo formatas.… …   Lietuvių kalbos naujažodžių duomenynas

  • MP3 — Mera Pehla Pehla Pyaar Movie poster for MP3 Mera Pehla Pehla Pyaar Directed by Robby Grewal Written by …   Wikipedia

  • mp3 — MPEG 1 (Moving Pictures Expert s Group 1), audio layer 3. A technique designed to compress bulky files of digitised music to facilitate the ease of download and storage of music files. mp3 compression technology allows a person to quickly… …   Law dictionary

  • MP3 — MP3, conocido también por su grafía emepetrés, es un formato de audio digital comprimido con pérdida desarrollado por el Moving Picture Experts Group (MPEG) para formar parte de la versión 1 (y posteriormente ampliado en la versión 2) del formato …   Enciclopedia Universal

  • MP3 — UK US /empiːˈθriː/ noun [C or U] IT ► a computer file that stores high quality sound in a small amount of space, or the technology that makes this possible: »an MP3 file/download/device »MP3 technology/format …   Financial and business terms

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”