Thema: MPEG-4 Lossless Audio Coding
Nicht nur hier auf AudioHQ, sondern auch auf vielen anderen Websites wurde im Jahr 2004 Apple Lossless (ALAC) als ein AAC Lossless Codec vorgestellt. Das hat dazu geführt, dass bis heute ALAC fälschlicherweise für AAC-basiert gehalten wird und AAC Lossless sogar zu einem Synonym geworden ist. Auch gibt es das Gerücht, dass in RealAudio Lossless ein AAC-basierter Lossless-Codec verwendet wird. Was mich dabei immer etwas gewundert hat, ist, dass ALAC häufig als ein proprietäres Format abgestempelt wurde und bis Frühjahr 2005 nicht offengelegt war.
Wie kann ein Format, dass angeblich den AAC-Lossless-Kriterien der MPEG entspricht proprietär und nicht offengelegt sein? Warum gab es keine Decoder für andere Soft- oder Hardware für ALAC bevor einer unter Open Source-Lizenz freigegeben wurde?
Nach einigen Recherchen habe ich herausgefunden, dass weder Apple Lossless noch RealAudio Lossless etwas mit AAC zu tun hat! Wäre ALAC nämlich AAC-Lossless, würde jeder m4a/AAC-Player ALAC wenigstens lossy wiedergeben können. Dies ist jedoch nicht möglich, da ALAC ein lossless-only Codec ist. Mehr dazu später.
Die Herkunft von ALAC ist ungeklärt. Es ist jedoch auffällig, dass Apple im Jahre 2002 Emagic übernommen hat. Mit Emagic ging auch ZAP ( ein von Markus Fritze in den 90ern entwickelter Lossless-Codec) in den Besitz von Apple über. Es ist daher nicht unwahrscheinlich, dass ALAC eine weiterentwickeltes ZAP ist. Apple hätte sich dadurch die Neuentwicklung eines Codecs bzw. die Lizenzkosten für einen Codec einer anderen Firma gespart.
Das Gerücht, dass RealAudio Lossless AAC-basiert sei, kommt vermutlich daher, dass in der lossy-Variante von RealAudio über 128kbit AAC zum Einsatz kommt. RealAudio Lossless ist jedoch ebenfalls ein propietärer lossless-only Codec. RealNetwork hatte ihn als Vorschlag für MPEG-4 Lossless Audio eingereicht, welcher aber abgelehnt wurde.
Damit komme ich zum 2. Thema dieses Textes: die Frage, was AAC-Lossless wirklich ist und gleichzeitig die Vorstellung des neuen MPEG-Standards für verlustlose Audio-Kompression.
MPEG-4 Lossless Audio Coding
Es gibt zwei verschiedene MPEG-4 Lossless Formate mit unterschiedlichen Technologien, Eigenschaften und Anwendungsgebieten. Die Standardisierung beider Formate ist noch nicht ganz abgeschlossen.
Das eine Format ist MPEG-4 ALS (Audio Lossless Coding) und basiert auf LPAC von Tilman Liebchen, Technische Universität Berlin. Es ist ein lossless-only Codec und ähnelt in der Effizienz Monkey's Audio. Man könnte sagen, dass ALS das Gegenstück zu Monkey's Audio und FLAC darstellt. Das Besondere an diesem Format ist, dass es Random Access unterstützt, d.h. man kann an jeder beliebigen Stelle in der Datei „einspringen“, was ALS streamingfähig macht. Im Gegensatz zu den oben genannten Formaten und den „disc-gebundenen“ Meridian Lossless (MLP), Dolby TruHD und DTS HD Lossless könnten man ALS theoretisch auch für DVB oder Internet-Streams (z.B. MPEG4IP) verwenden.
Das zweite Format, MPEG-4 SLS (Scalable to Lossless Coding) basiert nicht auf LPAC sondern auf AAC und ist somit das gesuchte „AAC-Lossless“. Das Referenzmodell kommt vom Institute for Infocomm Research (I2R). Der Codec wird jedoch nicht AAC-Lossless genannt, sondern AAZ (Advanced Audio Zip) Um keine weiteren Verunsicherungen und Verwirrungen zu verursachen (wie ALAC alias AAC-Lossless) sollte man möglichst auch von AAZ bzw. SLS sprechen. Das Besondere an SLS ist, dass es kein reines lossless Format, sondern ein erweitertes AAC ist. Normale AAC-Decoder gehen damit wie mit einer herkömmlichen, lossy MP4/AAC-Datei um, während AAZ-Decoder aus der Lossless-Erweiterung das Original bitidentisch wiederherstellenen können (vergleichbar mit der Erweiterung aacPlus für kleine Bitraten). AAZ ähnelt also WavPack, mit dem Unterschied, dass sämtliche Informationen in einer Datei stecken und nicht auf zwei verteilt werden. Der Vorteil gegenüber WavPack ist der einfachere Umgang und die Abwärtskompatiblität zu AAC, mit dem viele Player umgehen können. Bis hierhin kann man SLS/AAZ als ein Gegenstück zu WMA Lossless, das ebenfalls abwährtskompatibel ist - jedoch zu WMA statt zu AAC - und wohl auch Random Access bietet, sehen oder auch zu DTS HD Lossless (abwärtskompatibel zu DTS HD, DTS ES und DTS). SLS geht aber noch ein Stück weiter, was es zu einem bis dato einzigartigem Format macht: es ist "scalable to lossless", also skalierbar bis zur Verlustlosigkeit, da es eben AAC-basiert ist (siehe auch MPEG-4 AAC - Scalable Sample Rate (AAC-SSR) ). Diese Skalierbarkeit zusammen mit der Random Access-Technik, die SLS auch unterstützt, macht es möglich, dass je nach verfügbarer Bandbreite ein SLS-Stream in unterschiedlicher Qualität übertragen bzw. empfangen werden kann. Beispielsweise könnte jemand mit DSL-Anschluss ein SLS-Stream lossless mit ~1000Kbit/s Datenrate abspielen, während eine zweite Person via UMTS (vorrausgesetzt die Kosten dafür werden in Zukunft etwas freundlicher ;) ) unterwegs den gleichen Stream transparent bzw. perceptual lossless (der Ausdruck gefällt mir :) ) mit ~200Kbit/s Datenrate hören könnte und eine dritte Person via ISDN-Anschluss lossy mit 64Kbit/s. Die Datenrate passt sich bei SLS also variabel der verfügbaren Bandbreite an. Ob SLS auch mit aacPlus / HE-AAC kombiniert werden kann, weiß ich nicht. Der Nachteil von SLS gegenüber ALS ist die etwas geringere Effizienz (~5-10%).
Während ALS eher für die (professionelle) Produktion und Archivierung mit möglichst starker Komprimierung gedacht ist, eignet sich SLS vor allem für Konsumenten als Alternative zu WMA Lossless oder FLAC und für Streaming via Internet (MPEG4IP) oder DVB.
Auch wenn es für die verlustlose Speicherung von Musik derzeit keinen Grund gibt, etwas anderes als FLAC (bzw. ALAC unter Mac OS X) zu verwenden, könnte die Verwendung von MPEG-4 SLS in ein paar Jahren für viele Leute eine interessante Option sein. Während sich solche Konsumenten wie wir nicht mit propietären Firmenformaten anfreunden können, kann es der Großteil der Industrie nicht mit Open Source-Formaten. MPEG-4 Lossless könnte vielleicht ein Kompromiss sein, den viele akzeptieren würden. Es bietet nicht nur neue Anwendungsmöglichkeiten im Streaming-Bereich. Es könnte auch in Online-Läden statt propietärer lossy Formate eingesetzt werden oder auf zukünftigen Musik-Medien wie die Blu-ray Disc oder HD DVD für eine „pre-ripped“ Version des Inhalts, die man auf Festplatte kopieren könnte.
Quellen:
- http://www.nue.tu-berlin.de/forschung/proj...s/mp4als_d.html
- http://www.tnt.uni-hannover.de/project/mpe...less_Coding.pdf
- http://www.nue.tu-berlin.de/Publikationen/...Prozess2003.pdf
- http://www.imt.tu-ilmenau.de/lehre/hs_avt/...-hausarbeit.pdf
- http://www.neilturner.me.uk/2004/May/09/ap...ss_encoder.html
- http://forums.macnn.com/archive/index.php/t-210998.html
- http://www.bigbluelounge.com/forums/vie … p?p=114475
- http://www.itsc.org.sg/synthesis/2004/3_AAZ.pdf
Anmerkungen:
- Falls der Text irgendwelche falschen Aussagen enthalten sollte, weist mich bitte darauf hin!
- Der Thread ist mit Lego abgesprochen.