Выбираем кодек – MP3 и другие

Выбираем кодек – MP3 и другие

Как известно, музыкальная информация занимает кучу места (уступая разве что видео, ну да оно и понятно). В «чистом», несжатом виде минута звука, извлеченного с компакт-диска и сохраненная в формате wav занимает около 10 Мб. Да уж, немало – емкости даже сегодняшних винчестеров для создания приличной MP3-коллекции не хватит. Что уж говорить о миниатюрных «флэшках» портативных плееров!

Поэтому еще в самом начале мультимедийной эры стало понятно: звук необходимо сжимать, доводя его размеры до приемлемых величин. Вот только как это делать?

Со сжатием (или компрессией) информации пользователи познакомились еще задолго до «звуковой эры» – это могли делать всем известные программы-архиваторы. ZIP или RAR способны «выжимать» всю лишнюю информацию практически из любого файла, уменьшая его размеры порой в десятки раз! При этом после извлечения файла из «архива» (то есть распаковки) он представал перед пользователем в точности таким, каким был до упаковки. То есть потери информации при компрессии не происходило!

Так что же – вот он, выход? Согласен – это БЫЛ БЫ просто замечательный выход… Если бы при работе со звуковыми файлами традиционные архиваторы достигали бы хороших результатов. На деле даже самый лучший архиватор может уменьшить объем звукового файла лишь на скромные 10–30 процентов.

Понятно, что без потерь сжать звуковой файл не получится – надо чем-то жертвовать! То есть использовать компрессию «с потерями», компенсируя ухудшения качества звука маленьким объемом получившегося файла.

Все мы знаем, что в любой записанной на компакт-диске музыкальной информации присутствует серьезная избыточность. В самом деле – человеческое ухо способно различать звуки в диапазоне, не превышающем 18 кГц (и то далеко не у всех – большинство слушателей «останавливаются» уже на границе 16 кГц).

Между тем максимальная частота звуков, записанных на компакт-диске, составляет 22 кГц. (Не путайте эту цифру с так называемой «частотой дискретизации», которая, согласно теории, должна вдвое превышать максимальную частоту звука в записи – вот откуда взялся тот самый стандарт 44 кГц!) Таким образом, налицо явный излишек, который можно удалить (я сознательно опускаю слово «безболезненно»: согласно современным данным, хотя высокочастотные сигналы и не воспринимаются человеческим ухом как слышимые звуки, они тем не менее серьезно влияют на общую картину, «прозрачность» звука). Что при MP3-кодировании с успехом и делается.

Но это – лишь вершина айсберга. В процессе сжатия звука программа-кодер работает с ювелирным искусством хирурга, убирая из звукового потока любые не слышимые человеком сигналы. Например, звуки и частоты, которые «пропадают» для нас, попадая «в тень» более мощного соседнего сигнала. При этом работа проводится максимально осторожно и бережно, чтобы не «повредить» слышимый человеком звук. Любители научной терминологии уже прозвали этот метод «психоакустическим», то есть учитывающим психологические особенности восприятия звука человеком.

Уже первые алгоритмы сжатия (например, Real Audio или Microsoft ADPCM) позволили уменьшить размер файла в 10 и более раз. Однако качество звука, получавшегося в результате сжатия по этим алгоритмам, чаще всего было ниже всякой критики – например, для достижения степени сжатия, сравнимого с MP3, пользователям ADPCM приходилось вдвое снижать как частоту дискретизации (с 44 до 22 кГц), так и разрядность звука (с 16 до 8 бит). Конечно, то, что оставалось от музыки после такой вивисекции, музыкой уже называть было никак нельзя…

Однако уже тогда возможностями «сжатого звука» заинтересовались пираты – так, в 1995 г. в России был выпущен первый в мире пиратский «мультимедийный диск» с полной коллекцией альбомов The Beatles, закодированных именно с использованием формата ADPCM.

Первый «мультимедийный» пиратский диск

Монополия ADPCM на рынке «компрессоров» продлилась всего пару лет – уже к 1996 г. вовсю заявила о себе сенсационная разработка немецких ученых, новый формат сжатия под названием MP3.