1,

Как работает сжатие аудио

Подробнее рассказываем о механизме сжатия аудио-данных на примере популярного формата MP3, который появился еще в 1993 году
Сегодня количество потребляемой нами информации в сети выросло в тысячи раз в сравнении с началом 2000-х. И неудивительно, ведь раньше, помимо намного менее распространенного интернет-покрытия, привычные нам сайты и сервисы выглядели совсем по другому.
Как работает сжатие аудио

Мы ежедневно читаем статьи и новости о том, что та или иная компания разработала новый стандарт соединения, превосходящий нынешние аналоги по скорости передачи данных. За уже практически два десятилетия провайдеры и производители многих гаджетов сделали огромный шаг в направлении к скоростному доступу в Интернет. Но не одними лишь скоростями наш мгновенный доступ к сайтам един.
Как работает сжатие аудио

Огромную роль в экономии нашего времени сыграло развитие алгоритмов сжатия изображений, аудио и видеофайлов. Гуляя по просторам сети, зачастую мы даже не задумываемся над тем, как и что устроено, сколько сил было приложено к разработке той или иной технологии. В новой серии статей мы рассмотрим методы сжатия таких популярных форматов, как MP3 и JPEG, а также базово рассмотрим процесс кодирования видео.

Работа алгоритма

Как работает сжатие аудио
Первым в новой серии статей станет самый популярный формат сжатия аудио–файлов *.mp3. Появился он в 1993 году, благодаря рабочей группе института Фраунгофера, а стандартизирован объединением MPEG. По данным Википедии, объединение было образовано международной организацией ISO для разработки норм в сжатии аудио и видеофайлов. Ими были установлены также следующие стандарты:
  • MPEG–1: Предназначался для сжатия видео и аудио–файлов, позже стал устоявшимся стандартом для VCD (Video CD).
  • MPEG–2: Уже ориентировался на передачу сигнала широковещательного телевидения семейств ATSC, ISDB и DVB и в прочих спутниковых ТВ-вещаниях. Таких как например Dish Network.
  • MPEG–3: Стандарт разработанный для вещания HDTV, но был не принят по причине того, что MPEG–2, с небольшими доработками вполне хватало для таких целей. И нет, это не тот самый mp3, о котором вы сейчас могли подумать. На самом деле, mp3 является ответвлением стандарта MPEG–1, 3 уровня.
  • MPEG–4: Является во многом усовершенствованным MPEG–1, с поддержкой декодирования 3D–контента и сжатия с низким битрейтом. В него также была интегрирована система программной защиты авторских прав — DRM. Из новых введенных в стандарт видео-форматов, можно отметить ASP и H.264.
Все таки давайте вернемся обратно к mp3. Основной задачей формата было и является уменьшение размера файлов за счет удаления определенных участков звукового спектра, которые не ощущаются на непрофессиональной аудиотехнике, в соответствии с психоакустической моделью звуковосприятия человека.
Как работает сжатие аудио
На этом этапе при помощи алгоритма преобразования Фурье, звуковая волна раскладывается на спектры разной частоты. Все те малоразличимые нашим слухом частоты просто удаляются. В основном это весь спектр звука выше 16 000 Гц. По такому принципу, кстати, работают и сервисы определения музыки, типа SoundHound и Shazam. Встроенный в их работу алгоритм разделяет слышимую звуковую волну на несколько, выделяет ритмику, основные ноты и сравнивает их со своей базой данных.
Как работает сжатие аудио
Но тем не менее, общая картина звучания, например, mp3-файла в битрейте 320 кбит/с мало чем отличается от несжатого файла, при этом в размере может составлять 1/10 от оригинального.
Как работает сжатие аудио
Уже на этом этапе размер файла можно значительно уменьшить, но самый больший процент сжатия происходит на следующих этапах маскировки. Работа первого из них заключается в удалении кратных звуковых частот на громких моментах в песне, то есть если звучит громкий барабан, то все остальные сигналы исходящие от включенных в аранжировку инструментов, можно просто–напросто убрать, и никто этого не заметит.
Как работает сжатие аудио
А в некоторых случаях, в соответствии с той же психоакустической моделью, можно удалять доли перед, и после звучания громких звуков, так как в этот период у всех людей наступает кратковременная (буквально на несколько сотых секунды) глухота.
Как работает сжатие аудио
Потом идет распределение звуков по каналам. Это происходит не без потерь в детализации, с помощью специальных формул, которые вы можете посмотреть на картинке (упрощено). Разница в звучании каждого из каналов сводится почти к нулю с целью сэкономить еще одну сотню-другую байт.
Как работает сжатие аудио
В конце каждый из сжатых фреймов аудиозаписи закодированные одинаковыми символами (например нулями), сокращаются до минимальных размеров при помощи метода кода Хаффмана. В процессе его работы дополнительная информация не теряется, просто к каждому из значений фреймов присваивается какой-то код, в зависимости от того, сколько раз то или иное число в нем встречается. Далее все оставшиеся куски нашей аудиозаписи склеиваются и на выходе образуют привычный нам аудио–файл.

Спасибо, что дочитали до конца теперь мы разобрались с тем, как устроен один из самых распространенных аудиоформатов. B следующей статье мы рассмотрим процесс сжатия видео.

Материалы по теме:

Последнее изменение:
 
Duh_VINNI44
Duh_VINNI44 1, 19 сентября 2018 - 21:19   (...)
Такие темы мне нарвятся, но картинки с АЧХ и редактора где оба трека мп3 не в тему.
Ответить
podogreykin
podogreykin1, 19 сентября 2018 - 22:03   (...)
Спасибо) Да, буду теперь обращать внимание на картинки, все таки визуальное сопровождение тоже играет немаловажную роль
Ответить
egorych1237
egorych1237, 20 сентября 2018 - 07:38   (...)
Спасибо автору за статью. Всё описано понятнейши языком. Но есть один вопрос: под каким названием известен меломанам формат несжатого аудиофайла?olac или лослесс?
Ответить
saska31
saska31, 20 сентября 2018 - 08:06   (...)
Вроде как именно лослесс)
Ответить
Feod
Feod3, 20 сентября 2018 - 08:47   (...)
Несжатый формат это какой-нибудь WAV, а Flac/Alac это сжатие с минимальными потерями
Ответить
justmax437
justmax4371, 20 сентября 2018 - 14:15   (...)
Без потерь вообще
Ответить
Feod
Feod3, 20 сентября 2018 - 14:17   (...)
Ошибся, каюсь
Ответить
Feod
Feod3, 20 сентября 2018 - 14:17   (...)
Но всё равно сжатие))
Ответить
justmax437
justmax4371, 9 октября 2018 - 18:11   (...)
Со 100% точным математическим разжатием обратно.
Ответить
kolya_kolya_koly
kolya_kolya_koly10, 21 сентября 2018 - 07:39   (...)
WAV может хранить и со сжатием
Ответить
Feod
Feod3, 21 сентября 2018 - 07:54   (...)
И?
Ответить
kolya_kolya_koly
kolya_kolya_koly10, 21 сентября 2018 - 07:57   (...)
держу в курсе
Ответить
Feod
Feod3, 20 сентября 2018 - 08:38   (...)
По-моему таким образом работает только Joint Stereo, обычный стерео не трогает каналы
__TCAPT__
Ответить
Windot
Windot , 4 октября 2018 - 20:24   (...)
Спасибо за статью, много чего полезного узнал. Хотелось бы увидеть инфу об обработке флака и сжатии видео.
Ответить
podogreykin
podogreykin1, 4 октября 2018 - 20:55   (...)
Спасибо. Про видео выйдет в ближайшее время, материал готов. Сейчас у меня планы на новые форматы по статьям, решил изменить процессы в своей работе, что бы поднять качество материалов. Так что хз, в целом, тема про флак интересная, возможно когда-то напишу)
Ответить

Добавить комментарий
Если нужно ответить кому-то конкретно,
лучше нажать на «Ответить» под его комментарием