Перейти к содержимому

#7. Мир аудиоформатов!

Это целая вселенная с компромиссами между качеством, размером и совместимостью. Пройдемся от простого к сложному.

1. Форматы с потерей качества (Lossy)

Сжатие происходит с удалением части аудиоинформации, которую (в теории) не слышит человеческое ухо. Размер файла сильно уменьшается, но качество необратимо ухудшается. Чем выше битрейт (количество данных в секунду), тем лучше.

От низкого к приемлемому качеству:

  • MP3 (MPEG Audio Layer III): Царь совместимости. Самый распространенный. Качество сильно зависит от битрейта.
    • ~96 кбит/c: Низкое качество, заметные искажения.
    • ~128 кбит/c: Стандарт для потоковых сервисов раньше. Приемлемо, но на хорошей аппаратуре не хватает деталей.
    • ~192-320 кбит/c: Высокое качество. Для большинства людей на большинстве устройств разница с lossless уже неприметна.
  • AAC (Advanced Audio Coding): Эволюционная замена MP3. При том же битрейте обычно звучит лучше. Стандарт для iTunes, YouTube, iPhone.
  • OGG Vorbis: Открытый аналог MP3/AAC. Часто используется в стриминговых сервисах (например, Spotify) и играх.
  • WMA (Windows Media Audio): Проприетарный формат Microsoft. Сейчас потерял актуальность.
  • Opus: Современный чемпион. При сверхнизких битрейтах (для голоса) и при высоких (для музыки) часто превосходит все форматы выше. Стандарт для звонков в Discord, WhatsApp, часть веб-стандарта.

Нюанс Lossy: Перекодирование из одного lossy-формата в другой (например, MP3 в AAC) катастрофически ухудшает качество.

2. Форматы без потери качества (Lossless)

Сжимают аудио как архив, без потерь. Распаковав такой файл, получаем точную копию оригинального CD или студийной записи. Размер файла в 2-4 раза меньше, чем несжатого WAV/AIFF, но в 3-10 раз больше, чем у MP3 высокого битрейта.

От хорошего к отличному качеству (здесь разница в возможностях хранения метаданных и эффективности сжатия):

  • FLAC (Free Lossless Audio Codec): Самый популярный открытый lossless-формат. Царь для меломанов и архивов. Поддерживает теги (обложки, исполнитель и т.д.).
  • ALAC (Apple Lossless Audio Codec): То же самое, что FLAC, но для экосистемы Apple. Полностью поддерживается iTunes и iOS.
  • APE (Monkey’s Audio): Обеспечивает чуть лучшее сжатие, чем FLAC, но требует больше ресурсов для кодирования/декодирования и менее совместим.
  • WavPack (WV): Может работать как в lossless, так и в гибридном режиме (lossy + correction file для восстановления).

Нюанс Lossless: Для прослушивания lossless действительно нужна хорошая аудиоцепочка (качественные наушники/колонки, ЦАП) и, что важнее, тренированный слух. Разницу между качественным 320 кбит/c MP3 и lossless улавливают далеко не все и не всегда.

3. Форматы без сжатия

Полная, «сырая» оцифровка звуковой волны. Огромный размер файла.

  • WAV (Waveform Audio File Format): Стандарт для Windows и профессиональной работы в аудиоредакторах (монтаж, сведение). Практически не содержит метаданных (исполнитель, альбом и т.д.).
  • AIFF (Audio Interchange File Format): Аналогичный несжатый формат от Apple, но с поддержкой метаданных.

4. Высокодетализированные форматы (High-Resolution Audio / Hi-Res)

Это не отдельные форматы, а скорее стандарт качества. Hi-Res-аудио — это запись с частотой дискретизации и разрядностью выше, чем у CD (44.1 кГц / 16 бит). Например, 96 кГц / 24 бита или даже 192 кГц / 24 бита.

  • Могут быть lossless: FLAC, ALAC, DSD (очень специфический формат для аудиофилов с супервысокой частотой дискретизации).
  • И lossy: MQA (Master Quality Authenticated) — спорный гибридный формат, который позиционировался как Hi-Res, но использует «сворачивание» и потом «разворачивание» данных. Сейчас его популярность падает.

Главный нюанс Hi-Res: Споры о том, способно ли человеческое ухо реально воспринимать разницу между качественным CD (44.1/16) и Hi-Res, не утихают. Часто ремастеринг (качество самой оцифровки аналоговой записи) важнее, чем высокие цифры.

Важнейший итог: Источник и мастеринг записи важнее формата. Плохо записанная и сведенная песня в формате 192 кГц / 24 бита будет звучать хуже, чем блестящий виниловый рип в MP3 320 кбит/c.

Разберем Hi-Res Audio.

Что это такое на самом деле?

Hi-Res Audio — это не формат, а маркетинговый лейбл, который присваивают аудиофайлам (или потокам), чьи технические параметры превосходят стандарт компакт-диска (CD-DA).

Стандарт CD:

  • Частота дискретизации (Sample Rate): 44 100 Гц (44.1 кГц) — означает, что звуковая волна «измеряется» 44 100 раз в секунду.
  • Разрядность (Bit Depth): 16 бит — определяет динамический диапазон (разницу между самым тихим и самым громким звуком) и точность каждого «измерения».

Hi-Res Audio — это, например:

  • 48 кГц / 24 бита
  • 96 кГц / 24 бита (самый распространенный вариант)
  • 192 кГц / 24 бита
  • 352.8 кГц / 24 бита и выше

Зачем это нужно? Теоретическое обоснование

  1. Расширенный динамический диапазон (зависит от битности):
    • 16 бит = динамический диапазон ~96 дБ. Этого хватает, чтобы охватить и шепот, и взрыв в кино.
    • 24 бита = динамический диапазон ~144 дБ. Теоретически это позволяет точнее записывать и обрабатывать звук в студии, избегая «шума квантования» при микшировании. На практике разница на конечной записи для слушателя чаще всего незаметна, так как фоновая тишина в любой комнате громче, чем гипотетический шум 16-битного аудио.
  2. Расширенная частотная характеристика (зависит от частоты дискретизации):
    • По теореме Найквиста, устройство может воспроизвести частоту не более половины частоты дискретизации.
    • CD (44.1 кГц) = верхняя граница ~22.05 кГц.
    • Человеческое ухо в среднем слышит до 16-20 кГц (с возрастом планка падает). Звуки выше — это ультразвук.
    • Hi-Res 192 кГц теоретически может воспроизводить частоты до 96 кГц. Ключевой вопрос: Нужны ли нам эти неслышимые частоты?

Аргументы «За» и «Против» (Наука vs. Субъективное восприятие)

Аргументы СТОРОННИКОВ Hi-Res:

  1. Нюансы и «воздух»: Они утверждают, что, хотя ультразвук напрямую не слышен, его присутствие влияет на слышимый диапазон через интермодуляционные искажения, создавая более «объемное», «естественное» и «детализированное» звучание.
  2. Более мягкий фильтр: При оцифровке нужен анти-алиасинговый фильтр, который «обрезает» частоты выше предела. При 44.1 кГц он должен быть очень крутым (может вносить фазовые искажения в слышимом диапазоне). При 96 кГц или 192 кГц этот фильтр можно сделать более плавным и вынести далеко за пределы слышимого спектра.
  3. Идеальный архив: Hi-Res-файл — это максимально точная цифровая копия студийного мастера.

Аргументы СКЕПТИКОВ (и данные многих слепых тестов):

  1. Физиологические пределы: Основываясь на известных свойствах человеческого слуха, научно доказать, что люди могут стабильно различать Hi-Res и качественно преобразованный в CD-качество (44.1/16) аудио невозможно. Многочисленные двойные слепые тесты (например, от организации AES) это подтверждают.
  2. Проблема источника: Огромное количество треков, продающихся как «Hi-Res», являются апскейлом (просто переконвертированы) из обычных CD или даже аналоговых источников, которым неоткуда взять дополнительную информацию. Настоящий Hi-Res должен быть изначально записан и сведен в высоком разрешении.
  3. Роль оборудования: Чтобы даже гипотетически что-то услышать, нужна вся цепочка: аудиоинтерфейс/ЦАП, усилитель, акустика/наушники, способные честно воспроизводить ультразвук. У большинства устройств АЧХ резко падает после 20 кГц.
  4. Эффект плацебо и предвзятость подтверждения: Человек, зная, что слушает «самое лучшее», подсознательно настроен услышать разницу. В слепых тестах этот эффект пропадает.

Основные контейнеры/форматы для Hi-Res

  1. FLAC / ALAC (наиболее популярные): В них может быть упакован аудиопоток любого разрешения. Сам по себе FLAC не означает Hi-Res, но он его идеально поддерживает.
  2. DSD (Direct Stream Digital) — отдельная вселенная:
    • Используется в Super Audio CD (SACD).
    • Вместо PCM (как у всех выше) использует импульсно-плотностную модуляцию (PDM).
    • Имеет огромную частоту дискретизации (2.8 МГц — это в 64 раза больше, чем у CD!), но всего 1 бит разрядности.
    • Имеет свой, очень специфический звуковой характер («аналоговость», отсутствие резкого фильтра), но спорную совместимость. Для прослушивания часто конвертируется в высокочастотный PCM.
  3. MQA (Master Quality Authenticated) — «упакованный» Hi-Res (закат эпохи):
    • Задумывался как «умный» формат: файл-контейнер, который на обычном оборудовании звучит как lossless 44.1/16 или 48/24, а на оборудовании с поддержкой MQA «разворачивается» до исходного Hi-Res (например, 192 кГц).
    • Был окружен скандалами (обвинения в «непрозрачности», маркетинговых ходах и скрытом lossy-сжатии).
    • С банкротством компании Tidal, продвигавшей его, популярность MQA резко упала.

Практические советы и итог

  1. Что важнее формата? Качество исходного мастеринга — как была сведена композиция, какой использовался источник (аналоговая лента, цифровой мастер) — в 99% случаев важнее, чем цифры 96 кГц vs 44.1 кГц.
  2. Кому может быть интересно?
    • Аудиофилам-энтузиастам, которые хотят иметь «самую полную» версию и готовы инвестировать в оборудование.
    • Меломанам классической, джазовой, акустической музыки, где может быть важен максимальный динамический диапазон и тонкие нюансы.
    • Любителям новых технологий как таковых.
  3. Нужно ли гнаться за Hi-Res большинству?Нет.
    • Купите хорошо смикшированный и сведенный альбом в обычном lossless (CD-качество, FLAC 44.1/16). Это будет на порядок лучше для вашего восприятия, чем переход с 320 кбит/с MP3 на Hi-Res.
    • Инвестируйте сначала в хорошие наушники или колонки и внешний ЦАП/усилитель. Это даст самую заметную разницу в звуке.

Вывод: Hi-Res Audio — это премиум-сегмент с неочевидной отдачей. Он имеет смысл как эталонный архив и для тех, кто хочет выжать максимум из идеально настроенной дорогой системы. Для повседневного же удовольствия от музыки качественный lossless CD-уровня (FLAC 44.1/16) — это «золотой стандарт», за которым гнаться за бóльшим уже дело вкуса, веры и возможностей кошелька.