Методы сжатия и компрессии аудио-сигналов (виды, отличия, использование).

Основы принципа аналого-цифрового преобразования, метод конверсии и сжатия звука, существующие форматы хранения звука. Программы для конвертации и обработки звука и аудио-файлов. Применение этих программ в лингвистических исследованиях.

Битрейт - это объем информации в единицу времени. Вообще битрейт - это сколько битов мы тратим на кодирование звука длительностью 1 сек.

Аналого-цифровой преобразователь (АЦП, англ. Analog-to-digital converter, ADC) — устройство, преобразующее входной аналоговый сигнал в дискретный код (цифровой сигнал). Обратное преобразование осуществляется при помощи ЦАП (цифро-аналогового преобразователя, DAC). Как правило, АЦП — электронное устройство, преобразующее напряжение в двоичный цифровой код. Тем не менее, некоторые неэлектронные устройства с цифровым выходом, следует также относить к АЦП, например, некоторые типы преобразователей угол-код. Простейшим одноразрядным двоичным АЦП является компаратор.

 

Схема преобразования звукового сигнала из аналогового в цифровой:

Дискретизация -это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.

Квантование -это процесс выравнивания набора музыкальных нот под сетку.

Сжатие (компрессия) аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психоакустической избыточности цифрового звукового сигнала

Основанная идея, на которой основаны все методики сжатияаудио сигнала с потерями, – пренебрежение тонкими деталями звучания оригинала, лежащие вне пределов которые воспринимает человеческое ухо.

Кодек (CoDec) — это сокращение слов «компрессор и декомпрессор». По сути, кодек — это набор файлов, драйверов и библиотек, необходимых для упаковки видео или звукового файла в сжатый формат и воспроизведения сжатого файла.

Форматы:

AAC (англ. Advanced Audio Coding) — формат аудио-файла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC).

AAC (Advanced Audio Coding) изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

Apple AIFF - Этот тип файлов является стандартным для систем Apple Macintosh и систем обработки звука, построенных на его основе. Apple AIFF расшифровывается как Audio Interchange File Format - формат файла обмена звуком, он в чем-то схож с WAV. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата. Хотя в настоящее время компьютеры Apple способны воспроизводить файлы практически любых форматов, в том числе и МР3.

FLAC (англ. Free Lossless Audio Codec — свободный аудиокодек без потерь) — популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, не удаляет никакой информации из аудиопотока и подходит как для ежедневного прослушивания, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями.

FLAC является членом семейства кодеков, разрабатываемых Xiph.Org. К слову, в него же входит известный ogg vorbis – один из лучших lossy-алгоритмов сжатия музыки. В качестве контейнера для аудиоданных используется, разумеется, OGG (файлы с расширением .ogg) и ещё один open-source контейнер – Matroska (файлы с расширением .mka).

Сразу стоит отметить полную открытость как формата, так и алгоритма FLAC. Они не патентованы, поэтому могут совершенно безвозмездно использоваться в любых программах. Именно этим обусловлена широкая поддержка FLAC в проигрывателях – любой серьёзный плеер имеет плагин для FLAC. Кроме этого существуют аппаратные mp3-плееры с поддержкой кодека FLAC.

Программа-кодировщик FLAC скомпилирована для большинства используемых платформ, так что проблем с совместимостью на альтернативных Windows операционных системах возникнуть не должно.

FLAC поддерживает теги собственного формата “FlacTags”. Есть возможность кодирования многоканального звука – серьёзное преимущество по сравнению с Monkey’s Audio. Формат поддерживает любые частоты семплирования в диапазоне от 1 Гц (!) до 65,535 Гц. Разрядность аудио от 4-х (!) до 32-х бит.

Считается, что в сравнении с остальными lossless-кодеками FLAC наиболее эффективно расходует ресурсы системы при раскодировании (воспроизведении) аудио. К сожалению, это достигается за счёт значительного повышения времени кодирования (сжатия).

Сайт FLAC регулярно обновляется, выходят новые версии кодека. Вообще, по активности развития FLAC безусловно лидирует. Вполне возможно, что в будущем это сделает его основным форматом. Что ж, посмотрим…

FLAC является оптимальным выбором для хранения музыки в высоком качестве.

MIDI (англ. Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов) — стандарт на аппаратуру и программное обеспечение, позволяющее воспроизводить (и записывать) музыку путем выполнения/записи специальных команд, а также формат файлов, содержащих такие команды. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

В отличие от других форматов, хранит не оцифрованный звук, а наборы команд (проигрываемые ноты, ссылки на проигрываемые инструменты, значения изменяемых параметров звука), которые могут воспроизводиться по-разному в зависимости от устройства воспроизведения. Удобство формата MIDI как формата представления данных позволяет реализовывать устройства, производящие автоматическую аранжировку по заданным аккордам, а также приложения 3D-визуализации звука. Кроме того, такие файлы, как правило, имеют на несколько порядков меньший размер, чем оцифрованный звук сравнимого качества.

Monkey’s Audio — популярный формат кодирования цифрового звука без потерь. Распространяется бесплатно вместе с открытым исходным кодом и набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам. Файлы Monkey’s Audio используют следующие расширения: .ape для хранения аудио и .apl для хранения метаданных. Несмотря на открытый исходный код, Monkey's Audio не является свободным, так как его лицензия накладывает значительные ограничения на использование.

Аудиофайлы, сжатые кодеком Monkey’s Audio, имеют расширение ‘APE’ – как видите, обезьяны присутствуют не только в логотипе или названии (от английского ape - обезьяна, примат).

Средний битрейт в аудиофайле составляет 600-700 кбит/с; сравните с 128 кбит/с в Mp3. Среднее сжатие составляет 40-50 % в зависимости от жанра музыки: если классические или джазовые произведения сжимаются самым лучшим образом, то композиции в стиле trash-metal или что-то подобное «электронно шумовое» покажет наихудший результат. Для кодеков с потерями при приемлемом качестве сжатие составляет около 80 %.

Существуют четыре степени сжатия. Максимальная компрессия может показаться единственно верным решением, даже несмотря на довольно большое время сжатия. Однако нужно учитывать ещё и расход ресурсов системы, воспроизводящей файл, – для максимально сжатого файла он относительно высок.

Формат .APE обеспечивает поддержку тегов для поиска композиций в музыкальной коллекции. Ещё одним плюсом является проверка целостности файла при раскодировании. Поддерживается восстановление оригинального wav-файла из сжатого .APE.

Monkey’s Audio имеет графический фронтэнд под Windows, иначе говоря удобную оконную программу для управления процессом кодирования. Остальные кодеки требуют использования командной строки или фронтэндов сторонних разработчиков. Самое приятное, что фронтэнд Monkey’s Audio можно использовать и с другими кодеками – Rkau, Wavpack, Shorten и даже lossy-кодеками mp3 и ogg vorbis.

Немного о недостатках. Кодек Monkey’s Audio существует только под Windows. Однако на сайте написано, что «версии под Mac и Linux уже разрабатываются». К слову сказать, сам сайт не обновлялся достаточно давно, что не является хорошим признаком. Также отсутствует какая-либо поддержка среди производителей аппаратных плееров.

Отсутствие кросплатформенности кодека для многих является самым серьёзным минусом Monkey’s Audio. Но шаги по исправлению этого недостатка уже делаются. Стоит упомянуть проект JMAC ( http://sourceforge.net/projects/jmac/ ) по переработке исходных кодов Monkey’s Audio под язык Java. Это позволит использовать кодек на любой ОС без необходимости внесения изменений в исходники и перекомпиляции.

MP3 - (формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации.

Самый популярный формат сжатия на сегодняшний день – это МР3. Формат МР3 (MPEG Layer 3) был разработан, после ряда промежуточных форматов, институтом Фраунхофера в Германии. Вообще то, формат .МР3 основан на обмане человеческого уха. После некоторых исследований выяснилось, что человеческому слуху свойственно адаптироваться к появлению новых звуков, что выражается в повышении порога слышимости. Поэтому одни звуки способны маскировать (то есть, делать субъективно неслышимыми) другие. Вот и в этом формате часть звуков, которые, как считает соответствующая теория, делаются неслышимыми, просто убираются из общего звучания. После чего получившийся «полуфабрикат» кодируется по методу Хоффмана. Обязательно следует учитывать то, что в формате МР3 программы, сжимающие звук из оригинального, не являются стандартизированными, то есть каждый грамотный программист может реализовать свою схему сжатия. А стандартам подчиняются только декодеры, что приводит к тому, что качество воспроизведения формата МР3 далеко не всегда зависит от плеера, проигрывающего этот файл. В связи с разными способностями и пристрастиями реализаторов различных кодеров, одни из них лучше справляются с симфонической музыкой, другие - с роком и металлом, третьи - с рэпом и рэйвом и так далее.

JointStereo, являющийся одной из особенностей МР3, означает, что вместо кодирования стерео как двух независимых каналов производится кодирование т.н. центрального канала и разницы, отличающей его от исходных стереоканалов. Довольно много составляющих звука в стереоканалах одинаковы, и их кодирование в общем канале позволяет высвободить дополнительную полосу для более подробного кодирования разницы, что приводит к некоторому улучшению качества.

Обязательно следует упомянуть и о Variable Bit Rate, или VBR. Это означает, что кодер изменяет степень сжатия «на лету», в зависимости от характера звука. Такой подход приводит к уменьшению итогового размера файла или, при увеличении требований к качеству, при том же размере файла позволяет добиться лучшего звучания.

MP3 Pro - Появившийся в 2001 году кодек MP3 Pro был создан компанией Coding Technologies совместно с Thomson Multimedia. В его основе лежит МР3, и в результате он получился полностью совместимым с MP3 назад и лишь частично вперед. В нем используется технология SBR (Spectral Band Replication), за счет чего кодек обеспечивает хорошее качество на низких битрейтах. Однако качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других кодеков. В итоге MP3 Pro применяется больше для трансляций в интернете и демонстраций фрагментов новых музыкальных композиций.

Аудио стандарт MPEG-4 не требует единственного или малого набора высокоэффективных схем компрессии, а скорее сложный набор для выполнения широкого круга операций от кодирования низкокачественной речи до высококачественного аудио и синтезирования музыки.

Семейство алгоритмов аудио кодирования MPEG-4 охватывает диапазон от кодирования низкокачественной речи (до 2 кБит/с) до высококачественного аудио (от 64 кБит/с на канал и выше).

RAW - Да, это не только формат изображения, в котором пишут фотографии некоторые цифровые камеры. На самом деле, RAW является т.н. «чистой оцифровкой», в которой не содержится заголовка и находится лишь последовательность отсчетов звуковой волны. Обычно оцифровка хранится в 16-разрядном формате.

Shorten – один из первых появившихся lossless-кодеков. Долгое время проект "спал сладким сном". Однако, в 2007 году, он снова начал развиваться.

TTA (True Audio) - Напоследок о самом интересном. TTA разрабатывается командой наших соотечественников. И, надо сказать, результат их работы впечатляет. Обо всём по порядку.

Кодек является ещё довольно молодым, но несмотря на это содержит все необходимые возможности. Не будем в очередной раз перечислять их, отметим лишь, что формату не хватает лишь поддержки трансляции аудио через сеть.

Формат открыт, равно как и исходные коды программы-кодировщика. Существуют скомпилированные версии под Mac и Linux. Проблем с совместимостью при воспроизведении также возникнуть не должно, ибо уже существуют плагины для всех популярных проигрывателей, а также DirectShow фильтры для Windows Media Player. Есть плагин для Adobe Audition, что немаловажно для музыкантов. За последние 4 года даже появилась аппаратная поддержка в плеерах!

WAV - Он является основным аудио форматом для многих и многих систем воспроизведения цифрового звука и используется как стандартный формат звуковых файлов в персональных компьютерах. К тому же, он имеет солидный набор спецификаций, изрядно пополнившийся за последнее время. Его полное название - Microsoft RIFF/WAVE - Resource Interchange File Format/Wave - формат файлов передачи ресурсов/волновая форма, и создан он был инженерами Microsoft и Intel. В свою очередь, WAV расшифровывается как Waveform Audio File Format.

Windows Media Audio (WMA) — лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации.

Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft.

 

Программы:

DVDVideoSoft Free Studio 6.1.1.426

Пакет бесплатных программ обработки мультимедиа. Конвертирование видео, аудио. Поддержка многих медиаформатов, включая форматы мобильных устройств. Возможность записи CD/DVD/BlueRay-дисков. Работы с медиафайлами сервиса YouTube, других сервисов....

Format Factory 3.0.1.1

Универсальный конвертер видео, аудио, графических файлов. Поддержка большого количества мультимедиа форматов, возможность создания DVDRip....

 

Русский, Украинский

Free MP3 Cutter and Editor 2.6.0.1654

Очень простая, маленькая, удобная программа редактирования звуковых файлов формата mp3, wav. Free MP3 Cutter and Editor удобен как простой редактор звуковых MP3, WAV-файлов. Может использоваться любым, даже неопытным пользователем....

MediaCoder 0.8.20.5380 Full

Программа обработки медиафайлов: сжатие, конвертер видео-, аудио-, извлечение аудио из видео, создание CD/DVDRip. Непростой, но довольно мощный медиаконвертер. Предоставляет полный спектр настроек при обработке, сжатии, конвертации форматов....

MP3 Quality Modifier 2.51

Основная задача программы - пакетное уменьшение размера MP3 файлов путем изменения его битрейта простым и интуитивно понятным способом, так чтобы размер файла значительно уменьшился, а качество звука осталось прежним. Изменять характеристики MP3 файлов можно при помощи предлагаемых настроек или выставить свои собственные расширенные настройки. Доступны настройки частот и звуковых каналов....

Power Sound Editor Free 7.8.1

Бесплатная версия звукового редактора и средства записи. Богатые возможности обработки звука. Простое понятное управление операциями и различными эффектами над аудио данными....

Nero— многофункциональный мультимедийный пакет для работы с CD и DVD дисками, звуком и видео, включающий в себя также утилиту резервного копирования, вёрстки обложек дисков, поддержку виртуальных дисков. Начиная с версии 6.6.0.13, Nero может также записывать диски форматов HD DVD и Blu-ray. Поддерживает технологии нанесения изображений LabelFlash, DiscT@2, LightScribe. Существуют версии для операционных систем Microsoft Windows и Linux (только программа для записи дисков, без дополнительных утилит).

[править]Состав пакета

Nero Burning ROM — мощная программа для высококачественного копирования и прожига дисков CD, DVD и Blu-ray. Кроме этого в Nero Burning ROM содержатся множество полезных инструментов, которые значительно превосходят функции простого копирования. Это единственная программа, которая необходима пользователю для сохранения данных и предоставления к ним доступа.

 

Среди основных возможностей Nero Burning ROM можно выделить следующие: высококачественный прожиг и копирование дисков; компоновка дисков CD, DVD и Blu-ray простым перетягиванием файлов; разделение больших файлов для их записи на нескольких физических дисках; надежность чтения данных, несмотря на царапины, возраст и изношенность дисков; улучшенный уровень безопасности с использованием паролей и шифрования...

Nero StartSmart — программа-меню для запуска нижеперечисленных приложений.

Nero Express — Nero Burning Rom с упрощённым пользовательским интерфейсом.

Nero BackItUp — утилита для резервного копирования данных.

Nero Cover Designer — редактор обложек для CD и DVD и их прожиг на диски LightScribe / Label Flash.

Nero Wave Editor — редактор звуковых файлов.

Nero SoundTrax — программа для создания собственных аудиодисков.

Nero ImageDrive — приложение для работы с виртуальными компакт-дисками. Отсутствует в версии 9 и выше. Разработка приложения прекращена.

Nero Vision — программа для записи видеодисков CD/DVD и видеозахвата. Начиная с 5-й версии (Nero 8) может записывать HDTV на HD-DVD/Blu-Ray.

[править]Варианты поставки

 

Nero поставляется во множестве разных вариантов. Самые частые поставки осуществляются в виде OEM пакетов, которые, обычно, прилагают к большинству CD и DVD рекордеров. Так же Nero продаётся в полном варианте, называемом Premium для европейских продавцов и Ultra Edition для американских. По непонятным причинам для Северной Америки в полный пакет Nero 7 (Ultra Edition) не были включены две технологии: LabelFlash и DiscT@2. В Европейской же версии Nero 7 Premium обе они присутствуют в полном объёме. В остальных функциях они полностью идентичны.

[править]Варианты поставки 10-й версии пакета

Начиная с 10-й версии пакета, некоторые компоненты пакета можно покупать отдельно. Варианты сборок:

Nero Multimedia Suite 10 — самый полный пакет, содержащий все компоненты Nero;

Nero Vision Xtra — содержит только программы: Nero Vision Xtra, Nero MediaHub и Nero Control Center;

Nero Burning ROM — содержит только программы: Nero BackItUp и Nero Express.

[править]Дополнительные утилиты

Nero CD-DVD Speed — тестирование CD или DVD привода.

Nero DriveSpeed — утилита для регулирования скорости вращения CD или DVD привода Отсутствует в версии 10 и выше. Разработка приложения прекращена.

Nero InfoTool — приложение для выдачи подробной информации о возможностях CD или DVD привода, также выдает информацию о системе.

[править]Старые версии программы

На официальном сайте можно приобрести диски с обновлением для предыдущих версий Nero по цене в $10.

[править]Название программы

Программа получила своё название в честь императора Нерона (англ. Nero), предавшего Рим огню (по одной из версий). Благодаря игре слов, название программы Nero Burning ROM(E) может переводиться как «Нерон, сжигающий Рим» или как «Nero, прожигающий (CD-)ROM» . В отличие от Нерона, Nero ничего не уничтожает, а «прожиг», или «выжигание» означает процесс записи оптического носителя.

Значок программы содержит исторический казус: на нём изображён горящий Колизей, который Нерон не мог сжечь — он был построен через несколько лет после смерти Нерона при Веспасиане.