Современные форматы видео

ВВЕДЕНИЕ 5 ГЛАВА 1. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ВИДЕО 1. КАЧЕСТВО ИЗОБРАЖЕНИЯ 2. ЭКСПЛУАТАЦИОННЫЕ ВОЗМОЖНОСТИ 3. ПЛОТНОСТЬ ЗАПИСИ, СТОИМОСТЬ 1 МИНУТЫ ЗАПИСИ И МАССОГАБАРИТНЫЕ ПАРАМЕТРЫ НОСИТЕЛЯ (ДЛЯ ВИДЕОЛЕНТ) 4. ЗАТРАТЫ НА ПРИОБРЕТЕНИЕ И ЭКСПЛУАТАЦИЮ ТЕХНИКИ 5. КОЛИЧЕСТВО КАДРОВ В СЕКУНДУ 6. ЧЕРЕССТРОЧНАЯ РАЗВЁРТКА 7. РАЗРЕШЕНИЕ 8. СООТНОШЕНИЕ СТОРОН ЭКРАНА 9. КОЛИЧЕСТВО ЦВЕТОВ И ЦВЕТОВОЕ РАЗРЕШЕНИЕ 10. ШИРИНА ВИДЕОПОТОКА (ДЛЯ ЦИФРОВОГО ВИДЕО) 10 ГЛАВА 2. ВИДЕОСТАНДАРТЫ 1. ЦИФРОВЫЕ 1. ATSC 12 2.1.2. DVB 3. ISDB 13 2.2. АНАЛОГОВЫЕ 15 2.2.1. MAC 15 2.2.2. PAL 3. NTSC 4. SECAM 5. MUSE 17 ГЛАВА 3. ФОРМАТЫ ЗАПИСИ 1. ФОРМАТЫ АНАЛОГОВОЙ ЗАПИСИ 19 3.1.1. VHS 2. Betacam SP 3. Video-8 21 3.1.4. MII 21 3.1.5. U-matic 6. Betamax 22 3.1.7. 2" Quadruplex 23 3.1.8. 1" Type C 23 3.1.9. S-VHS 24 3.1.10. VHS-C 24 3.1.11. Hi2. ФОРМАТЫ ЦИФРОВОЙ ЗАПИСИ 1. Video CD 25 3.2.2. DVD 3. DivX 26 3.2.4. DV (miniDV) 5. SVCD, ASF, RM 6. Digital Betacam 7. Betacam SX 29 3.2.8. HD9. ProHD 31 3.2.10. D-VHS 31 3.2.11. MicroM12. Digital8 32 3.2.13. D1, D2, D3, D5, D6 32 3.2.14. S(X)VCD 3. СРАВНЕНИЕ ФОРМАТОВ ЗАПИСИ 35 ГЛАВА 4. МЕТОДЫ СЖАТИЯ 1. ТЕХНОЛОГИИ СЖАТИЯ ЦИФРОВОГО ВИДЕО 2. ТЕХНОЛОГИИ И АЛГОРИТМЫ СЖАТИЯ ВИДЕО 3. MPEG (MPEG-1, MPEG-2, MPEG-3, MPEG-4) 4. MJPEG 5. WAVELET 6. JPEG 7. ICKTIME IINDEO 9. CCIR 601 52 4.10. H.261 53 4.11. H.263 53 4.12. OGG-THEORA 53 4.13. A14. EDITABLE MPEG VDOWAVE 16. CINEPAK 17. IDEO (MSVC) 55 ГЛАВА 5. СОВРЕМЕННЫЕ МОБИЛЬНЫЕ ВИДЕОФОРМАТЫ 56 5.1. 3GPP 2. IDEO 3. IDEO 4. IDEO 57 ГЛАВА 6. ПРОГРАММЫ, НЕОБХОДИМЫЕ ДЛЯ ВОСПРОИЗВЕДЕНИЯ ВИДЕО 58 ГЛАВА 7. СОВРЕМЕННЫЕ ВИДЕОКАМЕРЫ 61 ГЛАВА 8. НОСИТЕЛИ ЦИФРОВОГО ВИДЕО 63 ГЛАВА 9. СИСТЕМЫ СПУТНИКОВОГО ТЕЛЕВИДЕНИЯ 66 ГЛАВА 10. ТЕЛЕВИДЕНИЕ ВЫСОКОЙ ЧЕТКОСТИ (HDTV: HIGH-DEFIISION) 71 ГЛАВА 11. СПРАВОЧНАЯ ИНФОРМАЦИЯ И ТЕРМИНЫ 74 СПИСОК ЛИТЕРАТУРЫ 77 Введение Ви́део (от лат. Video - дословно «вижу») - под этим термином понимают широкий спектр технологий записи, обработки, передачи, хранения и воспроизведения визуального и аудиовизуального материала. Когда в быту говорят «видео» - то обычно имеют в виду видеоматериал, телесигнал или кинофильм, записанный на физическом носителе (видеокассете, видеодиске и т. п.). Обычные телевизионные видеоданные представляют собой поток аналоговых сигналов.

Компьютерная обработка видеоинформации состоит в преобразовании их в цифровой формат с последующим хранением этих данных на жестком или компакт-диске или другом устройстве хранения информации. Оцифровка видеосигнала, как и оцифровка звука, включает две стадии: дискретизация данных аналогового видеопотока, т. е. снятие отсчетов с определенной частотой, и преобразование каждого такого отсчета в цифровой эквивалент или квантование.

При хранении оцифрованных данных в несжатом формате изображение размером 400x300 пикселов с глубиной цвета 24 бита на пиксел, обновляемое с частотой 25 Гц, потребует скорости передачи информации более 5,5 Мб/с. А хранение данных для показа 5-минутного ролика в указанном формате потребует информационное пространство, превышающее 1,6 Гб. Естественно, что при работе с такими данными невозможно обойтись без сжатия, однако и в этом случае потребуется время, определенные вычислительные мощности на распаковку данных.

Достичь оптимального сжатия можно путем совершенствования аппаратных или программных средств, а может быть, совместно тех и других.

В качестве аппаратных средств используются специальные видеопроцессоры, которые поддерживают высокоскоростную компрессию и декомпрессию данных, не загружая центральный процессор компьютера.

Второй подход состоит в использовании специализированных методов программного сжатия и распаковки предварительно сжатых видеоданных.

Аналоговый видеосигнал включает в себя несколько различных компонентов, объединенных в единое целое.

Такой составной видеосигнал малопригоден для оцифровки.

Предварительно его следует разделить на так называемые базовые компоненты. Обычно компоненты представляют собой три различных сигнала, соответствующие определенной модели представления цветового пространства.

Если в статической графике используется RGB-цветовое представление, то в цифровом видео чаще используется модель YUV. Видеопоследовательности отображаются в виде серии кадров или фреймов, каждый из которых, no-существу, является графическим изображением и включает в себя определенное число пикселов. Такой видеофрейм может быть сжат с помощью одного из алгоритмов сжатия изображений, с потерями или без потерь.

Глава 1.

ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ВИДЕО

Качество видео измеряется с помощью формальных метрик, таких, как, нап... Значение метрики тем больше, чем больше разница между сравниваемыми из... Смысл графиков PSNR/Frame size На графике изображена зависимость показ... Например, в контрастных областях кадра границы блоков почти незаметны,... Затем эксперты оценивают качество обработки, варьируя свои оценки от «...

ЭКСПЛУАТАЦИОННЫЕ ВОЗМОЖНОСТИ

1.3. ЭКСПЛУАТАЦИОННЫЕ ВОЗМОЖНОСТИ. В это понятие входит все, что касается работы устройства в системе, ра... . 1.4.

ЗАТРАТЫ НА ПРИОБРЕТЕНИЕ И ЭКСПЛУАТАЦИЮ ТЕХНИКИ

ЗАТРАТЫ НА ПРИОБРЕТЕНИЕ И ЭКСПЛУАТАЦИЮ ТЕХНИКИ Данный параметр учитывает стоимость оборудования, технического обслуживания и запасных частей. Высокая оценка соответствует меньшим суммарным затратам на владение и обслуживания техники того или иного формата. В каждом новом формате видеозаписи разработчики стремятся улучшить эти показатели, но улучшение одного показателя довольно часто происходит за счет ухудшения других.

Однако следует признать, что суммарный уровень показателей всех категорий от формата к формату растет. 1.5. КОЛИЧЕСТВО КАДРОВ В СЕКУНДУ Количество (частота) кадров в секунду - это число неподвижных изображений, сменяющих друг друга при показе 1 секунды видеоматериала и создающих эффект движения объектов на экране. Чем больше частота кадров в секунду, тем более плавным и естественным будет казаться движение. Минимальный показатель, при котором движение будет восприниматься однородным - примерно 10 кадров в секунду (это значение индивидуально для каждого человека). В традиционном плёночном кинематографе используется частота 24 кадра в секунду.

Системы телевидения PAL и SÉCAM используют 25 кадров в секунду (англ. 25 fps или 25 Герц), а система NTSC использует 29,97 кадров в секунду. Компьютерные оцифрованные видеоматериалы хорошего качества, как правило, используют частоту 30 кадров в секунду.

Верхняя пороговая частота мелькания, воспринимаемая человеческим мозгом, в среднем составляет 39 - 42 Герца и индивидуальна для каждого человека. Некоторые современные профессиональные камеры могут снимать с частотой до 120 кадров в секунду. А специальные камеры для сверхбыстрой съёмки снимают с частотой до 1000 кадров в секунду, что необходимо, например, для детального изучения траектории полёта пули или структуры взрыва. 1.6. Чересстрочная развёртка Развёртка видеоматериала может быть прогрессивной или чересстрочной.

При прогрессивной развёртке все горизонтальные линии (строки) изображения отображаются одновременно. А вот при чересстрочной развёртке показываются попеременно чётные и нечётные строки (называемые также полями кадра). Чересстрочную развёртку часто называют на английский манер интерлейс (англ. interlace) или интерлейсинг. Чересстрочная развёртка была изобретена для показа изображения на кинескопах с электронно-лучевой трубкой и используется сейчас для передачи видео по «узким» каналам, не позволяющим передавать изображение во всём качестве.

Системы PAL, SECAM и NTSC - это всё системы с чересстрочной развёрткой. Новые цифровые стандарты телевидения, например, HDTV предусматривают прогрессивную развёртку. Хотя появились технологии, позволяющие имитировать прогрессивную развёртку при показе материала с интерлейсом. Чересстрочную развёртку обычно обозначают символом «i» после указания вертикального разрешения, например 720×576i×50 для видео в формате PAL. 1.7. Разрешение По аналогии с разрешением компьютерных мониторов, любой видеосигнал также имеет разрешение (англ. resolution), горизонтальное и вертикальное, измеряемое в пикселях.

Обычное аналоговое телевизионное разрешение составляет 720×576 пикселей для стандартов PAL и SECAM, при частоте кадров 50 Герц (одно поле, 2×25); и 640×480 пикселей для NTSC, при частоте 60 Герц (одно поле, 2×29,97). В выражении 640×480 первым числом обозначается количество точек в горизонтальной линии (горизонтальное разрешение), а вторым числом количество самих линий (вертикальное разрешение). Новый стандарт высокочеткого (англ. high-definition) цифрового телевидения HDTV предполагает разрешения до 1920×1080 при частоте мелькания 60 Герц с прогрессивной развёрткой.

То есть 1920 пикселей на линию, 1080 линий. Разрешение в случае трёхмерного видео измеряется в вокселях - элементах изображения, представляющих точки (кубики) в трёхмерном пространстве.

Например, для простого трёхмерного видео сейчас используется в основном разрешение 512×512×512. 1.8. Соотношение сторон экрана Соотношение ширины и высоты кадра (англ. aspect ratio) - важнейший параметр в любом видеоматериале. Ещё с 1910 года кинофильмы имели соотношение сторон экрана 4:3 (4 единицы в ширину к 3 единицам в высоту; иногда ещё записывается как 1,33:1 или просто 1,33). Считалось, что зрителю удобнее смотреть фильм на экране такой формы.

Когда появилось телевидение, то оно переняло это соотношение и почти все АНАЛОГОВЫЕ телесистемы (и, следовательно, телевизоры) имели соотношение сторон экрана 4:3. Компьютерные мониторы также унаследовали телевизионный стандарт сторон. Хотя ещё в 1950-х годах это представление о 4:3 в корне изменилось. Дело в том, что поле зрения человека имеет соотношение отнюдь не 4:3. Ведь у человека 2 глаза, расположенных на одной горизонтальной линии - следовательно, поле зрения человека приближается к соотношению 2:1. Чтобы приблизить форму кадра к естественному полю зрения человека (и, следовательно, усилить восприятие фильма), был введён стандарт 16:9 (1,78), почти соответствующий так называемому «Золотому сечению». Цифровое телевидение в основном тоже ориентируется на соотношение 16:9. К концу XX века, после ряда дополнительных исследований в этой области, стали появляться даже и более радикальные соотношения сторон кадра: 1,85, 2,20 и вплоть до 2,35 (почти 21:9). Всё это, безусловно, призвано глубже погрузить зрителя в атмосферу просматриваемого видеоматериала. 1.9. Количество цветов и цветовое разрешение Количество цветов и цветовое разрешение видеосигнала описывается цветовыми моделями.

Для стандарта PAL применяется цветовая модель YUV, для SECAM модель YDbDr, для NTSC модель YIQ, в компьютерной технике применяется в основном RGB (и αRGB), реже HSV, а в печатной технике CMYK. Количество цветов, которое может отобразить монитор или проектор зависит от качества монитора или проектора.

Человеческий глаз может воспринять, по разным подсчётам, от 5 до 10 миллионов оттенков цветов.

Количество цветов в видеоматериале определяется числом бит, отведённым для кодирования цвета каждого пикселя (англ. bits per pixel, bpp). 1 бит позволяет закодировать 2 цвета (обычно чёрный и белый), 2 бита - 4 цвета, 3 бита - 8 цветов, …, 8 бит -256 цветов (28 = 256), 16 бит - 65 536 цветов (216), 24 бита - 16 777 216 цветов (224). В компьютерной технике имеется стандарт и 32 бита на пиксель (αRGB), но этот дополнительный α-байт (8 бит) используется для кодирования коэффициента прозрачности пикселя (α), а не для передачи цвета (RGB). При обработке пикселя видеоадаптером, RGB-значение будет изменено в зависимости от значения α-байта и цвета подлежащего пикселя (который станет «виден» через «прозрачный» пиксель), а затем α-байт будет отброшен, и на монитор пойдёт только цветовой сигнал RGB. 1.10. Ширина видеопотока (для цифрового видео) Ширина (иначе говорят скорость) видеопотока или битре́йт (англ. bit rate) - это количество обрабатываемых бит видеоинформации за секунду времени (обозначается «бит/с» - бит в секунду, или чаще «Мбит/с» - мегабит в секунду; в английском обозначении «bit/s» и «Mbit/s» соответственно). Чем выше ширина видеопотока, тем в общем лучше качество видео.

Например, для формата VideoCD ширина видеопотока составляет всего примерно 1 Мбит/с, а для DVD составляет около 5 Мбит/с. Конечно, субъективно разницу в качестве нельзя оценить как пятикратную, но объективно это так. Формат же цифрового телевидения HDTV использует ширину видеопотока около 10 Мбит/с. При помощи скорости видеопотока также очень удобно оценивать качество видео при его передаче через Интернет.

Различают два вида управления шириной потока в видеокодеке - постоянный битрейт (англ. constant bit rate, CBR) и переменный битрейт (англ. variable bit rate, VBR). Концепция VBR, ныне очень популярная, призвана максимально сохранить качество видео, уменьшая при этом суммарный объём передаваемого видеопотока.

При этом на быстрых сценах движения, ширина видеопотока возрастает, а на медленных сценах, где картинка меняется медленно, ширина потока падает.

Это очень удобно для буферизованных видеотрансляций и передачи сохранённого видеоматериала по компьютерным сетям. Но для безбуферных систем реального времени и для прямого эфира (например, для телеконференций) это не подходит - в этих случаях необходимо использовать постоянную скорость видеопотока.

Глава 2.

ВИДЕОСТАНДАРТЫ

ВИДЕОСТАНДАРТЫ Когда говорят о формате файла, подразумевается то, каким образом информация, которая содержится в файле, кодируется в цифровом виде. Для хранения видеоинформации в ПК разработано довольно много форматов, отличающихся способом представления данных, степенью их сжатия и т. п. Чтение и запись аудио- и видеоинформации на компьютере осуществляется с помощью специальных вспомогательных программ - «кодеков» (сокращение от слов «кодирование/декодирование»). Такие программы обычно входят в состав операционной системы либо поставляются с проигрывающими устройствами. 2.1. Цифровые 2.1.1. ATSC ATSC (Advanced Television Systems Committee) - организация, разрабатывающая и утверждающая стандарты для передовых телевизионных систем, в том числе и HDTV. Наиболее широко стандарты ATSC распространены в США и Канаде.

Международная некоммерческая организация Advanced Television Systems Committee (ATSC) была образована в 1982г. с целью разработки новых стандартов телевидения.

Именно эта группа специалистов разработала стандарт цифрового вещания ATSC, который теперь является основным на территории США, Канады, Мексики, Аргентины, Тайваня и Южной Кореи. ATSC-спецификации включают в себя описание HDTV (High Definition TeleVision), SDTV (Standard Definition TeleVision), EDTV (Enhanced Definition TeleVision), многоканальный звук, интерактивное телевидение - в общем все те форматы, в которых возможно цифровое вещание.

Набор стандартов ATSC был создан с целью замены NTSC-системы, используемой, главным образом, в Северной Америке. Максимальное качество изображения, которое может предложить ATSC, соответствует разрешению 1920x1080 при формате экрана 16:9 и сжатии с помощью MPEG2. Мало того, качество трансляции приближается к уровню кинотеатрального благодаря тому, что многоканальный 5.1 звук кодируется с помощью формата Dolby Digital AC-3. В целом же спецификация ATSC несёт в себе описание восемнадцати форматов вещания ТВ, причём шесть из этих режимов относятся к HDTV. 2.1.2. DVB DVB (англ. Digital Video Broadcasting) — семейство европейских стандартов цифрового телевидения.

Принцип действия Данный стандарт определяет физический уровень и канальный уровень в системе телевещания. Устройства взаимодействуют с физическим уровнем через синхронный параллельный интерфейс (SPI), синхронный последовательный интерфейс (SSI), или асинхронный последовательный интерфейс (ASI). Все данные передаются в транспортном потоке MPEG-2 с некоторыми дополнительными ограничениями (DVB-MPEG). Способы модуляции в различных версиях DVB: в DVB-S (SHF) используется QPSK, 8PSK или 16-QAM, в DVB- S2 используется QPSK, 8PSK, 16APSK или 32APSK, в DVB-C (VHF/UHF) используется QAM: 16-QAM, 32-QAM, 64-QAM, 128-QAM или 256-QAM, в DVB-T (VHF/UHF) используется 16-QAM или 64-QAM (или QPSK) совместно с COFDM и иерахической модуляцией.

Способы доставки цифрового сигнала Существует 4 среды доставки сигнала: • наземное вещание (DVB- T), • вещание для портативных устройств (DVB-H), • спутниковое вещание (DVB-S), • кабельное вещание (DVB-C). Из-за разницы в частотных каналах и способах модуляции декодеры для различных сред оказываются несовместимыми.

Распространённость в России Различные спутниковые DVB-передачи принимаются в России давно. DVB-C встречается лишь в крупнейших городах. Внедрение остальных форм DVB-вещания обсуждается. 2.1.3. ISDB ISDB (Integrated Services Digital Broadcasting) - стандарт цифрового телевидения, разработанный в Японии.

Он интегрирует в себя различные виды цифрового контента. Это может быть HDTV, SDTV, звук, графика, текст и т.д. Японская организация по стандартизации и распределению радиочастот Association of Radio Industries and Businesses (ARIB) разработала стандарты для передачи цифрового телевидения и радио под единым названием Integrated Services Digital Broadcasting (ISDB). Основных ISDB-стандартов в настоящее время четыре: • наземное (ISDB-T); • спутниковое (ISDB-S); • кабельное (ISDB-C); • мобильное (нет аббревиатуры). Также как и в спецификациях ATSC и DVB, для сжатия видеопотока при ISDB-вещании используется система кодирования MPEG-2. Помимо прочего в стандарте ISDB определена поддержка функции защиты цифрового контента - RMP (Rights management & protection). Дело в том, что любой цифровой контент можно легко записать с использованием DVD или HD-рекордера, а далее - использовать при тиражировании пиратских дисков.

Голливуд настоял на внесение поправок в цифровой формат вещания ISDB, что и стало причиной появления системы RMP. Любой цифровой контент при использовании данной системы имеет три возможных маркировки – "copy once", "copy free" и "copy never". Пояснить работу системы просто.

Если программа идёт в режиме "copy once", то она может быть единожды сохранена на жестком диске рекордера, однако её не возможно будет записать на какой-либо ещё носитель и т.д. В ISDB используется транспортный поток MPEG-2 для передачи сжатых видео и звука, а также дополнительных данных.

Для интерактивных приложений применяется BML (Broadcast Mark-up Language - язык разметки вещания). Определены несколько стандартных разрешений телевизионной трансляции. В ISDB-T поддерживаются электронные программы передач EPG (Electronic Program Guides) вместе с передачей данных при обратном канале обычного доступа в Интернет (включая доступ через мобильный телефон, проводную локальную сеть 10/100Base-T, модем телефонной линии фиксированной связи, беспроводную локальную сеть IEEE 802.11). Еще одна особенность ISDB - обязательное шифрование информации, даже при передаче бесплатных общенациональных телепрограмм.

Для этого нужны карточки доступа абонента B-CAS одноименной японской компании, предоставляемые с каждым проданным аппаратом. Более того, тщательно проработаны вопросы защиты контента и управления правом доступа RMP (Rights management and protection). Не меньшее внимание уделяется уверенному приему на внутренние антенны, защите от внешних импульсных помех и передаче на движущиеся приемники.

Например, ISDB-T позволяет принимать сигнал HDTV в автомобиле на скорости 100 км/час, тогда как DVB-T допускает «автомобильный» прием только программ SDTV, а формат ATSC вообще не предназначен для приема на подвижную антенну. Обычно ISDB принято считать чисто японским стандартом, действующим в этой стране с конца 2003 года. Но нужно отметить интересную особенность - во всех спецификациях ISDB в качестве языковых параметров официально утвержден китайский язык, в дополнение ко всем мыслимым алфавитам японского языка.

Давно идут разговоры о принятии ISDB-T в Бразилии.