Структура MPEG-последовательности

Структура MPEG-последовательности.

Технология MPEG использует поточное сжатие видео, при котором обрабатывается не каждый кадр по отдельности (как это происходит при сжатии видео с помощью алгоритмов Motion-JPEG),а анализируется динамика изменений видеофрагментов и устраняются избыточные данные.

Поскольку в большинстве моментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, алгоритм MPEG начинает сжатие с создания исходного (ключевого) кадра. Играя роль опорных при восстановлении остальных изображений, они размещаются последовательно через каждые 10-15 кадров. Только некоторые фрагменты изображений, которые находятся между ними, претерпевают изменения, и именно эта разница сохраняется при сжатии. Таким образом,MPEG-последовательность содержит три типа изображений: Intro (I) – исходные (И) кадры, содержащие разность основное изображение; Predicted (P) – предсказуемые (П) кадры, содержащие разность текущего изображения с предыдущим И-кадром или учитывающие смещения отдельных фрагментов.

Bi-directional Interpolated (В) – двунаправленные (Д) кадры, содержащие только отсылки к предыдущим или последующим изображениям (И или П) с учетом смещений отдельных фрагментов. И-кадры имеют довольно низкий коэффициент сжатия и составляют основу MPEG-файла.

Именно благодаря им возможен случайный доступ к какому-либо отрывку видео. П-кадры кодируются относительно предыдущих кадров (будь то И- или П-кадры) и обычно используется как сравнительный образец для дальнейшей последовательности П-кадров. В этом случае достигается высокий коэффициент сжатия, но при этом для их привязки к видеопоследовательности необходимо использовать не только предыдущие, но и последующее изображение. Сами Д-кадры никогда не используются для сравнения. Изображения объединяются в группы (GOP – group of pictures), представляют собой минимальный набор повторяемых последовательных изображений.

Типичной является группа вида: ( И0 Д1 Д2 П3 Д4 Д5 П6 Д7 Д7 П9 Д10 Д11) Отдельные изображения состоят из структурных единиц - макроблоков, соответствующих участку изображения размером 16Х16 пикселов. Компьютер анализирует изображения и ищет идентичные или похожие макроблоки, сравнивая базовые и последующие кадры. В результате сохраняется только данные о различиях между кадрами, называемые вектором смещения (vector movement code) .Макроблоки, которые не претерпевают изменений, игнорируются, так что количество данных для реального сжатия и хранения существенно снижаются.

Для повышения устойчивости процесса восстановления изображения к возможным ошибкам передачи данных последовательные макроблоки объединяют в независимые друг от друга разделы (slices) . В свою очередь, каждый макроблок состоит из шести блоков, четыре из которых несут информацию о яркости, а два определяют цветовые компоненты.

Блоки являются базовыми структурным единицами, над которыми осуществляются основные операции кодирования, в том числе выполняется и дискретное преобразование (DCT – Discrete Cosine Transform) .В результате при использовании MPEG-технологии можно достигнуть рабочего коэффициента более чем 200:1 ,хотя это приводит к некоторой потере качества. 7.