рефераты конспекты курсовые дипломные лекции шпоры

Раздел Философия
/
Тамбов 2010

Реферат Курсовая Конспект

Выберите учебное заведение

Тамбов 2010

Тамбов 2010 - раздел Философия, Дисциплина Теория информации Тема №4: Оптимальное эффективное кодирование источников Тема №4: Оптимальное (Эффективное) Кодирование Источников....

Тема №4: Оптимальное (эффективное) кодирование источников.

4.1. Понятие кодирования. Кодовое дерево.

В процессе кодирования каждая буква исходного алфавита представляется различными последовательностями, состоящими из кодовых букв (цифр). Если исходный алфавит содержит m букв, то для построения равномерного кода с использованием D кодовых букв необходимо обеспечить выполнение следующего условия:

где n- количество элементов кодовой последовательности.

Для построения равномерного кода достаточно пронумеровать буквы исходного алфавита и записать их коды как n-разрядное число в D-ичной системе счисления.

Заметим: понятие равномерного кода означает, что каждая буква исходного алфавита m кодируется кодовой последовательностью одинаковой длины n.

Пример: код длины n=S в двоичной системе счисления D=2 позволяет представить 32 буквы русского алфавита пятиразрядными двоичными числами.

Очевидно, что при различной вероятности появления букв исходного алфавита равномерный код является избыточным, так как энтропия, характеризующая информационную емкость сообщения максимальна при равновероятных буквах исходного алфавита:

Т.е. информационные возможности кода используются не полностью.

Пример: Для двоичного пятиразрядного кода букв русского алфавита информационная емкость составляет 5 бит, =4,35 бит.

Устранение избыточности достигается применением неравномерных кодов, в которых буквы, имеющие наибольшую вероятность, кодируются более короткими кодовыми последовательностями, а более длинные комбинации присваиваются редким, имеющим меньшую вероятность буквам.

Если i-ая буква, вероятность которой p_i, получает кодовую комбинацию длины n_i, то средняя длинна кода (кодового слова) равна:

Введем понятие кодового дерева, которым часто пользуются при рассмотрении кодов.

Известно, что любую букву (событие), содержащиеся в алфавите (сообщении) источника, можно разложить на последовательности двоичных решений с исходами «да»=1 и «нет»=0 без потери информации.

Таким образом, каждой букве исходного алфавита может быть поставлена в соответствие (приписана) некоторая последовательность двоичных символов – «0» или «1», а такую последовательность называют кодовым словом. При этом потери информации не происходит, так как каждое событие может быть восстановлено по соответствующему кодовому слову.

C₁,C₂, C₃,C₄ – дерево кодов имеет разную длину кода (кодового слова).

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

Дисциплина Теория информации Тема №4: Оптимальное эффективное кодирование источников

Тамбовский государственный технический университет... Кафедра Информационные системы... Дисциплина Теория информации...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Тамбов 2010

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Теорема кодирования источников. Неравенство Крафта. Префиксный код.
Теорема Шеннона о кодировании источников устанавливает связь между средней длинной кодового слова и энтропией источника: Для любого дискретного источника без памяти X с конечным алфавитом

Методы оптимального кодирования. Сжатие данных.
Процедуру оптимального кодирования часто называют сжатием данных. Таким образом задача сжатия данных есть минимизация технических затрат на хранение или передачу информации путем оптимальн

Метод кодирования Шеннона - Фано.
Буквы исходного алфавита записываются в порядке убывающей вероятности. Упорядоченное таким образом множество букв разбивается так, чтобы суммарные вероятности двух подмножеств были примерно равными

Метод кодирования Хаффмана.
Этот метод кодирования всегда дает оптимальный код, т.е. получаемая является минимальной. Буквы алфавит

Арифметическое кодирование.
Алгоритм Хаффмана , рассмотренный ранее, не может передавать на каждый символ сообщения, если не использовать блоковое кодирование, менее одного бита информации. Хотя энтропия источника с алфавитом

Алгоритм универсального кодирования методом Лемпела-Зива.
Этот метод относится к классу универсальных потому, что он не требует априорных знаний о статистике символов. Такой метод носит менее математически обоснованный, но более практический характер.

Особенности программ-архиваторов.
Если коды алгоритмов типа LZ передать для кодирования адаптивному алгоритму Хаффмана или арифметическому, то полученный двухшаговый алгоритм даст результат сжатия, подобный случайным программам: GZ

Сжатие с потерями.
Сжатие с потерями используется в основном для трех видов данных: 1.Полноцветная графика. 2. Звук. 3. Видеоинформация. Сжатие с потерями обычно происходит в два э