Энтропия сложных сообщений, избыточность источника. Цель сжатия данных и типы систем сжатия

Энтропия сложных сообщений, избыточность источника. Цель сжатия данных и типы систем сжатия» МИНСК, 2009 Энтропия сложных сообщений, избыточность источника Рассмотренные выше характеристики источника - количество информации и энтропия - относились к одному источнику, вырабатывающему поток независимых или простых сообщений, или к источнику без памяти. Однако в реальных условиях независимость элементарных сообщений, вырабатываемых источником явление довольно редкое.Чаще бывает как раз обратное - сильная детерминированная или статистическая связь между элементами сообщения одного или нескольких источников.

Например, при передаче текста вероятности появления отдельных букв зависят от того, какие буквы им предшествовали.Для русского текста, например, если передана буква " П", вероятность того, что следующей будет "А", гораздо выше, чем "Н", после буквы "Ъ" никогда не встречается "H" и т.д. Подобная же картина наблюдается при передаче изображений - соседние элементы изображения имеют обычно почти одинаковые яркость и цвет. При передаче и хранении данных часто также имеют дело с несколькими источниками, формирующими статистически связанные друг с другом сообщения.

Сообщения, вырабатываемые такими источниками, называются сложными сообщениями, а сами источники - источниками с памятью.Очевидно, что при определении энтропии и количества информации в сообщениях, элементы которых статистически связаны, нельзя ограничиваться только безусловными вероятностями - необходимо обязательно учитывать также условные вероятности появления отдельных сообщений. Определим энтропию сложного сообщения, вырабатываемого двумя зависимыми источниками (подобным же образом определяется энтропия сложного сообщения, вырабатываемого одним источником с памятью).