Кодирование текстовой информации

При вводе в компьютер текстовой информации происходит ее двоичное кодирование, каждый символ преобразуется в его двоичный код. Количество символов, включаемых в набор для кодирования, обычно равно 256. Такого количества символов вполне достаточно для представления текста, включая прописные и строчные буквы латиницы и кириллицы, цифры, знаки. Представление такого набора символов двоичными числами называют кодовой таблицей.

Для большинства кодовых таблиц с мощностью алфавита 256 получаем согласно теореме Хартли Q = 8 бит.

В новой международной кодовой таблице UNICOD представлены практически все символы языков разных стран. Информационная емкость символа в таблице UNICOD составляет 2 байта или 16 бит, что позволяет закодировать N = 2Q = 65536 символов.