Компьютеры могут обрабатывать информацию, представленную только в числовой форме. При вводе информации в память компьютера каждый символ-буква русского или латинского алфавита, цифра, знак пунктуации или знак действия — кодируется определенной последовательностью двоичных цифр. Это происходит в соответствии с таблицами кодирования. Существует несколько разных таблиц кодирования.
Для персональных компьютеров, совместимых с ЭВМ IBM PC и работающих под управлением операционной системы MS DOS, применяется русифицированная альтернативная таблица кодирования ASCII (таблица 5), а для среды Windows — русифицированная таблица ANSI.
Каждая таблица включает 16 строк и 16 столбцов с шестнадцатиричными номерами от 0 до F (двоичные от 0000 до 1111). Таблицы позволяют закодировать до 256 (16*16) символов. Код символа составляется из номера строки, к которому приписывается номер столбца, на пересечении которых записан символ. Например, латинская буква L имеет код 4С или 01001100, а русская буква Л — код 8В или 10001011, т. е. каждый символ, вводимый в компьютер и хранящийся в памяти, представляется байтом (слогом).
Каждая таблица разделена на две части по 128 символов. Первая часть (основная) с номерами строк от 0 до 7 включает символы латинского алфавита, десятичных цифр, знаков пунктуации, арифметических действий и др., имеющихся на клавиатуре с латинским шрифтом. Эта часть в основном одинакова для разных таблиц кодирования. Вторая часть представляет собой таблицу расширения (дополнения) с номерами строк от 8 до F и предназначена главным образом для кодирования национальных алфавитов. Эти части имеют различия. Так, во второй части таблицы ASCII символы русского алфавита располагают в строках с номерами 8, 9, А, Е, а в таблице ANSI — в строках от С до F. Русская буква А в этой таблице имеет другой код — СВ или 11001011. Поэтому в среде Windows имеются средства перекодировки текстов, закодированных в ASCII, в систему ANSI.
Десятичные цифры в этих таблицах кодирования находятся в третьей строке, при этом значение каждой цифры соответствует номеру столбца (см. таблицу 5). Например, число А(10) = 173 при вводе в ЭВМ будет закодировано тремя байтами
0011 0001 0011 0111 0011 0011.
Для хранения в памяти и выполнения действий этот код сначала «упаковывается» — отбрасываются первые тетрады из каждого байта и образуется число в двоично-десятичной форме — A2-10 = 0001 0111 0011, которое далее по формуле Горнера (1.4) преобразуется в двоичный код А2=10101101.
Замечание. Существуют и другие таблицы кодирования с более широкими информационными возможностями, например, использующими двухбайтовую кодировку на 65536 символов.