Кодирование информации в ЭВМ

Компьютеры могут обрабатывать информацию, представленную только в числовой форме. При вво­де информации в память компьютера каждый символ-буква русского или латинского алфавита, цифра, знак пунктуации или знак действия — кодируется опре­деленной последовательностью двоичных цифр. Это происходит в соответствии с таблицами кодирования. Существует несколько разных таблиц кодирования.

Для персональных компьютеров, совместимых с ЭВМ IBM PC и работающих под управлением опера­ционной системы MS DOS, применяется русифици­рованная альтернативная таблица кодирования ASCII (таблица 5), а для среды Windows — русифицированная таблица ANSI.

Каждая таблица включает 16 строк и 16 столбцов с шестнадцатиричными номерами от 0 до F (двоич­ные от 0000 до 1111). Таблицы позволяют закодировать до 256 (16*16) символов. Код символа составляется из номера строки, к которому приписывается номер столбца, на пересечении которых записан символ. На­пример, латинская буква L имеет код или 01001100, а русская буква Л — код или 10001011, т. е. каждый символ, вводимый в компьютер и хранящийся в памя­ти, представляется байтом (слогом).

Каждая таблица разделена на две части по 128 сим­волов. Первая часть (основная) с номерами строк от 0 до 7 включает символы латинского алфавита, десятич­ных цифр, знаков пунктуации, арифметических дей­ствий и др., имеющихся на клавиатуре с латинским шрифтом. Эта часть в основном одинакова для разных таблиц кодирования. Вторая часть представляет собой таблицу расширения (дополнения) с номерами строк от 8 до F и предназначена главным образом для коди­рования национальных алфавитов. Эти части имеют различия. Так, во второй части таблицы ASCII симво­лы русского алфавита располагают в строках с номера­ми 8, 9, А, Е, а в таблице ANSI — в строках от С до F. Русская буква А в этой таблице имеет другой код — СВ или 11001011. Поэтому в среде Windows имеются сред­ства перекодировки текстов, закодированных в ASCII, в систему ANSI.

Десятичные цифры в этих таблицах кодирования находятся в третьей строке, при этом значение каждой цифры соответствует номеру столбца (см. таблицу 5). Например, число А(10) = 173 при вводе в ЭВМ будет закодировано тремя байтами

0011 0001 0011 0111 0011 0011.

Для хранения в памяти и выполнения действий этот код сначала «упаковывается» — отбрасываются первые тетрады из каждого байта и образуется число в двоично-десятичной форме — A2-10 = 0001 0111 0011, которое далее по формуле Горнера (1.4) преобразуется в двоичный код А2=10101101.

Замечание. Существуют и другие таблицы кодиро­вания с более широкими информационными возмож­ностями, например, использующими двухбайтовую кодировку на 65536 символов.