Кодирование информации в ЭВМ.

Кодированием называется представление символов одного алфавита средствами другого алфавита.

Алфавит содержащий два символа называется двоичным (часто их обозначают как 0 и 1).

Величина способная принимать только два различных значения называется битом.

Как представить символы другого алфавита с помощью двоичного алфавита?

Для кодирования алфавитов, содержащих более 2-х символов используются последовательности символов двоичного алфавита. Например, последовательностью из двух двоичных символов можно закодировать 4 символа другого алфавита:

00 --> А 01 à В 10 à С 11 à D .

Можно показать, что число возможных комбинаций при использовании двоичного алфавита равно 2ⁿ ,где n количество двоичных символов в последовательности. При n равном 8 число возможных комбинаций равно 256, что вполне достаточно для кодирования большинства известных алфавитов, поэтому последовательность из восьми двоичных символов широко используется для кодирования информации в ЭВМ. Последовательность из восьми двоичных разрядов принято называть байтом.

Пример кодирования:

символ А à 1100 0001 символ 9 à 1111 1001.

В настоящее время для кодирования символов используются также последовательности из 16 двоичных символов (2 байта).

Техническим носителем информации в ЭВМ является ячейка памяти, состоящая из совокупности простейших элементов, каждый из которых может находиться в одном из двух возможных состояний (обозначаемых как 0 и 1). Ячейка памяти может содержать различное число простейших элементов. Обычно количество элементов в ячейке кратно 8.

Для измерения памяти используются также более крупные единицы:

1 килобайт (кб) = 2¹⁰ байт = 1024 байт;

1 мегабайт (мб) =2²⁰ байт = 1048576 байт;

1 гигабайт (гб) = 2³⁰ байт =

Машинным кодом (или просто кодом) называется совокупность 0 и 1, которую может хранить ячейка памяти.

Код длиной в 2 байта называется полусловом,

код длиной в 4 байта называется словом,

код длиной в 8 байта называется двойным словом.