Кодирование данных. Системы счисления

Кодирование данных используется издавна: код Морзе, Брайля, морской сигнальный, алфавит и т. п.

В истории человечества для кодировании чисел наиболее известны две системы счисления: непозиционная и позиционная.

Как та, так и другая системы счисления характеризуются основанием – количеством различных цифр, используемых для записи чисел, например, от 0 до 9 (т. е. 10 цифр) в десятичной системе, или I, V, X, L, C, D, M (т. е. 7 цифр) в римской системе счисления.

В непозиционных системах счисления, в частности, римской системе, значение цифры остаётся постоянным, т. е. не зависит от её положения.

Например, используя число 10, обозначаемого как "X" и числа 50, обозначаемого как "L" можно записать число 80 как "LXXX".Очевидно, что для цифры "Х" в любом положении вес одинаков, т. е. равен 10. Точно также, например, число 200 обозначается, как "CC", где каждая цифра "С" соответствует значению 100,независимо от её положения.

В позиционных же системах счисления вес цифры в записи числа, зависит от её положения в числе (позиции или разряда).

Десятичная система счисления, которая применяется в повседневной практике, использует для записи чисел десять арабских цифр (от 0 до 9) – десять пальцев руки.

Существовала пятеричная система расчёта (счёт на пальцах одной руки) и т. п.

Для любой позиционной системы счисления справедливо следующее правило формирования числа на основании входящих в эту систему цифр:

или, если расписать сумму в этом выражении,

где y – число;

k – основание системы счисления;

x_i – цифры числа;

i – номер позиции (разряда) числа, начиная с 0.

Как показала практика, для представления любого числа вполне достаточно системы счисления, состоящей всего из двух символов, что с успехом применяется при работе электронных устройств.

Сохранение любой информации может обеспечиваться использованием двух состояний: наличие – отсутствие. Ячейка памяти, которая, в зависимости от внешнего воздействия, способна принимать одно из двух состояний, обладает минимальной информационной ёмкостью, а её состояния условно обозначаются как "0" и "1".

В компьютерах для кодирования информации в качестве основного кода применяется двоичный или бинарный, представленный позиционной последовательностью нулей и единиц.

Каждый разряд кода ("0" или "1") составляет 1 бит (bit - сокращение от англ. binary digit - двоичное число), т. е. запоминаются два состояния ячейки памяти.

Информация любого типа: символьная, графическая, звуковая кодируется для сохранения на электронных носителях на основании алфавита, состоящего только из двух символов (0, 1), т. е. на основании двоичного кода или двоичной системы счисления.

Информация, представленная в аналоговом виде, для того, чтобы быть сохраненной в электронной памяти, приводится к двоичному коду, т. е. оцифровывается.

В соответствии с тем, что двоичный код имеет позиционную структуру, т. е. старший разряд левее младшего, можно закодировать:

- двумя битами - 4 значения: 00, 01, 10, 11 или (2²);

- тремя – 8 значений: 000, 001, 010, 011, 100, 101, 110, 111 или (2³);

- четырьмя – 16 значений или 2⁴;

- пятью – 32 значения или 2⁵;

- восемью – 256 значений или (2⁸) и т. п.

Таким образом, общая формула записи двоичного числа:

N=2^m,

где m – число разрядов.

Восьмиразрядное двоичное число (2⁸) называют байтом (1 byte = 8 bit).

Биты в байте в последовательности нумеруются слева направо: от 0-го до 7-го.

Минимальная комбинация в одном байте – восемь нулей:

00000000₂=0*2⁷+0*2⁶+0*2⁵+0*2⁴+0*2³+0*2²+0*2¹+0*2⁰=0₁₀

Максимальная – восемь единиц, что соответствует числу 255 в десятичной системе:

11111111₂=1*2⁷+1*2⁶+1*2⁵+1*2⁴+1*2³+1*2²+1*2¹+1*2⁰=128+64+32+16+8+4+2+1=255₁₀

(Подстрочным индексом обозначается основание системы счисления).

Обратное преобразование десятичного кода в двоичный осуществляется делением десятичного числа на 2 до тех пор, пока частное не будет равно единице. Совокупность остатков от деления, записанная слева направо, образует двоичный аналог десятичного числа.

Пример: 13 : 2 = 6 + 1

6 : 2 = 3 + 0

3 : 2 = 1 + 1

1 : 2 =0+ 1

В итоге: 13₁₀= 1101₂=2³+1*2²+0*2¹+1*2⁰=13₁₀

Кроме двоичного кода, в информатике используется восьмеричный код и широко применяется шестнадцатеричный код, обозначаемый буквой h (hexadecimal). Этим кодом записывается четырехразрядное двоичное число.

Разряд (2⁴) шестнадцатеричного кода соответствует 16 различным значениям бинарного кода.

Значения от 0 до 9 разряда числа записываются цифрами десятичного кода:

0000 – 0; 0001 – 1; 0010 – 2; 0011 – 3; … 1000 – 8; 1001 – 9;

а остальные значения разряда (в десятичной системе – это уже следующий разряд) записываются первыми буквами латинского алфавита:

1010 – А(10); 1011 – B(11); 1100 – C(12);

1101 – D(13); 1110 – E(14); 1111 – F(15).

Преобразование из шестнадцатеричной системы в десятичную осуществляется просто, например:

A3_h = 1010 0011₂= 10*16¹+ 3*16⁰ =163₁₀

Проверка:. 1*2⁷+1*2⁵+1*2¹+1*2⁰= 128 + 32 + 2 + 1 = 160 + 3 = 163₁₀

Другой пример:FA_h = 1111 1010₂ = 15*16¹+10*16⁰= 250₁₀

Проверка:2⁷+2⁶+2⁵+2⁴+2³+2¹ = 128+64+32+16+8+2 = 250₁₀

Ещё пример перевода шестнадцатеричного числа 30ЕD₁₆в десятичное:

30ЕD₁₆= 3*16³ + E*16¹ + D*16⁰ = 3*4096 + 14*16 + 13 = 12525₁₀

Преобразование из десятичной в шестнадцатеричную осуществляется (аналогично двоичной) делением на основание (16) и с записью остатка слева направо:

250 : 16 = 15 +10 (младший разряд - 16⁰ * А);

15 : 16 = 0 +15 (старший разряд - 16¹ * F).

Итог: FA_h = 15*16¹+10*16⁰=250₁₀