Кодирование информации. Двоичное кодирование. Единицы измерения количества информации.

Для автоматизации работы с информацией, относящейся к различным типам, очень важно унифицировать форму представления, т.е. надо преобразовать символьную, текстовую и графическую информацию таким образом, чтобы она получила некий единый стандартный вид. Для решения этой задачи обычно используется прием кодирования.

Определение. Форма представления информации, отличная от естественной, общепринятой, называется кодом, а процесс выражения данных одного типа через данные другого называется Кодированием.

Примечание.

Широко известны такие коды, как почтовые индексы, нотная запись музыки, телеграфный код Морзе, цифровая запись программ для ЭВМ (программирование в кодах), помехозащищенные коды в системах передачи данных и т.п.

Как было указано ранее, информатика неразрывно связана обработкой, хранением и передачей информации средствами вычислительной техники. Но, для того, чтобы компьютер мог каким-то образом обрабатывать, хранить и передавать информацию, необходимо, чтобы, информация была представлена в понятном для нее виде.

Мы уже знаем, что существуют различные формы представления информации. Однако, компьютер — это техническое устройство, основанное на работе электронных компонентов, а значит, обладающее определенными физическими характеристиками. По этим причинам информация, предназначенная для ЭВМ, должна иметь физическое представление, причем это представление должно быть наиболее простым.

Этим требованиям отвечает, так называемое, битовое представление информации, основанное на двоичной форме кодирования, при котором каждая запоминаемая частица может принимать только два значения — 0 либо 1. В технических устройствах битовое представление используется для обозначения систем с двумя возможными состояниями, при этом каждая двоичная цифра содержит один бит информации.

Стоит напомнить, что битом называется количество информации, заключающееся в определении одного из двух возможных состояний.

Бит действительно является очень маленьким объемом хранения информации, содержащим всего два состояния: 0, 1. Если объединить два бита в одно целое, то в таком объеме можно хранить уже больше состояний: 00, 01, 10, 11. Если объединить три, то появляется возможность для хранения еще большей информации: 000, 001, 010, 011, 100, 101, 110, 111. И так далее. Чтобы было нагляднее, изобразим это в таблице 2.1:

Таблица 2.1.

Количество битов	Возможные комбинации	Количество комбинаций
	0, 1
	00, 01, 10, 11	2²
	000, 001, 010, 011, 100, 101, 110, 111	2³
n	........	2ⁿ

Известно, что бит — это наименьшая единица информации. Но компьютеры довольно редко работают с конкретными битами. Как правило, они оперируют с машинными словами, представляющими собой объединения из нескольких битов. Наиболее известным подобным объединением является комбинация из восьми битов, называется байтом.

Примечание.

Byte — в дословном переводе с английского обозначает "сцепка", "выделенный кусок".

Именно байт компьютер часто воспринимает как единый информационный блок, как единое целое. По этим причинам в информатике и ее приложениях принято считать, что байт также является единицей измерения количества информации.

Современные электронно-вычислительные машины обрабатывают, хранят, передают очень большие объемы информации. Если попробовать выразить подобный объем в байтовом виде, то получится громоздкое, неудобное для восприятия число. По эти причинам, для обозначения больших объемов информации существуют более крупные единицы производные измерения:

1 килобайт (кб) = 1024 байта = 2¹⁰ байт,

1 Мегабайт (Мб) = 1024 кб = 2²⁰ байт,

1 Гигабайт (Гб) = 1024 Мб = 2³⁰ байт.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

1 Терабайт (Тб) = 1024 Гб = 2⁴⁰ байт,

1 Петабайт (Пб) = 1024 Тб = 2⁵⁰ байт.