Двоичное кодирование текстовой информации в компьютере

 

Для предоставления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле (2.1) можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:

N=2ið 256 = 2i ð28 ð2i ðI = 8 битов.

 

Для обработки текстовой информации на компьютере необходимо поставить в соответствие уникальный 8- битовый двоичный код, значения которого находятся в интервале от 00000000 до 11111111 (в десятичном коде от 0 до 255).

Присвоение знаку конкретного двоичного кода- это вопрос соглашения, которое фиксируется в кодовой таблице. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов). По формуле можно определить количество символов, которые можно закодировать:

N= 2i = 216 65 536

Такого количества символов оказалось достаточно, чтобы закодировать не только русский и латинский алфавиты, циф­ры, знаки и математические символы, но и греческий, араб­ский, иврит и другие алфавиты.

 

Двоичное кодирование графической информации в компьютере

Графические изображения из аналоговой (непрерывной) формы в цифровую (дискретную) преобразуются путем про­странственной дискретизации. Изображение разбивается на отдельные маленькие фрагменты (точки, или пиксели), при­чем каждый элемент может иметь свой цвет (красный, зеле­ный, синий и т. д.).

Пиксель — минимальный участок изображения, кото­рому независимым образом можно задать цвет.

В результате пространственной дискретизации графиче­ская информация представляется в виде растрового изображе­ния, которое формируется из определенного количества строк, которые, в свою очередь, содержат определенное коли­чество точек.

Важнейшей характеристикой качества растрового изобра­жения является разрешающая способность.

Разрешающая способность растрового изображения определяется количеством точек по горизонтали и вер­тикали на единицу длины изображения.

При одних и тех же размерах экрана чем меньше размер точки, тем больше разрешающая способность (больше количе­ство строк растра и точек в строке), и, соответственно, выше качество изображения. Величина разрешающей способности обычно выражается в dpi (dot per inch — точек на дюйм), т. е. в количестве точек в полоске изображения длиной один дюйм (1 дюйм = 2,54 см).

В процессе дискретизации могут использоваться различ­ные палитры цветов, т. е. наборы цветов, которые могут при­нимать точки изображения. Каждый цвет можно рассматри­вать как возможное состояние точки. Количество цветов N в палитре и количество информации I, необходимое для коди­рования цвета каждой точки, связаны между собой и могут быть вычислены по формуле (2.1).

Количество информации, которое используется при кодировании цвета точек изображения, называется глубиной цвета.

Наиболее распространенными значениями глубины цвета при кодировании цветных изображений являются 4, 8, 16 или 24 бита на точку. Можно определить количество цветов в 24-битовой палитре:

N = 2i = 224 = 16 777 216.

 

Двоичное кодирование звуковой информации в компьютере

Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся ин­тенсивностью и частотой.

Человек воспринимает звуковые волны (колебания воз­духа) с помощью слуха в форме звуков различной громкости и тона, чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука.

Для того чтобы компьютер мог обрабатывать реальный (записанный) звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна раз­бивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина интенсивности звука.

Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зави­сит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звуко­вого сигнала повторяет кривую аналогового сигнала.

Частота дискретизации звука — это количество изме­рений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 ООО измерений громкости звука за одну секунду.

Каждому уровню дискретизации присваивается опреде­ленное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное коли­чество информации I, которое называется глубиной кодиро­вания звука.

Глубина кодирования звука — это количество инфор­мации, которое необходимо для кодирования диск­ретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уров­ней громкости цифрового звука можно рассчитать по формуле (2.1). Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно

N= 2i = 216 65 536

Чем больше частота дискретизации и глубина кодирова­ния звука, тем более качественным будет звучание оцифро­ванного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, будет при часто­те дискретизации 8000 раз в секунду, глубине кодирования 8 битов и записи одной звуковой дорожки (режим моно). Вы­сокое качество оцифрованного звука, соответствующее каче­ству аудио-CD, обеспечивается при частоте дискретизации 48 000 раз в секунду, глубине кодирования 16 битов и записи двух звуковых дорожек (режим стерео).