План лекции:
Кодирование информации. Единицы измерения информации. Количественная мера: биты, байты, Килобайты и т.д., машинное слово. Статистический и семантический подходы к измерению информации. Представление символов в ЭВМ. Стандарты ASCII, ANSI, Unicode.
Системы счисления. Двоичные, десятичные и шестнадцатеричные числа. Переход от одной системы счисления к другой.
Краткий конспект лекции
Информация в ЭВМ кодируется (символ - цифровой код), обрабатывается (цифры переводятся в двоичную систему счисления и проводятся арифметические и логические операции), декодируется.
Расчеты ЭВМ проводит в двоичной системе счисления, цифры 0 и 1 соответствуют отсутствию, либо наличию заряда в элементе схемы.
Элементарная единица информации 1 бит - bit (binary digit - двоичная цифра).
Для обозначения расположения данных в памяти компьютера используется шестнадцатеричная система счисления (цифры от 0 до 9 и буквы A, B, C, D ,E, F).
Таблица единиц измерения информации:
8 бит | 1байт (б) | |
210 байт | 1024 байт | 1Килобайт (Кб) |
220 байт | 1024 Килобайт | 1Мегабайт (Мб) |
230 байт | 1024 Мегабайт | 1Гигабайт (Гб) |
240 байт | 1024 Гигабайт | 1Терабайт (Тб) |
Число бит, которые могут содержаться регистрами процессора и обрабатываться как отдельный модуль называется машинным словом. От размера слова зависит скорость обработки данных компьютером. В ПК используют 32 - 64 разрядные слова.
Магнитный диск для хранения данных разбит на сектора и дорожки. Размер сектора -512 байт.
Запись информации на магнитный диск происходит порциями. Наименьший размер порции записи - кластер.
Системы счисления классифицируются на позиционные и не позиционные.
В позиционных системах счисления цифра в каждой позиции (разряде) имеет свое значение «вес», зависящий от основания системы счисления.
В общем виде число в системе счисления с основанием m (АnАn-1 … А1 А0)m можно записать как Аn*mn+ Аn-1*mn-1+ … + А1*m1+ А0*m0.
Для перевода целого числа из десятичной системы счисления в двоичную находятся остатки от деления на 2 сначала самого числа, а затем частного. Процесс повторяется до получения частного, меньшего, чем 2. Целая часть числа в двоичной системе счисления записывается как последовательность остатков от последнего к первому.
Для перевода числа из двоичной системы счисления в десятичную цифры умножаются на 2 в степени, соответствующей разряду цифры.
Таблица соответствия чисел в системах счисления
Десятичная | ||||||||||||||||
Шестнадцатеричная | A | B | C | D | E | F | ||||||||||
Двоичная |
Пусть 1 символ кодируется 8 битами, что соответствует 1 байту.
Возможное число комбинаций 0 и 1 в 8 позициях равно 28=256.
В стандарте ASCII символ кодируется 8 битами. В первой половине таблицы кодов от 0 до 126 содержатся буквы латинского алфавита, арабские цифры, знаки арифметических операций, препинания и некоторые другие. Вторая половина таблицы - коды от127 до 255 содержат буквы национального алфавита и символы псевдографики. номер кодовой страницы, Россия - 866.
Стандарт ASCII используется в MS-DOS, в OC Windows используется стандарт ANSI, в котором символ также кодируется 8 битами и первая половина таблицы совпадает с ASCII. Вторая - содержат буквы национального алфавита. Номер кодовой страницы, России - 1251.
Стандарт UNICODE создан международной организацией по стандартизации (ISO) для обмена информацией через Интернет, в нем один символ кодируется 16 битами, что позволяет закодировать 216=65536 различных символов. В UNICODE нет кодовых страниц.