рефераты конспекты курсовые дипломные лекции шпоры

Раздел Образование
/
Кодирование текстовой информации.

Реферат Курсовая Конспект

Выберите учебное заведение

Кодирование текстовой информации.

Кодирование текстовой информации. - раздел Образование, Кодирование текстовой информации Двоичное Кодирование Текстовой Информации В Компьютере. Информация, Выраженна...

Двоичное кодирование текстовой информации в компьютере. Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией.

Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:

N = 2i => 256 = 2i => 28 = 2i => I = 8 битов.

Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе. Для кодирования каждого знака требуется количество информации, равное 8 битам, т. е. длина двоичного кода знака составляет восемь двоичных знаков. Каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала от 00000000 до 11111111 (в десятичном коде от 0 до 255) (табл. 3.1).

Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код знака). Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.Таблица 3.1. Кодировки знаков

В процессе вывода знака на экран компьютера производится обратное перекодирование, т. е. преобразование двоичного кода знака в его изображение.

Различные кодировки знаков. Присваивание знаку конкретного двоичного кода - это вопрос соглашения, которое фиксируется в кодовой таблице. В существующих кодовых таблицах первые 33 кода (десятичные коды с 0 по 32) соответствуют не знакам, а операциям (перевод строки, ввод пробела и т. д.).

Десятичные коды с 33 по 127 являются интернациональными и соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Десятичные коды с 128 по 255 являются национальными, т. е. в различных национальных кодировках одному и тому же коду соответствуют разные знаки. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO (табл. 3.1 и 3.2)), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.Таблица 3.2. Десятичные коды некоторых символов в различных кодировках

Например, в кодировке Windows последовательность числовых кодов 221, 194, 204 образует слово "ЭВМ", тогда как в других кодировках это будет бессмысленный набор символов.

К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в операционную систему и приложения.

В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов). По формуле можно определить количество символов, которые можно закодировать согласно этому стандарту:

N = 2i = 216 = 65 536.

Такого количества символов оказалось достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

Кодирование текстовой информации

Динамические электронные таблицы Назначение и принципы работы электронных таблиц Использование электронных таблиц для обработки числовых данных... Электронные таблицы позволяют обрабатывать большие массивы числовых данных В...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Кодирование текстовой информации.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Кодирование графической информации.
С 80-х гг. развивается технология обработки на ПК графической информации. Форму представления на экране дисплея графического изображения, состоящего из отдельных точек (пикселей), называют растрово

Архитектура современных компьютеров. Основные устройства компьютера, их функции и взаимосвязь. Магистрально-модульный принцип построения компьютера,
Железная составляющая современного компьютера - сложная электронная схема, состоящая из множества транзисторов, конденсаторов, резисторов и других радиоэлементов. Один чип процессора Pentium 4 сост

Файловые вирусы
.Файловые вирусы различными способами внедряются в исполнимые файлы и обычно активизируются при их запуске. После запуска зараженной программы вирус находится в оперативной памяти компьютера и явля

Макровирусы
Макровирусы заражают файлы документов Word и электронных таблиц Excel. Макровирусы являются фактически макрокомандами, которые встраиваются в документ. После загрузки зараженного документа

Сетевые вирусы
По компьютерной сети могут распространяться и заражать компьютеры любые обычные вирусы. Это может происходить при получении зараженных файлов с серверов файловых архивов. Однако существуют и специф

Полифаги
Самыми популярными и эффективными антивирусными программами являются антивирусные программы полифаги (например, Kaspersky Anti-Virus, D.Web). Принцип работы полифагов основан на проверке фай

Ревизоры
Принцип работы ревизоров(например, (ADinf) основа на подсчете контрольных сумм для присутствующих на диске файлов. Эти контрольные суммы затем сохраняются в базе данных антивируса, как и некоторая

Блокировщики
Антивирусные блокировщики - это программы, перехватывающие «вирусоопасные» ситуации и сообщающие об этом пользователю. К таким ситуациям относятся, например, запись в загрузочной сектор диск

Кодирование звуковой информации, форматы звуковых файлов. Ввод и обработка звуковых файлов.
Кодирование звуковой информации. Форматы звуковых файлов. Ввод и обработка звуковых файлов. Из курса физики известно, что звук представляет собой колебания воздуха. Амплиту

Вероятностный и алфавитный подходы к измере¬нию информации. Единицы измерения информации.
Различные подходы к измерению количества информации в сообщении определяются различием подходов к определению самого понятия «информация». Чтобы измерить что-либо, необходи

Характеристики процессора и внутренней памяти компьютера (быстродействие, разрядность, объем памяти и др.).
Характеристики процессора и внутренней памяти компьютера (быстродействие, разрядность, объем памяти и др.) Необычайно быстрое развитие вычислительной техники приводит к тому, что одновреме

Операционная система компьютера (назначение, состав, способ организации диалога с пользователем). Загрузка компьютера.
Операционная система является базовой и необходимой составляющей программного обеспечения компьютера (software). Операционная система обеспечивает управление всеми аппаратными компонентами компьюте