рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Кодирование символьной информации

Кодирование символьной информации - раздел Компьютеры, Математика в компьютере Внутреннее Представление Символов В Эвм Осуществляется На Основе Определенной...

Внутреннее представление символов в ЭВМ осуществляется на основе определенной системы кодирования символов, которая обычно представлена в виде кодовой таблицы. Кодовая таблица отражает соответствие между изображениями символов и их внутренними числовыми кодами. Коды обычно представлены шестнадцатеричными или десятичными числами.

Кодовая таблица должна представлять следующие группы символов:

- управляющие символы;

- знаки арифметических операций, знаки препинания и цифры;

- буквы латинского алфавита;

- буквы национальных алфавитов;

- математические символы;

- символы псевдографики.

Общепринятый компьютерный алфавит еще не успел сложиться. В настоящее время существует достаточно много способов кодирования символов. Так, для представления символов в самых первых компьютерах использовался стандартный телеграфный код. Это было вызвано тем временем: для ввода и вывода текста использовались стандартные телетайпы, подключенные к ЭВМ. Когда появилось специализированное компьютерное оборудование ввода-вывода, изменилось и кодирование. Так, фирма IBM в своих больших машинах использовала кодировку EBCDIC (Extended Binary Coded Decimal Interchange Code) – расширенный двоично-десятичный код обмена информацией. Существовало порядка шести версий этого кода, несовместимых между собой.

В машинах американской фирмы DEC (советские аналоги этих машин – СМ и ДВК) использовалась семибитовая кодировка КОИ-7 (KOI-7). С ее помощью можно было закодировать 128 символов.

В современных условиях при вводе и преобразовании данных применяются различные системы кодирования символов. В IBM-совместимых ЭВМ используются в основном такие виды кодов: КОИ-7, КОИ-8, ДКОИ, ASCII и др. Наличие в ЭВМ блоков предварительной обработки позволяет производить перекодировку информации из одного кода в другой.

КОИ-7 предназначался для представления алфавитно-цифровой информации на входах и выходах аппаратуры передачи данных по линиям связи. Например, Е-русское в этом коде обозначается 1100101, а Е-латинское – 1000101. Этот код оказался неудобен для внутренней обработки информации в машине. Для этих целей стали применяться коды КОИ-8 (восьмибитовый код обмена информации) и ДКОИ (двоичный код обмена и обработки информации). Преимущество этих кодов в том, что они предоставляют возможность кодирования большего количества символов (до 256).

КОИ-8 предназначался для обмена алфавитно-цифровой информации с магнитными накопителями. Построен на основе семибитового кода КОИ-7. КОИ-8 разработан с соблюдением международных стандартов, что позволяет использовать его не только для выполнения арифметических и логических операций, но и обмена информацией как по внутренним, так и по международным линиям связи.

ДКОИ – двоичный код обмена и обработки информации – предназначен для обработки информации в машинах (табл.5.1–5.4).

Необходимость стандартизации представления текстовой информации была достаточно скоро осознана. Результатом этого явилась кодировка ASCII (American Standard Code for Information Interchange) – стандартный американский код для обмена информацией.

Коды десятичных цифр (ДКОИ)

Таблица 5.1

Десятичная цифра Код Десятичная цифра Код
F0 F5
F1 F6
F2 F7
F3 F8
F4 F9

 

Коды латинских букв (ДКОИ)

Таблица 5.2

Латинская буква Код Латинская буква Код Латинская буква Код
A C1 J D1 S E2
B C2 K D2 T Е3
C C3 L D3 U E4
D C4 M D4 V E5
E C5 N D5 W E6
F C6 O D6 X E7
G C7 P D7 Y E8
H C8 Q D8 Z E9
I C9 R D9    

Коды русских букв (ДКОИ)

Таблица 5.3

Русская буква Код Русская буква Код Русская буква Код
А C1 Л CE Ц BB
Б ВА М D4 Ч FE
В C2 Н C8 Ш FB
Г BF О D6 Щ FD
Д BC П DC Ь EE
Е C5 Р D7 Ы EF
Ж EC С C3 Э FC
З FA Т E3 Ю B8
И CB У EB Я DD
Й CC Ф BE    
К D2 Х E7    

Коды знаков (ДКОИ)

Таблица 5.4

Знак Название знака Код Знак Название знака Код
[ Пробел ; Точка с запятой 5E
& Знак «и» Знак «не» 5F
- Черточка , Запятая 6B
/ Знак деления % Знак процента 6C
. Точка 4B _ Знак подчеркивания 6D
< Меньше 4C > Больше 6E
( Левая скобка 4D ? Вопросительный знак 6F
+ Плюс 4E : Двоеточие 7A
| Знак «или» 4F # Знак номера 7B
! Восклицательный знак 5A @ Товарный знак 7C
¤ Денежный знак 5B Апостроф 7D
* Знак умножения 5C = Знак «равно» 7E
) Правая скобка 5D Кавычки 7F

ASCII введен в качестве стандартного кода для обмена информацией между ЭВМ, а также для передачи информации по линиям связи. Это код двоичный, восьмиразрядный, восьмой бит – бит проверки на четность, семь остальных бит – значащие.

Хотя и введен стандарт, но несовместимые или частично совместимые с ним варианты продолжают существовать. Особенно ситуация осложнилась, когда компьютеры распространились за пределы англоязычных стран, а затем и за пределы стран с латинским алфавитом. Возникли проблемы совмещения латинского и национального алфавитов в одной кодовой таблице.

В персональных компьютерах используется система кодирования ASCII. В ней для национальных алфавитов, в частности, для русского отводятся коды с 128-го по 255-й. Исторически сложилось так, что наш алфавит был закодирован в этом коде несколькими различными способами. Однако наиболее часто использовался вариант, известный как СР866 – кодовая страница 866 для MS DOS.

Время идет, появляются новые операционные системы, которые предлагают новые системы кодировки. Например, для представления кириллицы в операционной системе MS Windows используется CP1251 - кодировка, несовместимая с прежней кодировкой кириллицы в MS DOS.

Несколько лет спустя появилась версия операционной системы UNIX для IBM-совместимых ПК, которая принесла с собой кодировку DEC KOI-8 и её кириллический вариант KOI-8r, который считается стандартом для передачи русскоязычной информации и её представления в Internet.

Одним из возможных решений проблемы совместимости национальных кодировок символов является разработка универсального межнационального стандарта. На её роль в настоящее время претендует стандарт UNICODE, в котором для представления символов используется двухбайтовая кодировка. В Windows 95 и Windows NT тоже есть средства по работе с UNICODE. Однако кодировка символов кириллицы в UNICODE не совместима ни с одной кодировкой русских букв, из числа упоминавшихся выше.

– Конец работы –

Эта тема принадлежит разделу:

Математика в компьютере

А И Бородина... Математика в компьютере Учебное пособие...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Кодирование символьной информации

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Математика в компьютере
Учебное пособие     Редактор: Э.Н.Гневко Корректор:   Подписано в печать _______ 2002. Формат 60х84/16. Печать офсетная.

Позиционные и непозиционные системы счисления
Конструкция вычислительных машин и программирование на них тесно связаны с системами счисления. Система счисления – это совокупность приемов наименования и

Двоичная система счисления
В зависимости от основания принятой системы счисления для изображения числа в машине в каждом разряде требуется различное число элементов или устойчивых состояний элемента. Большинство механических

Шестнадцатеричная система счисления
Шестнадцатеричная система счисления удобна тем, что в ней требуется в четыре раза меньше разрядов для записи чисел, чем в двоичной. В шестнадцатеричной системе для обозначения цифр использ

Смешанные системы счисления
В ряде случаев числа, заданные в системе счисления с некоторым основанием р приходится изображать с помощью цифр другой системы счисления, с основанием q, где q<p. Такая сис

Перевод чисел из одной системы счисления в другую
3.1. Перевод целых чисел В связи с использованием в ЭВМ различных систем счисления, возникает необходимость перевода чисел из одной системы счисления в другую. Существует

Перевод правильных дробей
Теперь рассмотрим случай 0<Ар<1. Мы хотим найти неотрицательные целые числа - коэффициенты а-1, а-2,..., а-m, каждый из ко

Q - основание системы счисления.
Пример: 325,17=0,32517·103=3251,7·10-1. Очевидно, что запись числа с плавающей точкой не является однозначной. Поскольку при разных порядках положение десятично

Нормализация
Как уже было отмечено, запись числа с плавающей точкой не является однозначной. Для однозначности чисел в форме с плавающей точкой необходимо накладывать на мантиссу дополнительные ограничения. Обы

Кодирование графической информации
Современные компьютеры могут представлять на экране как текстовую, так и графическую информацию. В текстовом режиме экран разбивается на 25 строк по 80 символов в с

Кодирование звуковой информации
Современные компьютеры могут записывать и воспроизводить музыку и человеческую речь. Существует два способа звукозаписи: цифровая запись и MIDI-запись. При цифровой записи

Прямой, обратный и дополнительный коды
  При вычислении ЭВМ оперируют как с положительными, так и с отрицательными числами. При этом вычитание можно заменить сложением, воспользовавшись дополнением отрицательного числа. До

Представление информации в памяти ЭВМ
  В современных вычислительных машинах обрабатывается как цифровая, так и буквенная информация. Вся эта информация должна быть представлена двоичными цифрами (битами). Для записи кажд

Логические основы ЭВМ
  Кроме арифметических, ЭВМ выполняют также логические операции, основанные на понятиях алгебры логики. Основным понятием алгебры логики является высказывание. Высказывание

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги