Стандарт ISO 8879 (SGML)

 

Вследствие возникшего многообразия способов представления текстовой и тексто-графи-ческой информации, связанных с применением разнородных программных средств, технологий форматирования и верстки текста, методов кодировки и поддержки национальных языков, появилась потребность в разработке унифицированных решений.

Такое решение содержится в стандарте ISO 8879 (SGML, Standard Generalized MarkUp Language), определяющем «обобщенный стандартный язык разметки» текста.

Термин «разметка» носит исторический характер - имеются ввиду метки, которые обычно делает редактор в процессе подготовки текста к верстке. Технология электронной разметки текста, основанная на вставке в текст специальных меток, широко используется в современных программных средствах верстки и форматирования. Метки условно можно разделить на два класса: процедурные и описательные.

Процедурные метки используемые, например, в программах Microsoft Word и Quark XPress чаще всего представляют собой коды форматирования, вставленные в текст документа.

Описательные метки, известные также под названием «обобщенных» (generalized), определяют не способ появления текста на странице, а назначение текста в документе. Описательные метки отделяют структуру документа от стиля его отображения, позволяя для одного документа иметь различные способы его отображения на экране или бумаге.

С точки зрения стандарта SGML документ рассматривается как совокупность:

- содержания (информации, содержащейся в документе в текстовой, графической и мультимедийной форме);

- данных о структуре документа (взаимосвязи глав, разделов, параграфов, ссылки, прав доступа к элементам документа);

- данных о стиле оформления документа (используемых шрифтах, интервалах, размерах полей, способе нумерации и т.д.).

Стандарт ISO 8879 SGML определяет способ описания структуры документа, а также формат вставляемых в документ описательных меток, но не определяет формат данных о стиле оформления документа. Структура документа задается при помощи «определения типа документа» (в терминах стандарта - Document Type Definition или сокращенно DTD), описывающего структуру документа подобно тому, как схема базы данных описывает типы поддерживаемых данных и отношения между полями. Определение типа документа (ОТД) задает взаимосвязь глав, заголовков глав, разделов и других фрагментов текста, образующих документ. Кроме того, ОТД задает правила для отношений между элементами документа, например: «заголовок главы должен быть первым элементом после начала главы» или «каждый список должен содержать по меньшей мере два пункта». Правила, содержащиеся в ОТД, позволяют автоматически контролировать правильность логической структуры документа. Таким образом, разные ОТД позволяют получить из одного и того же набора элементов разные документы (см. рис.12).

Помимо текстовой и графической информации, в SGML-документ могут быть вставлены мультимедийные элементы: аудио и видео-записи и клипы. Технология встройки мультимедийных элементов регламентируется специальным расширением SGML, описанным в стандарте ISO 10744 HyTime (Hypermedia/TimeBased Structuring Language) - языком «привязки» мультимедийных объектов.

В разделе, посвященном подготовке интерактивных электронных технических руководств, рассмотрен наглядный пример использования SGML – технологии.

Основные преимущества SGML - технологии:

1) формализация структуры документа, обеспечивающая возможность:

- описать правила, по которым формируется структура документа,

- автоматической генерации и контроля структуры документа,

- автоматического наполнения документа;

2) возможность распределенной подготовки различных разделов по строго определенным правилам (единая структура документа, единое стилевое оформление) и централизованная композиция конечного документа;

 
 

 

Рис.12. Формирование документов из составных элементов на основе ОТД

 

3) возможность создания многовариантных документов: например предназначенных для работы с гаммой или семейством изделий, имеющих отличия;

4) возможность обеспечивать доступ к содержимому документа в соответствии с ролью пользователя (техник, инженер, и т.д.);

5) возможность создавать многоязычные документы;

6) поддержка любых способов представления информации – текстовая информация, изображения (растровые, векторные);

7) аудио-, видеоинформация, навигация и поиск по структуре документа.

Недостатком стандарта ISO 8879 SGML является его некоторая избыточность и громоздкость. По этой причине в последние несколько лет в мире ведутся активные работы по его совершенствованию. Одним из результатов такой работы является «облегченная» версия SGML, названная XML (Extensible Markup Language) - расширяемым языком разметки.