рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Структура XML-документа

Работа сделанна в 2003 году

Структура XML-документа - Курсовая Работа, раздел Программирование, - 2003 год - Трансформация XML документов Структура Xml-Документа. Хотя Xml, Сильно Отличается По Своим Возможностям И ...

Структура XML-документа. Хотя XML, сильно отличается по своим возможностям и предназначению от языка гипертекстовой разметки, оба эти языка являются подмножествами SGML, и, следовательно, наследуют его базовые принципы. Простейший XML-документ может выглядеть так xml version1.0 listofitems item id1 first Первый item item id2 Второй subitem подпункт 1 subitem item item id3 Третий item item id4 last Последний item listofitems Этот документ очень похож на обычную HTML-страницу.

Так же, как и в HTML, инструкции, заключенные в угловые скобки называются тэгами и служат для разметки основного текста документа.

В XML существуют открывающие, закрывающие и пустые тэги в HTML понятие пустого тэга тоже существует, но специального его обозначения не требуется.

Тело документа XML состоит из элементов разметкиmarkup и непосредственно содержимого документа - данныхcontent. XML - тэги предназначены для определения элементов документа, их атрибутов и других конструкций языка. Любой XML-документ должен всегда начинаться с инструкции xml, внутри которой также можно задавать номер версии языка, номер кодовой страницы и другие параметры, необходимые программе-анализатору в процессе разбора документа. В общем случае XML-документы должны удовлетворять следующим требованиям В заголовке документа помещается объявление XML, в котором указывается язык разметки документа, номер его версии и дополнительная информация Каждый открывающий тэг, определяющий некоторую область данных в документе обязательно должен иметь закрывающий тэг В XML учитывается регистр символов Все значения атрибутов, используемых в определении тэгов, должны быть заключены в кавычки Вложенность тэгов в XML строго контролируется, поэтому необходимо следить за порядком следования открывающих и закрывающих тэгов Вся информация, располагающаяся между начальным и конечными тэгами, рассматривается в XML как данные, и поэтому учитываются все символы форматирования т.е. пробелы, переводы строк, табуляции не игнорируются, как в HTML. Если XML-документ не нарушает приведенные правила, то он называется формально-правильным и все анализаторы, предназначенные для разбора XML- документов, смогут работать с ним корректно.

Однако кроме проверки на формальное соответствие грамматике языка, в документе могут присутствовать средства контроля над содержанием документа, за соблюдением правил, определяющих необходимые соотношений между элементами и формирующих структуру документа. Для того, чтобы обеспечить проверку корректности XML- документов, необходимо использовать анализаторы, производящие такую проверку и называемые верифицирующими.

На сегодняшний день существует два способа контроля правильности XML-документа DTD - определенияDocument Type Definition и схемы данныхSemantic Schema.

В отличии от SGML, определение DTD-правил в XML не является необходимостью.

Конструкции языка Содержимое XML-документа представляет собой набор элементов, секций CDATA, директив анализатора, комментариев, спецсимволов, текстовых данных. Элементы данных Элемент - это структурная единица XML-документа. Заключая слово rose в в тэги flower flower, мы определяем непустой элемент, называемый flower, содержимым которого является rose. В общем случае в качестве содержимого элементов могут выступать как просто какой-то текст, так и другие, вложенные, элементы документа, секции CDATA, инструкции по обработке, комментарии т.е. практически любые части XML-документа.

Любой непустой элемент должен состоять из начального, конечного тэгов и данных, между ними заключенных. Например, следующие фрагменты будут являться элементами flower rose flower city Saratov city Набором всех элементов, содержащихся в документе, задается его структура, и определяются все иерархическое соотношения.

Плоская модель данных превращается с использованием элементов в сложную иерархическую систему с множеством возможных связей между элементами. Производя в последствии поиск в этом документе, программа клиента будет опираться на информацию, заложенную в его структуру - используя элементы документа. Поиск при этом, естественно, будет гораздо более эффективен, чем нахождение нужной последовательности по всему документу. В XML документе, как правило, определяется хотя бы один элемент, называемый корневым и с него программы-анализаторы начинают просмотр документа.

В некоторых случаях тэги могут изменять и уточнять семантику тех или иных фрагментов документа, по разному определяя одну и ту же информацию и тем самым предоставляя приложению-анализатору этого документа сведения о контексте использования описываемых данных. Например, прочитав фрагмент city Holliwood city мы можем догадаться, что речь в этой части документа идет о городе, а вот во фрагменте restaurant Holliwood restaurant - о забегаловке.

В случае, если элемент не имеет содержимого, т.е. нет данных, которые он должен определять, он называется пустым. Примером пустых элементов в HTML могут служить такие тэги HTML, как br, hr, img. Комментарии Комментариями является любая область данных, заключенная между последовательностями символов и Комментарии пропускаются анализатором и поэтому при разборе структуры документа в качестве значащей информации не рассматриваются.

Атрибуты Если при определении элементов необходимо задать какие-либо параметры, уточняющие его характеристики, то имеется возможность использовать атрибуты элемента. Атрибут - это пара название значение, которую надо задавать при определении элемента в начальном тэге. Пример color RGBtrue ff08ff color color RGBfalse white color или author id0 Ivan Petrov author Специальные символы Для того, чтобы включить в документ символ, используемый для определения каких-либо конструкций языка например, символ угловой скобки и не вызвать при этом ошибок в процессе разбора такого документа, нужно использовать его специальный символьный либо числовой идентификатор.

Например или 036десятичная форма записи, x1a шестнадцатеричная и т.д. Строковые обозначения спецсимволов могут определяться в XML документе при помощи компонентов entity. Директивы анализатора Инструкции, предназначенные для анализаторов языка, описываются в XML документе при помощи специальных тэгов - и. Программа клиента использует эти инструкции для управления процессом разбора документа.

Наиболее часто инструкции используются при определении типа документа например, Xml version1.0 или создании пространства имен. CDATA Чтобы задать область документа, которую при разборе анализатор будет рассматривать как простой текст, игнорируя любые инструкции и специальные символы, но, в отличии от комментариев, иметь возможность использовать их в приложении, необходимо использовать тэги CDATA и. Внутри этого блока можно помещать любую информацию, которая может понадобится программе- клиенту для выполнения каких-либо действий в область CDATA, можно помещать, например, инструкции JavaScript.

Естественно, надо следить за тем, чтобы в области, ограниченной этими тэгами не было последовательности символов . 3. Моделирование XML-документов Одним из наиболее сильных свойств XML является возможность создавать собственные языки разметки, в которых определяются элементы и атрибуты, наилучшим образом соответствующие инкапсулируемой информации, и снимаются ограничения, вызываемые малопригодным языком общего назначения.

Однако пока нельзя определить язык формальным образом, ограничить словарь элементов и атрибутов поддающимся управлению множеством и управлять грамматикой элементов. Процесс формального определения языка в XML называется моделированием документов. На сегодняшний день существует два способа моделирования документов определения типа документа DTD, которые описывают структуру документа с помощью декларативных правил, и XML Schema, описывающую структуру документа на примере с помощью шаблонов элементов.

Модель определяет документы, которые можно создать с помощью языка или, в рамках терминологии XML, модель документа устанавливает, какие документы согласуются conform с языком. Модель документа отвечает на такие вопросы, как Может ли быть заголовок у данного элемента или Должна ли быть указана цена для этого элемента Модель является документом особого рода, написанным по правилам синтаксиса, предназначенного для описания языков XML, и явно описывает грамматику и словарь отдельного языка разметки.

Иногда язык, который она описывает, называют типом документа document type или приложением XML XML application. С помощью такой модели можно определить, согласуется ли некоторый документ XML с данным типом документа. Фактически написанные кем-то документы, называемые экземплярами документа document instances, могут согласоваться с языком, описанным в модели документа или не согласоваться.

Согласующиеся документы называют действительными valid в контексте языка другие документы называют недействительными invalid. Модель документа может быть лишним грузом, если надо сопровождать лишь один-два документа, но если документов много, а требования к качеству высоки, ее создание может окупиться. Вот некоторые ситуации, в которых модель документа в состоянии облегчить жизнь Документы создаются людьми и являются данными для компьютерной программы.

Программы особенно привередливы в отношении форматов данных, потому что трудно создавать программы, способные справляться с отклонениями от формата. Ограничив применяемый шаблон предсказуемым форматом, намного легче писать программы, а вероятность ошибок уменьшается. Сравнение каждого экземпляра документа с моделью гарантирует, что вы не столкнетесь с проблемой несоответствия. В документе обязательно должны быть поля. Например, в бланке заказа изделия необходимо указать почтовый адрес, чтобы знать, куда отправлять посылку.

Применение модели документа обеспечивает присутствие всех необходимых полей. Вы запрашиваете документы у людей, не знакомых с используемым приложением XML. Так как модель сама является документом, она может быть открытым ресурсом, доступным для загрузки, ссылок и передачи. Модель документа может выступать в качестве данных в средах создания структурированных документов, например, в редакторе XML. В такой программе редактор может автоматически вставлять необходимые поля и предлагать разработчику документа списки допустимых групп элементов.

Разработчику нужна надежная структура для развивающегося языка или семейства языков. Модель документа предоставляет простой способ создания стандарта, такого, например, как HTML Version 4.0. Отслеживание новых версий языка жизненно важно для программ XML, поскольку старые программы могут оказаться несовместимыми с более новыми версиями языка. Модели документов можно объединить для создания составных языков.

Например, DocBook использует модель таблиц CALS, а не пытается определить свою. Конечно, могут быть основания и не использовать модель документов. Сопровождение модели может оказаться неудобным, особенно в начале, когда язык подвергается тестированию и дальнейшей разработке. Она может замедлить обработку, например, если браузеры XML должны загружать модель документа из сети. Наконец, наличие авторитарной модели, указывающей, какие элементы можно использовать, а какие нет, может просто сломать стиль работы.

А, кроме того, нужно потратить силы на то, чтобы разработать модель или найти готовую, отвечающую потребностям. В конечном счете, автор сам решает, использовать модель документа или нет XML спроектирован так, что позволяет работать в любом случае. Некоторые модели документов а именно, DTD не очень хорошо работают с пространствами именпространства имен являются способом группировки элементов из различных источников, например, встраивания уравнений MathML внутрь документов HTML. Это создает проблемы, если DTD стремятся ограничить применяемые автором элементы предсказуемым конечным множеством. В настоящий момент исчерпывающего решения этой дилеммы нет. Невозможно предвидеть все виды пространств имен и объявить их элементы и атрибуты внутри своего DTD их может быть бесконечное число. 4.

– Конец работы –

Эта тема принадлежит разделу:

Трансформация XML документов

Сегодня количество приверженцев этой новой технологии возрастает очень стремительно. Несмотря на то, что XML очень молод международная организация… Когда осенью 1991 года Интернет впервые услышал о новой технологии, под… Сегодня для многих пользователей слово Интернет прочно ассоциируется с WWW и с уст специалистов не сходит тема…

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Структура XML-документа

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Структура XML-документа
Структура XML-документа. Хотя XML, сильно отличается по своим возможностям и предназначению от языка гипертекстовой разметки, оба эти языка являются подмножествами SGML, и, следовательно, наследуют

Моделирование XML-документов
Моделирование XML-документов. Одним из наиболее сильных свойств XML является возможность создавать собственные языки разметки, в которых определяются элементы и атрибуты, наилучшим образом соответс

Documents Type Definitions DTD
Documents Type Definitions DTD. В XML-документах DTD определяет набор действительных элементов, идентифицирует элементы, которые могут находиться в других элементах, и определяет действительные атр

Иллюстрационный пример
Иллюстрационный пример. Файл Clients.dtd parameter entities ENTITY basic.content PCDATA main elements ELEMENT clients client visitor ELEMENT client name, password, fullname, address, mail, age, e-m

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги