рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Структура XML-документа

Структура XML-документа - Конспект Лекций, раздел Информатика, Конспект лекций по курсу Информационные технологии в предметной области. Основные понятия и определения ИТ Xml-Документ Состоит Из Деклараций, Элементов, Комментариев, Специальных Симв...

XML-документ состоит из деклараций, элементов, комментариев, специальных символов и директив.

ü Элементы и атрибуты

XML – это теговый язык разметки документов. Иными словами, любой документ на языке XML представляет собой набор элементов, причем начало и конец каждого элемента обозначается специальными пометками, называемыми тегами.

Элемент состоит из трех частей: начального тега, содержимого и конечного тега. Тег – это текст, заключенный в угловые скобки «<» и «>». Конечный тег имеет то же имя, что начальный тег, но начинается с косой черты «/». Пример XML-элемента:

<author>Сергей Довлатов</author>

Имена элементов зависят от регистра, т. е. <author>, <Author> и <AUTHOR> – это имена различных элементов. Наличие закрывающего тега всегда обязательно. Если тег является пустым, т. е. не имеет содержимого и закрывающего тега, то он имеет специальную форму:

<элемент/>

Любой элемент может иметь атрибуты, содержащие дополнительную информацию об элементе. Атрибуты всегда включаются в начальный тег элемента и имеют вид:

имя_атрибута= "значение_атрибута"

Атрибут обязан иметь значение, которое всегда должно быть заключено в одинарные или двойные кавычки. Имена атрибутов также зависят от регистра. Пример элемента, имеющего атрибут:

<author country="USA">Сергей Довлатов</author>

Элементы должны либо следовать друг за другом, либо быть вложены один в другой:

Здесь элемент books (книги) содержит два вложенных элемента book (книга), которые, в свою очередь, имеют атрибут isbn и содержат три последовательных элемента: title (название), author (автор) и present (есть в наличии), причем последний пуст, т. к. в данном случае соответствует логическому флажку.

Из приведенного описания видно, что синтаксис XML напоминает синтаксис HTML (что естественно, т. к. оба они являются диалектами одного языка SGML), но требования к оформлению правильных XML-документов выше. Еще одним очень важным отличием XML от HTML является то, что содержимое элементов, т. е. все, что содержится между начальным и конечным тегами, считается данными. Это означает, что XML не игнорирует символы пробела и разрыва строк, как это делает HTML.

ü Пролог и директивы

 
 

Любой XML-документ состоит из пролога и корневого элемента, например:

В этом примере пролог сводится к единственной директиве (первая строка документа), указывающей версию XML. За ней следует XML-элемент с уникальным именем, который содержит в себе все остальные элементы и называется корневым. Директива (processing instruction) — это выражение, заключенное в специальные теги «<?» и «?>», которое содержит указания программе, обрабатывающей XML-документ.

Стандарт XML резервирует только одну директиву
<?xml version="1.0"?>, указывающую на версию языка XML, которой соответствует данный документ (второй версии XML пока нет). В действительности, эта директива несколько богаче и в самом общем виде выглядит так:

<?xml version="1.0" encoding="ISO-8859-1" standalone="yes"?>

Здесь атрибут encoding задает кодировку символов документа. По умолчанию считается, что XML-документы должны создаваться в формате UTF-8 или UTF-16. Если же используется какая-либо другая кодировка символов, то ее название должно быть указано в данном атрибуте, как показано в примере. Атрибут standalone говорит о том, содержит ли данный документ внешние разделы. Значение yes означает, что таких разделов нет, значение no - что они есть.

В общем случае, пролог может содержать также декларации типа документа.

ü Комментарии

XML-документы могут содержать комментарии, которые игнорируются приложением, обрабатывающим документ. Комментарии строятся по тем же правилам, что и в HTML:

- начинается комментарий с символов "<!--",

- завершается комментарий символами "-->",

- внутри комментария не используются символы "--".

Пример комментариев:

ü Имена и данные

Все имена элементов, атрибутов и разделов должны начинаться с буквы Unicode и состоять из букв, цифр, символов точки (.), подчеркивания (_) и дефиса (-). Единственное ограничение состоит в том, что они не должны начинаться с комбинации букв xml в любом регистре; подобные имена зарезервированы для будущих расширений языка. Стандарт допускает использование в именах не только английских букв, но и любых других, хотя существующие XML-процессоры часто ограничены теми системами кодировок, которые в них заложены создателями. Поэтому мы в своих примерах пишем имена по-английски.

Данные, т. е. содержимое элементов и значения атрибутов, могут состоять из любых символов, кроме перечисленных:

ü Специальные символы

Ряд символов в языке XML зарезервирован и должен представляться специальным образом:

левая угловая скобка ("<") &lt;

правая угловая скобка (">") &gt;

амперсант ("&") &amp;

двойная кавычка (") в значениях атрибутов &quot;

одинарная кавычка (') в значениях атрибутов &apos;

При желании можно пользоваться числовой кодировкой символов в стандарте Unicode. При этом символ может быть задан своим десятичным кодом (&#код;) или шестнадцатеричным кодом (&#xкод;). Например &#169; представляет символ авторского права ©, а &#x410; – русскую букву А. XML гораздо богаче, чем HTML, в использовании подобных конструкций, поскольку позволяет осуществлять подстановку в текст документов любых символьных выражений.

ü Секции CDATA

Еще одним способом включения в содержимое XML-элементов недопустимых символов является использование т. н. секций CDATA (сокр. от Character DATA, т. е. символьные данные). Допустим, что мы хотим сделать содержимым элемента layout фрагмент HTML-текста, например:

Подобная конструкция неверна, т. к. HTML-тег H1 будет в данном случае воспринят как тег XML. Для того, чтобы все содержимое элемента layout воспринималось как данные, мы должны заключить его в секцию CDATA:

Как мы видим из этого примера, секция CDATA заключается в ограничители <![CDATA[ и ]]>. Все внутри этой секции считается символьными данными; в частности, секции CDATA не могут вкладываться друг в друга.

– Конец работы –

Эта тема принадлежит разделу:

Конспект лекций по курсу Информационные технологии в предметной области. Основные понятия и определения ИТ

Конспект лекций по курсу Информационные технологии в предметной области для... Составитель ст преподаватель кафедры МЭММБИ В В Ошкало...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Структура XML-документа

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Пути решения проблем
· Релевантность информации – создание глобальных мировых справочников типа Wikipedia, узкопрофильных и с разделенным доступом по уровням знаний пользователей. Ко многим

Процессы, связанные с поиском, хранением, передачей, обработкой и использованием информации, называются информационными процессами.
Исторически сложилось так, что процессы обработки информации автоматизировались, а их внутреннее содержание не изменялось. - Сбор информации – это деятельнос

Информационная система – это хранилище информации, снабженное процедурами ввода, поиска и размещения и выдачи информации.
Наличие таких процедур – главная особенность информационных систем, отличающих их от простых скоплений информационных материалов. Например, личная библиотека, в которой может ориент

Проблемы информатизации общества
1-й этап (до конца 60-х гг. ХХ века) характеризуется проблемой обработки больших объемов данных в условиях ограниченных возможностей программно-аппаратных средств. 2-й этап (

Преимущества применения компьютерных технологий
1-й этап (с начала 60-х гг. ХХ века) характеризуется довольно эффективной обработкой информации при выполнении рутинных операций с ориентацией на централизованное коллективное использование ресурсо

Инструментальные технологические средства
1-й этап (до второй половины XIX в.) – «ручные» технологии: перо, чернильница, книга, элементарные ручные средства счета. Коммуникации осуществлялись путем доставки конной почтой писем, паке

Тенденции развития ИТ
При традиционном подходе к организации, когда специализированные функции включаются последовательно одна за другой высокая эффективность недостижима. Быстрота реагирования на внешние изменения треб

Развитие ИТ и организационные изменения на предприятиях
Новые информационные технологии и реализованные на их основе информационные системы являются мощным инструментом для организационных изменений, которые «вынуждают» предприятия перепроектировать сво

Задачи, решаемые при использовании информационных компьютерных технологий на предприятии
1. Оптимизация выбора поставщиков; планирования и управления производством; моделей управления. 2. Снижение издержек производства; вероятности потери зака

Краткий обзор наиболее популярных информационных технологий
1. Технология баз данных (БД) и систем управления БД (СУБД). БД – достаточно большие наборы структурированных данных некоторой предметной области, представленные на машинных

Понятие предметной области
Предметная область – определенный фрагмент информационной системы, который будет воплощен в автоматизированной информационной системе. Информация о внешнем мире представляется в инф

Системы дистанционного банковского обслуживания
Он-лайновые платежные системы, предназначенные для немедленного приема платежа через Интернет можно разделить на три вида: 1. кредитные, 2. дебетовые 3. системы, работающ

Дебетовые системы
Дебетовые схемы платежей построены аналогично их оффлайновым прототипам: чековым и обычным наличным расчетам. Участники расчетов: · Эмитент – субъект, управляющий платежной

Цифровые наличные
Электронные деньги – это денежные обязательства эмитента в электронном виде, которые находятся на электронном носителе в распоряжении пользователя. Эмитент выпускает и

Преимущество электронных денег
· удобны при осуществлении массовых платежей небольших сумм (быстрый платеж, нет очередей, не надо выдавать сдачу, деньги переходят от плательщика к получателю быстро). Например, при плате

Недостатки электронных денег
· отсутствие устоявшегося правового регулирования · необходимость специальных инструментов хранения и обращения · как и в случае наличных денег, при физическом уничтожении носител

Использование карты переменных кодов
УНК и личный пароль используются при входе в систему «Телебанк», а переменный код служит для подтверждения проводимой операции и для дополнительной защиты при входе в систему. На оборотной

Использование ПО программа Inter-PRO
· Скачать программу Inter-PRO и инструкции к ней. · Установить программу на компьютер и применить указанные в инструкции настройки. · Сгенерировать секретный ключ и зарегистрирова

Современные биометрические решения в системах безопасности
Разработки систем безопасности ведутся в различных направлениях: · защита компьютерных сетей и серверов, · создание сложных многофункциональных систем безопасности, · био

Сервисы облачных вычислений
  Облачные вычисления (cloud computing) – централизованный, удаленный центр данных, в котором компьютерные ресурсы и мощности предоставляются конечному пользователю в качестве

Перспективные направления банковских ИТ
1. Виртуализация взаимодействия с клиентом (облачные вычисления) По оценкам экспертов, к концу 2016 г. половина крупных банков будут хранить важную информаци

Решение стратегических и тактических бизнес-задач на основе банковских ИТ
ИТ-тренды напрямую связаны с бизнес-трендами. Банки становятся более клиентоориентированными и выбирают инновационное ПО, без которого невозможно быстрое принятие решений при обслуживании

Конкуренция банков в области обслуживания клиентов
Выиграет банк, который предложит преимущества с точки зрения финансовых продуктов и сервиса. Рост популярности терминальных устройств, фронт-офисных систем, "электронных кассиров"

Текстовая информация. Модель документа Текстовые форматы
Существуют различные типы текстовых файлов (плоские, размеченные, ASCII и пр.). Для ввода, обработки, представления информации в таких файлах требуются различные программные возможности. Для работы

Типы файлов для размещения документов
Перечислим наиболее типичные файлы данных: ­ текстовые файлы – обобщенное название для простых и размеченных текстов, ASCII-файлов и других наборов данных символьной информации, кот

Форматы полнотекстовых документов. Модель документа
Понятие модель документа охватывает аспекты создания, преобразования, хранения, поиска, передачи и отображения документов. Принято рассматривать структуру документа в двух аспектах: логич

Языки разметки документов
В системах обработки текстов в документ включается дополнительная информация, называемая разметкой и выполняющая следующие функции: - выделение логических элементов данного документа;

Структура HTML-документа
HTML является стандартным языком, предназначенным для создания гипертекстовых документов в среде WWW. Первую версию HTML на базе языка SGML разработал сотрудник Европейской лаборатории физики элеме

Технологии XML
XML (eXtensible Markup Language) – это упрощенный диалект языка SGML, предназначенный для описания иерархических структур данных в World Wide Web. Он разрабатывается рабочей группой W

Применения XML
Несмотря на внешнюю простоту, XML обладает механизмами контроля правильности данных, позволяет производить проверку иерархических отношений внутри документа, и, самое главное, устанавливает единый

Декларация типа документа
Декларация типа XML-документа (document type declaration) содержит определение типа документа (document type definition, DTD) или указывает на него. DTD – это специальная грамм

Технологии электронных таблиц
Табличный процессор MS Excel– комплекс программ для управления электронной таблицей. Средствами табличного редактора можно выполнять обработку структурированной информации, проводить расчеты

Типы диаграмм
Гистограмма – позволяет сопоставить данные одного ряда, нескольких рядов, вычислить удельный вес каждой составляющей от общего итога или накопить общий итог по составляющим. Служит для отобр

Мультимедиа технологии
Мультимедиа(multimedia – многосредовость) – интерактивная технология, обеспечивающая работу с неподвижными изображениями, анимацией, видоеизображениями, текстовым и звуковым рядом.

Характеристика технологии World Wide Web
Термин Интернет (Internet – сокращение от английского выражения interconnected network) – сеть, объединяющая множество других компьютерных сетей и базируется на общей си

Базовые протоколы и адресация в Интернет
Передача данных по сети осуществляется на основе семейства протоколов TCP/IP. IP-протокол (Internetworking Protocol) – межсетевой протокол, отвечающий за передачу данных.

Электронная почта
E-mail (Electronic mail) – система для обмена электронными сообщениями (файлами), снабженными стандартным заголовком, является услугой отложенного чтения. Система электронной

Коммуникационные сервисы в режиме on-line
Коммуникационные сервисы, работающие в режиме реального времени, – on-line сервисы, или сервисы и программы для прямого межпользовательского общения: IRC (Internet Relay Chat), ICQ (I seek y

FTP-сервис
Для передачи файлов с удаленного компьютера на локальный в Интернет используется протокол передачи файлов FTP (File Transfer Protocol), с помощью которого можно обмениваться файлами с любым

Поиск информации в сети Интернет
Для поиска разного рода информации в Интернет существуют различные инструменты:поисковые машины (системы), индексированные каталоги (рубрикаторы), рейтинги, метапоисковые си

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги