Структура HTML-документа

Любой документ на языке представляет собой набор элементов разметки HTML или HTML-контейнеров, причём начало и конец каждого элемента обозначается тегами.

Тег – это оформленная единица HTML-кода. Например, <HEAD>, <FONT ...>, <BODY>, <HTML> и так далее. Имя конечного (закрывающего) тега идентично имени начального (открывающего) тега, но перед именем конечного тега ставится косая черта «/». Например, вышеуказанным открывающим тегам соответствуют закрывающие теги </HEAD>, </FONT>, </BODY>, </HTML>.

Элемент – более емкое понятие, обозначающее пару тегов и участок документа между тегами, на который распространяется их влияние.

Элементы могут быть пустыми, то есть не содержат никакого текста и других данных (например, тег перевода строки <br>). В этом случае обычно не указывается закрывающий тег. Кроме того, элементы могут иметь атрибуты, определяющие какие-либо их свойства (например, размер шрифта для элемента font). Атрибуты указываются в открывающем теге. Вот примеры фрагментов HTML-документа:

<strong>Текст между двумя тегами — открывающим и закрывающим.</strong>

<a href="http://www.example.com">Здесь элемент содержит атрибут href.</a>

А вот пример пустого элемента: <br>

Регистр, в котором набрано имя элемента и имена атрибутов, в HTML значения не имеет (в отличие от XHTML). Элементы могут быть вложенными. Например, следующий код:

<b>

Этот текст будет жирным,

<u>а этот ещё и подчёркнутым</u>

</b>

даст такой результат:

Этот текст будет жирным, а этот ещё и подчёркнутым

Кроме элементов, в HTML-документах есть и сущности (англ. entities) — «специальные символы». Сущности начинаются с символа амперсанда и имеют вид &имя; или &#NNNN;, где NNNN — код символа в Юникоде в десятичной системе счисления.

Например, &copy; — знак авторского права (©). Как правило, сущности используются для представления символов, отсутствующих в кодировке документа, или же для представления «специальных» символов: &amp; — амперсанда (&), &lt; — символа «меньше» (<) и &gt; — символа «больше» (>), которые некорректно записывать «обычным» образом, из-за их особого значения в HTML.

Каждый HTML-документ, отвечающий спецификации HTML какой-либо версии, должен начинаться со строки декларации версии HTML <!DOCTYPE…>, которая обычно выглядит примерно так:

· <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"

"http://www.w3.org/TR/html4/strict.dtd">

· <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

Эта строка поможет браузеру определить, как правильно интерпретировать данный документ. В первом случае документ HTML соответствует международной спецификации версии 4.01, во втором – версии XHTML 1.0. Если эта строка не указана, то добиться корректного отображения документа в браузере становится трудно.

После объявления версии и типа документа необходимо обозначить его начало и конец. Это делается с помощью элемента-контейнера HTML. Внутри тегов <html> и </html> должны находиться теги заголовка (<head></head>) и тела (<body></body>) документа (рис. 1).

 

 

Рис. 1.Структура документа HTML

 

Документ состоит из двух основных блоков – заголовка и тела документа. Заголовок определяется с помощью элемента HEAD, а тело с помощью элемента BODY.