Любой документ на языке представляет собой набор элементов разметки HTML или HTML-контейнеров, причём начало и конец каждого элемента обозначается тегами.
Тег – это оформленная единица HTML-кода. Например, <HEAD>, <FONT ...>, <BODY>, <HTML> и так далее. Имя конечного (закрывающего) тега идентично имени начального (открывающего) тега, но перед именем конечного тега ставится косая черта «/». Например, вышеуказанным открывающим тегам соответствуют закрывающие теги </HEAD>, </FONT>, </BODY>, </HTML>.
Элемент – более емкое понятие, обозначающее пару тегов и участок документа между тегами, на который распространяется их влияние.
Элементы могут быть пустыми, то есть не содержат никакого текста и других данных (например, тег перевода строки <br>). В этом случае обычно не указывается закрывающий тег. Кроме того, элементы могут иметь атрибуты, определяющие какие-либо их свойства (например, размер шрифта для элемента font). Атрибуты указываются в открывающем теге. Вот примеры фрагментов HTML-документа:
<strong>Текст между двумя тегами — открывающим и закрывающим.</strong>
<a href="http://www.example.com">Здесь элемент содержит атрибут href.</a>
А вот пример пустого элемента: <br>
Регистр, в котором набрано имя элемента и имена атрибутов, в HTML значения не имеет (в отличие от XHTML). Элементы могут быть вложенными. Например, следующий код:
<b>
Этот текст будет жирным,
<u>а этот ещё и подчёркнутым</u>
</b>
даст такой результат:
Этот текст будет жирным, а этот ещё и подчёркнутым
Кроме элементов, в HTML-документах есть и сущности (англ. entities) — «специальные символы». Сущности начинаются с символа амперсанда и имеют вид &имя; или &#NNNN;, где NNNN — код символа в Юникоде в десятичной системе счисления.
Например, © — знак авторского права (©). Как правило, сущности используются для представления символов, отсутствующих в кодировке документа, или же для представления «специальных» символов: & — амперсанда (&), < — символа «меньше» (<) и > — символа «больше» (>), которые некорректно записывать «обычным» образом, из-за их особого значения в HTML.
Каждый HTML-документ, отвечающий спецификации HTML какой-либо версии, должен начинаться со строки декларации версии HTML <!DOCTYPE…>, которая обычно выглядит примерно так:
· <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
· <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
Эта строка поможет браузеру определить, как правильно интерпретировать данный документ. В первом случае документ HTML соответствует международной спецификации версии 4.01, во втором – версии XHTML 1.0. Если эта строка не указана, то добиться корректного отображения документа в браузере становится трудно.
После объявления версии и типа документа необходимо обозначить его начало и конец. Это делается с помощью элемента-контейнера HTML. Внутри тегов <html> и </html> должны находиться теги заголовка (<head></head>) и тела (<body></body>) документа (рис. 1).
Рис. 1.Структура документа HTML
Документ состоит из двух основных блоков – заголовка и тела документа. Заголовок определяется с помощью элемента HEAD, а тело с помощью элемента BODY.