Структура языка HTML.

HTML –язык гипертекстовой разметки - состоит из операторов (тегов), которые окружают некоторый текстовый или графический объект, определяя его расположение, форму, размеры, цвет, параметры анимации и т.д.

Современные средства разработки страниц типа Microsoft FrontPage дают возможность из готовых текстовых и графических объектов с помощью кнопок и команд меню оформить страницы, автоматически расставляя нужные теги.

Однако большинство Web-мастеров используют для своей работы и редакторы, и написание текстов непосредственно на HTML, чаще всего в "Блокноте" (Notepad) из Windows.

Документ должен начинаться тегом <HTML> и заканчиваться закрывающим тегом </HTML>. Между ними должны находится теги <HEAD> открывающий и </HEAD> закрывающий с названием и заголовком, а также <BODY> открывающий и </BODY> закрывающий с текстом страницы. Название страницы на латинском языке ограничивается тегами <TITLE> открывающий и </TITLE> закрывающий.

Таким образом, страница имеет вид:

<HTML> <HEAD> <TITLE> Welcome to my home page </TITLE> </HEAD> <BODY> Содержимое странички </BODY> </HTML>

В заголовке страницы между тегами <HEAD> и </HEAD> можно указывать тег <META>. Тег <META> содержит определенную информацию о страничке, на которой он находится. В нем может содержаться информация, предписывающая броузеру просматривать эту web-страницу в той или иной кодировке или загружать через определенное время другую страницу, информация об авторе, о программе, создавшей эту страницу. Кроме того, тег <META> помогает в навигации в Интернете, т.к. большинство поисковых систем обрабатывают информацию, специально вставленную в этот тег. Поэтому рекомендуется использовать этот тег для увеличения посещаемости странички. Тег имеет очень широкую область применения. Наиболее важные аспекты его применения перечислены ниже.

В HTML используется набор 8-разрядных однобайтовых символов ISO 8859/1, который также известен как Латинский алфавит № 1(Latin-1). Это набор из 256 символов, который содержит много графических элементов и символов с диакритическими знаками, необходимых для текстов на большинстве европейских языков, в том числе и на английском. Младшие 128 кодов символов ISO 8859/1 практически те же, что и в ASCII, и этот поднабор иногда называют International Reference Version, или ISO-646. На практике из-за ограниченного набора символов клавиатуры и в целях переносимости на другие процессоры и платформы большинство документов HTML содержат знаки только из первой половины кодовой таблицы ASCII. В издательской деятельности часто необходимы многие иные символы, например с диакритическими знаками или преобразованные другим способом, значки валют, торговой марки и копирайта, не входящие в набор ASCII. Кроме того, в языке HTML символы угловых скобок < и > используются как символы, открывающие и закрывающие тег, поэтому они не могут использоваться в тексте (например для отображения математических выражений). Та же проблема и с символами "(кавычка) и &(амперсанд). Для отображения таких символов используются так называемые "escape-последовательности", которые могут использоваться для кодирования символов, не входящих в таблицу ASCII и входящих в команды HTML. В спецификациях HTML эти escape-последовательности называются символьными объектами (character entities).

Escape-последовательность: &lt; &gt; &amp; &quot.

Отображаемый символ: < > & "

Специальные символы могут также кодироваться цифровой escape- последовательностью, где число соответствует коду символа ISO 8859.

Последовательность: &#60; &#62; &#38; &#34; &#169; &#174.

Отображаемый символ: < > & " © R

Рассмотрим некоторые общие операции, необходимые для подготовки Web страниц.

Задание отображения страницы. Связано с проблемой кодовых страниц. Компьютер все "понимает" только в виде чисел. А как написать буквы? Как сопоставить буквы числам? Для этого используются кодовые страницы. Это таблица, в которой по вертикали и горизонтали записаны цифры, а в - ячейках буквы. Компьютер получает цифры, подставляет их в эту таблицу и получает буквы. Проблема заключается в том, что таких таблиц существует множество (особенно много их в России). Наиболее популярными считаются КОИ-8 и Windows-1251. Если web-страничка написана в одной кодировке, а броузер читает ее в другой, то получается полная ЕПСМДЮ (слово "ерунда" в кодировке КОИ-8).

Перед публикацией страниц в Интернете необходимо уточнить, какие кодовые страницы поддерживает тот сервер, на котором будет размещена страница. Если создана страница, например в Windows-1251, а нужно КОИ-8, то следует использовать какой-либо редактор (например, FrontPage) и сохранить страницу в нужной кодировке или использовать специальные перекодировочные программы. Для того, чтобы броузер показывал страницу именно в той кодировке, которая нужна, используется тег <META HTTP- EQUIV = "Content -type" CONTENT="text/html; charset=windows-1251"> или charset=KOI-8.

Автозагрузка страниц.

Существует два метода. Первый перезагружает страницу через определенное время. Второй вызывает другую страницу через определенный интервал. Первый метод часто используется для страниц с автоматически обновляемой информацией (например, виртуальные камеры). Второй - для демонстрации страниц как слайдов, в презентации.

Для реализации первого метода используется тег <META HTTP-EQUIV="refresh" CONTENT=x>, где x - количество секунд, по прошествии которых страница будет перезагружена. Этот тег должен использоваться только в заголовке страницы (между тегами <HEAD> и </HEAD>). Для реализации второго метода используется тег <META HTTP-EQUIV="refresh" CONTENT="x url=адрес">, где x - время в секундах, по истечению которого будет загружена страница, расположеная по адресу (например http: // www. loft.lv). Можно на странице, указанной в атрибуте url разместить такой же тег, указывающий на другую страницу и т.д. Это проведет пользователя по всем страницам презентации.