Для поисковых систем и Web-каталогов

 

Поисковые системы находят сайт по вводимым в строке запроса ключевым словам, которые соответствуют теме сайта. Одним из основных способов найти информацию в Internet являются поисковые машины. Поисковые машины посещают Web-страницы и заносят их в базы данных. Это позволяет пользователю, набрав некоторые ключевые слова и нажав «submit», увидеть, какие страницы удовлетворяют его запросу.

Каждая поисковая машина обладает рядом особенностей. Эти особенности следует учитывать при изготовлении своих страниц. «Полнотекстовые» поисковые машины индексируют каждое слово на Web-странице, исключая лишь некоторые стоп-слова. «Абстрактные» поисковые машины создают некий экстракт каждой страницы. Для Web-мастеров полнотекстовые машины полезней, поскольку любое слово, встречающееся на Web-странице, подвергается анализу при определении его релевантности к запросам пользователей. Для абстрактных поисковых машин может случиться, что страницы проиндексированы лучше, чем для полнотекстовых, что может исходить от алгоритма экстрагирования, например по частоте употребления в странице одних и тех же слов.

Поисковая системаЯндексна сегодняшний день является самой популярной русскоязычной поисковой системой(http://www.yandex.ru). Регистрация проводится по адресу http://yandex.ru/addurl.html. У Яндекса достаточно быстрый поисковый робот. База данных Яндекса имеет кластерную структуру и разнесена на несколько серверов, поэтому список результатов может меняться в зависимости от загруженности серверов.

Яндекс любит документы средних размеров, насыщенные текстом (статьи и т.п.). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в <alt> описании, но вес слов в этом тэге ниже. Хорошо индексируются страницы созданные скриптами .cgi, .php. Ключевые слова в мета-тэгах <keywords> и <description> не особенно помогают достигать хороших результатов. Здесь стоит употреблять слова, которые встретятся в тексте страницы.

Мета-тэг <description>, используется для выдачи описания страницы в результатах поиска. Это нужно учитывать при его составлении, так как, пользователь по этому описанию принимает решение посетить вас, или нет. Мета-тэги <revisit-after> и <content> не поддерживаются. Важно разместить ключевые слова в тэге <title>, заголовках (h1-h6), содержании страницы, <ALT>-тэгах.

Поисковая система Рамблер (http://www.rambler.ru) является следующей попопулярности поисковой системой. Регистрация анкета находится по адресу http://www.rambler.ru/doc/add_site_form.shtml. На Рамблере реализована система, которая позволяет выдавать в результатах поиска слова, которые являются синонимами запроса, и контекстную рекламу не только по конкретным ключевым словам, но и по фразам, которые тесно связаны с ними.

Рамблер (в отличие от других поисковиков) умеет извлекать гиперссылки из объектов Macromedia Flash. Если сайт имеет заставку или навигационные панели, выполненные c использованием этой технологии, Рамблер обработает их, найдет адреса всех страниц сайта и проиндексирует весь сайт. Однако, сами тексты flash-объектов не индексируются.

Роботы Рамблера игнорируют мета-тэги, кроме <meta name="robots"...>. Комментарии в документе роботы Рамблера тоже не сканируют.

Базовые понятия и ключевые для данного сайта слова целесообразно включать в следующие HTML-теги (в порядке значимости): <title>, <h1>...<h4>, <b>, <strong>, <u>.

Роботы Рамблера также справляются с конструкциями фреймов. Максимальный размер документа для роботов составляет 200 килобайт. Документы большего размера усекаются до указанной величины.

Поисковая машина Апорт (http://www.aport.ru/). Регистрация сайта в Апорте производится со страницы http://www.aport.ru/addurl.asp. Добавлять в поисковую систему Апорт следует русскоязычные сайты, а также сайты имеющие непосредственное отношение к российскому Интернету.

При просмотре содержимого сервера для индексирования Апорт обязательно проверяет файл ROBOTS.TXT. Так что можно использовать его, чтобы ограничить "деятельность" Апорта на своем сервере. Апорт по умолчанию не индексирует динамические документы, в адресах которых встречается символ "?".

Для документов HTML, кроме основного текста документа индексируются также: заголовок документа <TITLE>, ключевые слова <KEYWORDS>, описания страниц <DESCRIPTION> и подписи к картинкам <ALT>. Кроме того, Апорт индексирует как принадлежащие документу гиперссылки, так и текст гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами. Ключевые слова <KEYWORDS> не имеют определяющего значения при определении релевантности документа. Но разумное использование этого тэга рекомендуется.

Основными критериями, которые Апорт учитывает при сортировке сайтов, являются следующие: густота ключевых слов, расстояние между ключевыми словами в тексте документа, место, где встречаются поисковые слова (заголовок, описание, мета-тэг и т.п.), внешний вид шрифта, которым набраны ключевые слова (размер, жирность, цвет), количество ссылок из Internet на данный документ, использование ключевого слова в тексте ссылок из Internet на данный документ. Окончательный процент соответствия документа запросу строится как некая функция от всех этих показателей.

Поисковая система Google.com.ru (Google на русском) применяет общие правила индексирования к любому веб-содержанию, независимо от того принадлежит ли доменное имя к Рунету или нет.

Каталоги позволяют пользователям находить нужные им сайты, точно также, как они находят их с помощью поисковых серверов. Но есть существенные различия между каталогами и поисковыми серверами. Во-первых, в то время как поисковые машины принимают к регистрации почти любые сайты, без требований к качеству, каталоги, как правило, предъявляют требования к качеству и содержанию сайта. Во-вторых, в отличие от поисковых систем, в каталогах регистрируют, обычно, только главную страницу сайта.

Все каталоги имеют древовидную структуру. В ней существуют главные разделы, которые включают в себя подразделы и т.д. Чтобы зарегистрировать сайт, нужно найти тот раздел, который максимально подходит для темы сайта. Проще всего сделать это, введя в строку поиска ключевое слово по теме сайта. Из полученного списка сайтов, нужно выбрать подходящие разделы.

Наиболее популярными русскоязычными каталогами являются: Яндекс (http://yaca.yandex.ru/); Рамблер (http://www.rambler.ru), который в свою очередь, имеет две каталожные рейтинговые системы – Rambler's Top 100 (http://top100.rambler.ru/) и Rambler's TopShop (http://topshop.rambler.ru/), предназначенный только для интернет-магазинов; справочно-энциклопедический ресурс KM.RU (http/www.km.ru/), разработанный компанией «Кирилл и Мефодий»; каталог Mail.Ru.