рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Для поисковых систем и Web-каталогов

Для поисковых систем и Web-каталогов - Лабораторная Работа, раздел Высокие технологии, Технология гипермедиа в Internet   Поисковые Системы Находят Сайт По Вводимым В Строке Запроса К...

 

Поисковые системы находят сайт по вводимым в строке запроса ключевым словам, которые соответствуют теме сайта. Одним из основных способов найти информацию в Internet являются поисковые машины. Поисковые машины посещают Web-страницы и заносят их в базы данных. Это позволяет пользователю, набрав некоторые ключевые слова и нажав «submit», увидеть, какие страницы удовлетворяют его запросу.

Каждая поисковая машина обладает рядом особенностей. Эти особенности следует учитывать при изготовлении своих страниц. «Полнотекстовые» поисковые машины индексируют каждое слово на Web-странице, исключая лишь некоторые стоп-слова. «Абстрактные» поисковые машины создают некий экстракт каждой страницы. Для Web-мастеров полнотекстовые машины полезней, поскольку любое слово, встречающееся на Web-странице, подвергается анализу при определении его релевантности к запросам пользователей. Для абстрактных поисковых машин может случиться, что страницы проиндексированы лучше, чем для полнотекстовых, что может исходить от алгоритма экстрагирования, например по частоте употребления в странице одних и тех же слов.

Поисковая системаЯндексна сегодняшний день является самой популярной русскоязычной поисковой системой(http://www.yandex.ru). Регистрация проводится по адресу http://yandex.ru/addurl.html. У Яндекса достаточно быстрый поисковый робот. База данных Яндекса имеет кластерную структуру и разнесена на несколько серверов, поэтому список результатов может меняться в зависимости от загруженности серверов.

Яндекс любит документы средних размеров, насыщенные текстом (статьи и т.п.). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в <alt> описании, но вес слов в этом тэге ниже. Хорошо индексируются страницы созданные скриптами .cgi, .php. Ключевые слова в мета-тэгах <keywords> и <description> не особенно помогают достигать хороших результатов. Здесь стоит употреблять слова, которые встретятся в тексте страницы.

Мета-тэг <description>, используется для выдачи описания страницы в результатах поиска. Это нужно учитывать при его составлении, так как, пользователь по этому описанию принимает решение посетить вас, или нет. Мета-тэги <revisit-after> и <content> не поддерживаются. Важно разместить ключевые слова в тэге <title>, заголовках (h1-h6), содержании страницы, <ALT>-тэгах.

Поисковая система Рамблер (http://www.rambler.ru) является следующей попопулярности поисковой системой. Регистрация анкета находится по адресу http://www.rambler.ru/doc/add_site_form.shtml. На Рамблере реализована система, которая позволяет выдавать в результатах поиска слова, которые являются синонимами запроса, и контекстную рекламу не только по конкретным ключевым словам, но и по фразам, которые тесно связаны с ними.

Рамблер (в отличие от других поисковиков) умеет извлекать гиперссылки из объектов Macromedia Flash. Если сайт имеет заставку или навигационные панели, выполненные c использованием этой технологии, Рамблер обработает их, найдет адреса всех страниц сайта и проиндексирует весь сайт. Однако, сами тексты flash-объектов не индексируются.

Роботы Рамблера игнорируют мета-тэги, кроме <meta name="robots"...>. Комментарии в документе роботы Рамблера тоже не сканируют.

Базовые понятия и ключевые для данного сайта слова целесообразно включать в следующие HTML-теги (в порядке значимости): <title>, <h1>...<h4>, <b>, <strong>, <u>.

Роботы Рамблера также справляются с конструкциями фреймов. Максимальный размер документа для роботов составляет 200 килобайт. Документы большего размера усекаются до указанной величины.

Поисковая машина Апорт (http://www.aport.ru/). Регистрация сайта в Апорте производится со страницы http://www.aport.ru/addurl.asp. Добавлять в поисковую систему Апорт следует русскоязычные сайты, а также сайты имеющие непосредственное отношение к российскому Интернету.

При просмотре содержимого сервера для индексирования Апорт обязательно проверяет файл ROBOTS.TXT. Так что можно использовать его, чтобы ограничить "деятельность" Апорта на своем сервере. Апорт по умолчанию не индексирует динамические документы, в адресах которых встречается символ "?".

Для документов HTML, кроме основного текста документа индексируются также: заголовок документа <TITLE>, ключевые слова <KEYWORDS>, описания страниц <DESCRIPTION> и подписи к картинкам <ALT>. Кроме того, Апорт индексирует как принадлежащие документу гиперссылки, так и текст гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами. Ключевые слова <KEYWORDS> не имеют определяющего значения при определении релевантности документа. Но разумное использование этого тэга рекомендуется.

Основными критериями, которые Апорт учитывает при сортировке сайтов, являются следующие: густота ключевых слов, расстояние между ключевыми словами в тексте документа, место, где встречаются поисковые слова (заголовок, описание, мета-тэг и т.п.), внешний вид шрифта, которым набраны ключевые слова (размер, жирность, цвет), количество ссылок из Internet на данный документ, использование ключевого слова в тексте ссылок из Internet на данный документ. Окончательный процент соответствия документа запросу строится как некая функция от всех этих показателей.

Поисковая система Google.com.ru (Google на русском) применяет общие правила индексирования к любому веб-содержанию, независимо от того принадлежит ли доменное имя к Рунету или нет.

Каталоги позволяют пользователям находить нужные им сайты, точно также, как они находят их с помощью поисковых серверов. Но есть существенные различия между каталогами и поисковыми серверами. Во-первых, в то время как поисковые машины принимают к регистрации почти любые сайты, без требований к качеству, каталоги, как правило, предъявляют требования к качеству и содержанию сайта. Во-вторых, в отличие от поисковых систем, в каталогах регистрируют, обычно, только главную страницу сайта.

Все каталоги имеют древовидную структуру. В ней существуют главные разделы, которые включают в себя подразделы и т.д. Чтобы зарегистрировать сайт, нужно найти тот раздел, который максимально подходит для темы сайта. Проще всего сделать это, введя в строку поиска ключевое слово по теме сайта. Из полученного списка сайтов, нужно выбрать подходящие разделы.

Наиболее популярными русскоязычными каталогами являются: Яндекс (http://yaca.yandex.ru/); Рамблер (http://www.rambler.ru), который в свою очередь, имеет две каталожные рейтинговые системы – Rambler's Top 100 (http://top100.rambler.ru/) и Rambler's TopShop (http://topshop.rambler.ru/), предназначенный только для интернет-магазинов; справочно-энциклопедический ресурс KM.RU (http/www.km.ru/), разработанный компанией «Кирилл и Мефодий»; каталог Mail.Ru.

– Конец работы –

Эта тема принадлежит разделу:

Технология гипермедиа в Internet

Лабораторная работа.. Технология гипермедиа в.. Цель работы Получить практическое представление о технологии гипермедиа в Internet о внутренней организации web документов и технологий их создания Получить..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Для поисковых систем и Web-каталогов

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Основные возможности гипермедиа систем в Internet
  Определяющую роль в решении задач, связанных с поиском информации и рекламированием web-сайтов, играют поисковые серверы. Однако ни один поисковый сервер не может гарантировать исче

Стандарты HTML
  Существуют несколько версий стандарта HTML: RFC 1866 — HTML 2.0, одобренный как стандарт 22 сентября 1995; HTML 3.2 — 14 января 1996; HTML 4.0 — 18 декабр

Полнотекстовые поисковые системы
Задачу поиска страниц, содержащих нужную информацию, решают полнотекстовые поисковые системы, которые имеют специальные программы, называемыми пауками или роботами. Они занимаются поиском страниц,

Метапоисковые системы
Современный Интернет в большинстве случаев не позволяет быстро и качественно ослеживать изменение страниц, поэтому пользователь может попасть на уже изменившуюся страницу или, что еще хуже, на уже

Структура и принцип действия поисковых систем Internet
  Поисковая система состоит из следующих основных компонентов: Spider, Crawler, Indexer, Database, Search Engine Results Engine. Spider(паук) - браузероподоб

Структура HTML-документа
Любой документ на языке представляет собой набор элементов разметки HTML или HTML-контейнеров, причём начало и конец каждого элемента обозначается тегами. Тег – это оформленная единица HTM

Методические указания к выполнению работы
  Тема документа и тип поисковой системы задается преподавателем. При создании документа необходимо учесть следующие свойства. Требованиям к структуре документа:

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги