рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Полнотекстовые поисковые системы

Полнотекстовые поисковые системы - Лабораторная Работа, раздел Высокие технологии, Технология гипермедиа в Internet Задачу Поиска Страниц, Содержащих Нужную Информацию, Решают Полнотекстовые По...

Задачу поиска страниц, содержащих нужную информацию, решают полнотекстовые поисковые системы, которые имеют специальные программы, называемыми пауками или роботами. Они занимаются поиском страниц, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют найденную информацию в базе данных. В Рунете наиболее известны поисковые машины Яндекс, Google и Рамблер.

Каждый поисковый механизм имеет собственный набор правил, определяющих, каким образом cобирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Другие игнорируют ссылки, которые ведут к графическим и звуковым файлам и т.д.

Важной задачей для робота, который собирает информацию о ресурсах для поисковой системы, является обнаружение как можно большего количества разнообразных ресурсов. Поэтому роботы зачастую используют в качестве оценки “полезности’’ ресурса глубину ссылок, т.е. количество промежуточных каталогов, упоминающихся в ссылке между именем Интернет-узла и именем самого ресурса. Чем больше глубина, тем ниже важность соответствующего ресурса. Такой подход позволяет быстро посетить стартовые и близкие к ним страницы на большом числе Интернет-узлов. Собранная таким образом информация заносится в базу данных и позволяет находить страницы с нужной информацией в том виде, когда ее в последний раз посещал робот.

 

– Конец работы –

Эта тема принадлежит разделу:

Технология гипермедиа в Internet

Лабораторная работа... Технология гипермедиа в... Цель работы Получить практическое представление о технологии гипермедиа в Internet о внутренней организации web документов и технологий их создания Получить...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Полнотекстовые поисковые системы

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Основные возможности гипермедиа систем в Internet
  Определяющую роль в решении задач, связанных с поиском информации и рекламированием web-сайтов, играют поисковые серверы. Однако ни один поисковый сервер не может гарантировать исче

Стандарты HTML
  Существуют несколько версий стандарта HTML: RFC 1866 — HTML 2.0, одобренный как стандарт 22 сентября 1995; HTML 3.2 — 14 января 1996; HTML 4.0 — 18 декабр

Метапоисковые системы
Современный Интернет в большинстве случаев не позволяет быстро и качественно ослеживать изменение страниц, поэтому пользователь может попасть на уже изменившуюся страницу или, что еще хуже, на уже

Структура и принцип действия поисковых систем Internet
  Поисковая система состоит из следующих основных компонентов: Spider, Crawler, Indexer, Database, Search Engine Results Engine. Spider(паук) - браузероподоб

Для поисковых систем и Web-каталогов
  Поисковые системы находят сайт по вводимым в строке запроса ключевым словам, которые соответствуют теме сайта. Одним из основных способов найти информацию в Internet являются поиско

Структура HTML-документа
Любой документ на языке представляет собой набор элементов разметки HTML или HTML-контейнеров, причём начало и конец каждого элемента обозначается тегами. Тег – это оформленная единица HTM

Методические указания к выполнению работы
  Тема документа и тип поисковой системы задается преподавателем. При создании документа необходимо учесть следующие свойства. Требованиям к структуре документа:

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги