рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Структура и принцип действия поисковых систем Internet

Структура и принцип действия поисковых систем Internet - Лабораторная Работа, раздел Высокие технологии, Технология гипермедиа в Internet   Поисковая Система Состоит Из Следующих Основных Компонентов: ...

 

Поисковая система состоит из следующих основных компонентов: Spider, Crawler, Indexer, Database, Search Engine Results Engine.

Spider(паук) - браузероподобная программа, которая скачивает Web-страницы. Она это делает тем же способом, что и браузер пользователя. Отличие состоит в том, что браузер отображает информацию, содержащуюся на странице (текстовую, графическую и т.д.), паук же не имеет никаких визуальных компонент и работает напрямую с html-текстом страницы.

Crawler (краулер, «путешествующий» паук) - программа, которая автоматически проходит по всем ссылкам, найденным на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer(индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их. Выделяются и анализируются различные элементы страницы, такие как текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т.д.

Database(база данных) - хранилище скачанных и обработанных страниц. Иногда базу данных называют индексом поисковой системы.

Search engine results engine(система выдачи результатов) - извлекает результаты поиска из базы данных. Система выдачи результатов занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы. Это происходит согласно алгоритмам ранжирования поисковой системы.

Web-server(веб-сервер) - осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы. Как правило, на сервере присутствует html-страница с полем ввода, в котором пользователь может задать интересующий его поисковый термин. Web-сервер также отвечает за выдачу результатов пользователю в виде html-страницы. Детальная реализация поисковых механизмов может отличаться друг от друга (например, связка Spider+CrawleH-Indexer может быть выполнена в виде единой программы, которая скачивает известные Web-страницы, анализирует их и ищет по ссылкам новые ресурсы).

 

– Конец работы –

Эта тема принадлежит разделу:

Технология гипермедиа в Internet

Лабораторная работа.. Технология гипермедиа в.. Цель работы Получить практическое представление о технологии гипермедиа в Internet о внутренней организации web документов и технологий их создания Получить..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Структура и принцип действия поисковых систем Internet

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Основные возможности гипермедиа систем в Internet
  Определяющую роль в решении задач, связанных с поиском информации и рекламированием web-сайтов, играют поисковые серверы. Однако ни один поисковый сервер не может гарантировать исче

Стандарты HTML
  Существуют несколько версий стандарта HTML: RFC 1866 — HTML 2.0, одобренный как стандарт 22 сентября 1995; HTML 3.2 — 14 января 1996; HTML 4.0 — 18 декабр

Полнотекстовые поисковые системы
Задачу поиска страниц, содержащих нужную информацию, решают полнотекстовые поисковые системы, которые имеют специальные программы, называемыми пауками или роботами. Они занимаются поиском страниц,

Метапоисковые системы
Современный Интернет в большинстве случаев не позволяет быстро и качественно ослеживать изменение страниц, поэтому пользователь может попасть на уже изменившуюся страницу или, что еще хуже, на уже

Для поисковых систем и Web-каталогов
  Поисковые системы находят сайт по вводимым в строке запроса ключевым словам, которые соответствуют теме сайта. Одним из основных способов найти информацию в Internet являются поиско

Структура HTML-документа
Любой документ на языке представляет собой набор элементов разметки HTML или HTML-контейнеров, причём начало и конец каждого элемента обозначается тегами. Тег – это оформленная единица HTM

Методические указания к выполнению работы
  Тема документа и тип поисковой системы задается преподавателем. При создании документа необходимо учесть следующие свойства. Требованиям к структуре документа:

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги