рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Поиск информации в Интернет

Поиск информации в Интернет - раздел Образование, Концепции информации. 2 Поисковая Система – Это Комплекс Программ И Мощных Компьютеров, Автоматически...

Поисковая система – это комплекс программ и мощных компьютеров, автоматически просматривающих ресурсы Интернет, которые они могут найти, и индексирующих их содержание. Поисковые системы могут отличаться по эффективности поиска, по языку поиска (русский, английский и др.) и по некоторым другим возможностям. Например, одни поисковые системы находят информацию только в виде Web-страниц, другие могут просматривать и группы новостей, и файловые серверы. Результатом поиска являются гиперссылки на документы, содержащие требуемую информацию.

Наиболее известны следующие системы для поиска информации в международных информационных ресурсах:

Alta Vista (http://www.altavista.com/);

Google (http://www.google.com/);

Yahoo (http://www.yahoo.com/);

Infoseek (http://www.infoseek.com/);

Hot Bot (http://www.hotbot.com/)/.

Для поиска информации в российских информационных ресурсах:

Яндекс (http://www.yandex.ru/).

Рамблер (http://www.rambler.ru/);

Апорт (http://www.aport.ru/).

Для поиска информации в Интернет с использованием поисковой системы необходимо перейти на ее WEB - страницу, набрав электронный адрес или воспользоваться гипертекстовой ссылкой на эту систему.

Поисковые системы могут быть 2-х типов: универсальные и специализированные. Наиболее популярные современные поисковые системы сочетают в себе оба типа.

В универсальных системах используется обычный принцип поиска в неструктурированных документах - по ключевым словам. Ключевым словом (Keyword) документа называется отдельное слово или словосочетание, которое отражает содержание данного документа.

На начальной странице поисковой системы обычно расположено обширное меню тем и поле для ввода запроса, иногда можно задать язык для поиска. Для поиска документов по ключевому слову надо ввести это слово в поле для ввода запроса и нажать кнопку “Search” (или “Поиск” в русских системах), расположенную рядом с полем ввода. Для поиска можно использовать словосочетание; для этого надо словосочетание заключить в двойные кавычки. В некоторых системах можно осуществлять поиск по части слова, оставшаяся часть слова заменяется знаком “*”, как в шаблоне имени файла. Знаки “+” и “-” перед словом требуют обязательного присутствия или отсутствия этого слова в документе.

Существует также кнопка перехода к расширенному поиску (Advanced Search). Главное отличие расширенного поиска - использование в запросе логических операторов и круглых скобок. Для построения сложного запроса используются логические операторы AND (И), OR (ИЛИ), NOT (НЕТ) и NEAR (около; не далее чем в 10 символах). Логические операторы ставятся между словами или словосочетаниями. Здесь могут использоваться даты документов размер документов и другие критерии. Интерфейсы расширенного поиска у разных поисковых систем существенно отличаются; для наиболее эффективного использования нужно внимательно почитать раздел Advanced Search Help поисковой системы.

Поисковые системы обычно состоят из трех компонентов:

· поисковый робот (агент, паук или кроулер), который перемещается по сети и собирает информацию;

· база данных, которая содержит всю информацию, собираемую роботом;

· поисковый механизм, который используется как интерфейс для взаимодействия с базой данных.

Поисковые роботы - это специальные программы, которые занимаются поиском страниц в сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных.

При запросе к поисковой системе база данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме поиска, и выводит список ссылок на документы, соответствующих запросу. В этом списке представлены ссылки на различные Web-страницы, причем ссылки располагаются по степени убывания встреченных на данных страницах слов, совпадающих с ключевыми словами. При просмотре списка необходимо выбрать те страницы, которые нужно просмотреть. Некоторые системы составляют список ссылок по степени свежести страниц, другие же - по степени вероятности того, что данные страницы окажутся искомыми.

Специализированные справочные службы - это тематические каталоги, в которых собраны структурированные сведения об адресах серверов по той или иной тематике. Ссылки в такие каталоги заносятся не автоматически, а с помощью администраторов. Они стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. В результате пользователю не нужно самому собирать все ссылки по интересующему его вопросу, а достаточно найти этот вопрос в каталоге - работа по поиску и систематизации ссылок уже сделана за него. Как правило, хорошие каталоги Интернет обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам в своей базе данных, списки последних поступлений, списки наиболее интересных из них, выдачу случайной ссылки, автоматическое оповещение по электронной почте о свежих поступлениях.

Поисковые каталоги предназначены для поиска по темам. Обычно они построены по иерархическому принципу, т.е. каждый шаг поиска это выбор подраздела с более конкретной тематикой искомой информации. На нижнем уровне поиска пользователь получает относительно небольшой список ссылок на искомую информацию.

Для того чтобы обойти всю сеть, мощному роботу нужно от нескольких дней до нескольких недель. При этом составляется свежий и подробный индекс - опись доступных ресурсов. При каждом новом цикле индекс обновляется, и старые недействительные адреса удаляются. Однако автоматизированный подход приводит к тому, что индекс оказывается засоренным большим количеством профессионально слабых, неинформативных адресов, которые пользователь нередко и получает в результате поиска.

Каталоги составляются администраторами, просматривающими каждый новый сайт прежде, чем включить его в индекс. Качество информации каталогов выше, и нетематическая информация попасть в каталог просто не может; но коллектив редакторов может не поспевать за темпами расширения Интернета. Кроме того, чем дальше, тем больше в каталоге накапливается заброшенных или устаревших адресов - его не успевают чистить. В отличие от роботов, каталоги индексируют документ не по наиболее часто встречающимся словам, а по тем ключевым словам, которые вводятся администраторами.

Если пользователя интересует хорошо разработанная и часто востребуемая тема, популярный материал, то проще воспользоваться специализированным каталогом, обычно расположенным на первой странице каждой поисковой системы. Метод работы здесь как в обычной библиотеке: двигаясь от общего к частному, достигается список нужных сайтов. Для более специального поиска, как правило, необходимо использовать ключевые слова.

Помимо услуг по нахождению сайтов, поисковые системы предоставляют широкий перечень разнообразной сопутствующей информации, например: новости, гороскопы, почтовые ящики, электронная коммерция, котировки акций, погода, спорт, географические карты, программы телевидения, лотереи и т.д.

 

– Конец работы –

Эта тема принадлежит разделу:

Концепции информации. 2

Основные определения... Классификация информации... Количественное измерение информации Кодирование различных типов информации...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Поиск информации в Интернет

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Концепции информации
Существование множества определений информации обусловлено сложностью, специфичностью и многообразием подходов к толкованию сущности этого понятия. Существуют 3 наиболее распространенные концепции

Основные определения
Информатика - (от французского information - информация и automatioque - автоматика) - это область научно-технической деятельности, занимающаяся исследованием процессов получения, передачи, обработ

Количественное измерение информации
Двоичные символы могут кодироваться любым способом: буквами А, Б; словами ДА, НЕТ, двумя устойчивыми состояниями системы и т.д. Однако ради простоты записи были взяты цифры 1 и 0. Обработка информа

Кодирование различных типов информации
С помощью набора битов, можно представить любое число и любой знак. В информационных документах широко используются не только русские, но и латинские буквы, цифры, математические знаки и другие спе

Виды систем счисления
Римская система счисления является непозиционной системой. В ней для записи чисел используются буквы латинского алфавита. При этом буква I всегда означает единицу, буква - V пять, X - десять, L - п

Правила перевода чисел из одной системы счисления в другую
Перевод чисел из одной системы счисления в другую составляет важную часть машинной арифметики. Рассмотрим основные правила перевода. 1. Для перевода двоичного числа в десятичное необходимо

Этапы развития ЭВМ
Первая страница в истории создания вычислительных машин связана с именем французского философа, писателя, математика и физика Блеза Паскаля. В 1641-42 году он сконструировал механический вычислител

Поколения ЭВМ
Все этапы развития ЭВМ принято условно делить на поколения. Первое поколение создавалось на основе вакуумных электроламп, машина управлялась с пульта и перфокарт с использованием машинных

Принципы построения ЭВМ
Основные принципы построения ЭВМ были сформулированы американским учёным Джоном фон Нейманом в 40-х годах 20 века: 1. Любую ЭВМ образуют три основные компоненты: процессор, память и устрой

Состав системного блока
Системный блок – основная часть компьютера. Он состоит из металлического корпуса, в котором располагаются основные компоненты компьютера. С ним соединены кабелями клавиатура, мышь и монитор. Внутри

Центральный процессор
Центральный процессор - это центральное устройство компьютера, которое выполняет операции по обработке данных и управляет периферийными устройствами компьютера. У компьютеров четвёртого поколения и

Устройства памяти ЭВМ
Памятью компьютера называется совокупность устройств для хранения программ, вводимой информации, промежуточных результатов и выходных данных. Классификация памяти представлен на рисунке: &

Устройства ввода-вывода
Компьютер обменивается информацией с внешним миром с помощью периферийных устройств. Только благодаря периферийным устройствам человек может взаимодействовать с компьютером, а также со всеми подклю

Виды моделей
В зависимости от поставленной задачи, способа создания модели и предметной области различают множество типов моделей: 1. По области использования выделяют учебные, опытные, игровые, имитац

Этапы решения задач на ЭВМ
Первоначально ЭВМ были созданы для вычислений, но постепенно на ней стали решать задачи по физике, химии, биологии, управлению технологическими процессами, рисованию мультфильмов и т.д., т.е. для р

Алгоритм и его свойства
Алгоритмом называется точная инструкция исполнителю в понятной для него форме, определяющая процесс достижения поставленной цели на основе имеющихся исходных данных за конечное число шагов.

Способы записи алгоритмов
Для записи алгоритмов используют самые разнообразные средства. Выбор средства определяется типом исполняемого алгоритма. Выделяют следующие основные способы записи алгоритмов: - вербальный

Основные элементы алгоритмического языка
Основными понятиями в алгоритмических языках являются следующие. Имена (идентификаторы) - последовательность символов для обозначения объектов программы (переменных, массивов, функций и дp

Инструментальные системы программирования
Для популярных языков программирования на ЭВМ существует множество систем программирования. Программисты предпочитают те системы, которые легки в использовании, позволяют получить эффективные прогр

Краткий обзор прикладного программного обеспечения
Рассмотрим наиболее часто встречающееся прикладное ПО. Редакторы документов – это наиболее широко используемый вид прикладных программ. Они позволяют подготавливать документы гораздо быстр

Вспомогательные программы
Вспомогательные программы (утилиты) обычно предназначены не для решения конкретных пользовательских задач, а для обслуживания и повышения эффективности вычислительной системы. Кратко остановимся на

Операционные системы
Операционная система – это комплекс программ, обеспечивающих управление работой компьютера и его взаимодействие с пользователем. С точки зрения человека операционная система служит посредн

Операционная система Windows
На смену операционной системе MS DOS с ее графическими оболочками Windows 3.1 и Windows 3.11 пришли полноценные операционные системы семейства Microsoft Windows (сначала Windows 95, затем Windows 9

Информационные единицы баз данных
Объектами обработки СУБД являются следующие информационные единицы. Поле - элементарная единица логической организации данных, которая соответствует неделимой единице информации - реквизит

Модели данных
Ядром любой базы данных является модель данных. С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними. Модель данных - это совокупность структ

Типы СУБД
По технологии обработки данных базы данных подразделяются на централизованные и распределенные. Централизованная база данных хранится в памяти одной вычислительной системы. Если эта вычисл

Этапы проектирования баз данных
При разработке БД можно выделить следующие этапы работы. I этап. Постановка задачи. На этом этапе формируется задание по созданию БД. В нем подробно описывается состав базы, назна

Microsoft Access
Microsoft Access – одна из наиболее популярных СУБД для операционной системы Microsoft Windows . Кроме того, СУБД Access является мощной платформой разработки с гибкой и функциональной интегрирован

Средства защиты от вирусов
Для защиты от вирусов можно использовать: o Общие средства защиты информации, которые полезны также как страховка от физической порчи дисков, неправильно работающих программ или ошибочных

Разработка политики информационной безопасности
Политика безопасности определяется как совокупность документированных управленческих решений, направленных на защиту информации и ассоциированных с ней ресурсов. При разработке и проведени

Технические, организационные и программные средства обеспечения сохранности и защиты от несанкционированного доступа
Существует четыре уровня защиты компьютерных и информационных ресурсов: Предотвращение предполагает, что только авторизованный персонал имеет доступ к защищаемой информации и технологии.

Топология сетей
Топологией сети называется физическую или электрическую конфигурацию кабельной системы и соединений сети. В топологии сетей применяют несколько специализированных терминов: · узел сети - к

Модель взаимосвязи открытых систем
Основной задачей, решаемой при создании компьютерных сетей, является обеспечение совместимости оборудования по электрическим и механическим характеристикам и обеспечение совместимости информационно

Сетевое оборудование
Основными компонентами сети являются рабочие станции, серверы, передающие среды (кабели) и сетевое оборудование. Рабочими станциями называются компьютеры сети, на которых пользователями се

История развития Internet
В 1961 году Defence Advanced Research Agensy (DARPA – оборонное агентство передовых исследовательских проектов) по заданию министерства обороны США приступило к проекту по созданию экспериментально

Структура и принципы работы Интернет
Фактически, Интернет состоит из множества локальных и глобальных сетей, принадлежащих различным компаниям и предприятиям, работающих по самым разнообразным протоколам, связанных между собой различн

Протоколы передачи данных
Протокол - это набор соглашений, который определяет обмен данными между различными программами. Протоколы задают способы передачи сообщений и обработки ошибок в сети, а также позволяют разрабатыват

Подключение к Интернет
Подключением к Интернет называют соединение компьютера с сервером, который постоянно подключен к Интернет. Для подключения необходимы 5 основных составляющих: 1. Персональный комп

WWW и HTML
WWW (World Wide Web - всемирная паутина) – это служба, предоставляющая доступ к различным ресурсам Интернет – документам, графике, аудио и видеозаписям, использующая протокол HTTP и язык HTML.

Браузеры
Браузер - это программа для просмотра гипертекстовых документов и перехода от одного гипертекстового документа к другому. Основные функции браузеров следующие: o установка связи с

Электронная почта
Электронная почта (E-mail) - это служба передачи и приема текстовых сообщений или двоичных файлов в качестве вложенных с компьютера одного пользователя на компьютер другого пользователя средствами

Телеконференции. Чат. ICQ. Сетевой этикет
Телеконференции Телеконференции (или группы новостей) - это глобальные или локальные форумы, в которых люди с общими интересами обмениваются информацией, обсуждают различные темы и задают

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги