рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Поиск в Internet.

Поиск в Internet. - раздел Связь, По дисциплине Современные средства ЭВМ и телекоммуникаций Поисковой Машиной Называется Программа, Используемая На Web-Узле Для П...

Поисковой машиной называется программа, используемая на Web-узле для поиска информации. Поисковая машина создает базу данных, систематически устанавливая связь с различными Web-узлами, проверяя их содержание и добавляя ссылки на новые страницы. Компоненты поисковой машины, непрерывно зондирующие Internet, иногда называют пауками или червями.

Поисковый узел (поисковая страница) - это Web-страница, позволяющая проводить поиск информации в Web. Поисковые узлы предоставляют список ссылок, которые указывают на Web-страницы и другие ресурсы, соответствующие запросу. Основой поискового узла является установленная на нем поисковая машина, так что иногда понятия «поисковый узел» и «поисковая машина» считают синонимами.

Web-порталом называется Web-узел, предлагающий доступ к различным ресурсам Internet через большое количество систематизированных и регулярно обновляемых гиперссылок. Слово «портал» пришло в Internet из архитектуры и имеет значение «главный вход». Имеется в виду, что Web-портал целесообразно указывать в качестве стартовой страницы броузера. Обычно Web-порталы предлагают много рекламной информации, что позволяет окупить расходы на их содержание. В настоящее время понятия «поисковый узел» и «Web-портал» являются почти синонимами, т.к. большинство популярных порталов включают поисковые машины.

 

Таблица 2.2. Наиболее популярные поисковые узлы

Русскоязычные Англоязычные
http://www.yandex.ru, http://www.rambler.ru, http://go.mail.ru, http://www.aport.ru.   http://www.altavista.com, http://www.yahoo.com, http://www.snap.com, http://www.lycos.com  

 

 

Ряд порталов позволяет использовать при поиске поисковые машины других порталов.

Существуют два основных способа поиска нужной информации через Web-портал: по каталогу и по ключевым словам. В настоящее время большинство поисковых узлов предоставляют возможность гибко комбинировать эти два способа.

При поиске по каталогу или по теме (категории) база данных поисковой машины представляется как иерархическая структура, составляемая на основе анализа тега Meta в заголовках Web-страниц (об этом теге будет рассказано в теме 4).

В каталог обычно включаются не все страницы базы, а только наиболее популярные (наиболее посещаемые). Рейтинг популярности страницы определяется по показаниям специальных программ – счетчиков посещений, серверная часть которых устанавливается на поисковых узлах, а клиентская – на каждом сайте, владелец которого пожелал участвовать в таком измерении популярности. Участие сайта в той или иной программе измерения рейтинга популярности отображается соответствующим значком.

В последнее время помимо счетчиков посещений все шире используется другой способ оценки рейтинга - на основе индекса цитирования. Этот способ измерения популярности сайта более объективен, т.к. дает меньше возможностей искусственного накручивания рейтинга и блокирует «положительную обратную связь» - лавинообразное возрастание рейтинга сайта, случайно в какой-то момент получившего популярность.

Наиболее популярные счетчики перечислены в таблице 2.3.

Таблица 2.3.

Значок счетчика Описание. Адрес портала.
Счетчик статистики портала mail.ru http://mail.ru
Счетчик статистики портала rambler.ru http://rambler.ru
Счетчик статистики компании Spylog http://spylog.ru
Счетчик статистики Hotlog http://hotlog.ru
Счетчик индекса цитирования портала Яндекс. http://yandex.ru

 

Рассмотрим примеры поиска информации по каталогу.

Предположим, необходимо найти провайдера для подключения к Internet. Заходим на узел Rambler (http://www.rambler.ru), в каталоге Рейтинг Top 100 находим раздел Провайдеры, щелкаем по ссылке и получаем список наиболее популярных провайдеров, отсортированный по убыванию рейтинга популярности на основе статистики посещений. Аналогичный список можно получить и на узле Яндекс (http://www.yandex.ru à Hi-Tech à Internet à провайдеры), но здесь этот список будет составлен на основе индекса цитирования. Можно убедиться, что два полученных списка довольно сильно отличаются друг от друга. Это отличие возникает из-за разницы оценок при помощи статистики посещений и индекса цитирования.

Пример поиска новостей с помощью категорий.

Открыть основную страницу узла http://www.yandex.ru. В списке категорий щелкнуть на Новости. В списке появившихся подкатегорий щелкнуть на одной из подкатегорий, а затем по конкретной странице. Просмотреть новости. Щелкнуть по кнопке Назад (Back) несколько раз пока не появится основная страница.

Рассмотрим теперь поиск по ключевым словам. При таком поиске база данных представляется как простая совокупность Web-страниц. Для реализации поиска по ключевым словам поисковые машины создают на своих серверах архивы текстовых частей просмотренных Web-страниц.

Как правило, поисковые узлы предоставляют два формата поиска по ключевым словам – простой и расширенный.

Для осуществления простого поиска по ключевым словам необходимо ввести нужные слова в поисковую строку, т.е. в текстовое поле, которое каждая поисковая машина содержит в верхней части страницы, и нажать кнопку Найти (Поиск, Search). Обычно по умолчанию задан тип поиска, допускающий падежное изменение ключевых слов и расположение ключевых слов в тексте на некотором (но не очень большом) расстоянии друг от друга. Поисковая машина ищет совпадение комбинации символов темы поиска с одной из записей в базе данных: адресом одной из Web-страниц, её заголовком, словами из краткого описания страницы, одним или несколькими ключевыми словами, относящимися к данной Web-странице. Если ключевое слово состоит только из прописных букв, то оно считается аббревиатурой, не изменяющейся по падежам. Например, задав в строке поиска слово МФЮА и нажав кнопку Найти мы получим список всех страниц из базы Яндекса, в которых есть упоминание о Московской финансово-юридической академии.

Горячим списком называют список ссылок на те Web-страницы, одна из записей которых в базе данных совпадает с темой поиска.

Чем выше в списке находится ссылка на Web-страницу, тем более точно запись о ней в базе данных соответствует запросу, т.е. тема совпадает с большим количеством записей в базе данных или больше степень совпадения по количеству совпадающих символов в слове, совпадающих слов и сочетаний слов в теме и в записях. Иногда рядом со ссылкой стоит степень соответствия темы записям о Web-странице в базе данных. Полезными бывают обычно только первые 20 ссылок.

Рекомендуется при поиске информации использовать основную форму слова (существительные и прилагательные в именительном падеже, глаголы в неопределенной форме). Например, тема букет позволяет найти страницы, содержащие слова букет и букеты. Тема букеты уже не позволяет найти страницы, содержащие слово букет.

Корректно использовать прописные буквы так, как они пишутся на самом деле: Apple Talk; Front Page.

Максимальная конкретность в изложении темы ускоряет поиск, например, немецкая овчарка, а не собака или овчарка.

Некоторые узлы отображают Текстовые поля для ввода темы поиска только на Главной странице, другие - на всех страницах.

Пример простого поиска: Перейти к узлу www.altavista.com. Ввести тему поиска – DaVinchi. Щелкнуть на любой из ссылок. Щелкнуть на кнопке Назад (Back) и вернуться к Горячему списку. Прокрутить список вниз, чтобы увидеть следующую группу ссылок.

Расширенный поиск - более глубокий поиск. Его можно выполнить с помощью логических операторов. Оператор – символ, применяемый для определенного действия, показывающего, как будут трактоваться группы из нескольких слов, взятых в качестве темы поиска. При соединении слов с помощью операторов И, (And), (+), (&&) выполняется поиск страниц, или слов, содержащих только сочетания выбранных слов, соединенных с помощью И, (And), (+), (&&); при соединении слов с помощью операторов ИЛИ, (Or) - одно и более слов, соединенных ИЛИ, (Or); при соединении слов с помощью операторов НЕТ, (Not) - слово, слова или их сочетания, кроме тех слов или их сочетаний, которые стоят после НЕТ, (Not).

При соединении слов разными операторами, их сочетания отделяются круглыми скобками.

Когда вводится просто набор слов (боксёр собака порода), большинством поисковых машин это соединение трактуется как применение оператора И, (And), (+), (&&).

Однако, некоторые поисковые машины применяют сначала оператор И, (And), (+), (&&), а затем оператор ИЛИ, (Or). Другие поисковые машины могут осуществлять поиск по совпадению целой фразы (при определенном во фразе порядке следования слов). В отдельных поисковых машинах возможно указание темы поиска (запроса) на естественном языке (правда, они не всегда корректно трактуются поисковыми узлами). Действует правило: перед использованием операторов надо найти соответствующее указание на поисковом узле, обычно это надпись-кнопка Advansed Search Syntax.

 

Пример:

1. Загрузить поисковый узел (Главную страницу Web-узла).

Ввести тему поиска: star or track. Появятся страницы о фильме Star Track, а также страницы, содержащие слова star и( или) track.

Ввести тему поиска: star and track. Появятся только страницы о фильме Star Track.

Ввести полное название фильма, заключенное в кавычки “Star Track”. Посмотреть, какие будут изменения относительно результатов предыдущего поиска.

Повторить поиск для тем:

(боксер or победитель) not собака;

(боксер not собака) or победитель.

 

 

– Конец работы –

Эта тема принадлежит разделу:

По дисциплине Современные средства ЭВМ и телекоммуникаций

На сайте allrefs.net читайте: По дисциплине Современные средства ЭВМ и телекоммуникаций. Учебное пособие..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Поиск в Internet.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Информационные технологии и общество.
1.1.1. Понятие "информационное общество". С точки зрения основных видов деятельности, основных технологий, основных предметов труда, основных видов конечного про

Internet как глобальная информационная среда.
Для существования развитого индустриального общества нужна единая общемировая хозяйственная среда. Для информационного общества требования к общемировой интеграции гораздо выше. Глобальная общемиро

Internet и информационные технологии.
Рассмотрим основные информационные технологии, которые в настоящее время наиболее активно развиваются в сети Internet. Их можно разделить на несколько больших категорий. 1. Базовые техн

История возникновения сети Internet.
Предысторию возникновения сети Internet следует начать с 1957г., когда департаментом передовых технологий ARPA (Advanced Research Project Agency) военного ведомства США был начат проект по компьюте

Пакеты данных (информационные пакеты).
Пакетный способ передачи данных был разработан Полом Бэрэном в 1960 г. и сейчас является основой работы любой сети. Суть его состоит в том, что любые данные передаются в виде последователь

Протоколы.
Понятие протокола - это одно из основных понятий, возникающее при описании любых сетевых технологий. Для реализации процесса передачи информации от абонента A1 абоненту A2 необходимо, чтобы между A

Информационные уровни. Стеки протоколов.
Согласно вышесказанному, информация в процессе передачи по сети подвергается нескольким видам преобразований: из файлов формируются прикладные пакеты, которые превращаются в сначала в датаграммы, а

Упрощенная (трехуровневая) модель стека протоколов.
OSI-модель задает идеологию построения стека протоколов, но не является обязательным стандартом. Реально существующие стеки протоколов хотя и следуют в общих чертах модели OSI, но не воспроизводят

Клиенты и серверы.
Определим несколько важных понятий. Internet работает на основе взаимодействия программ-клиентов и программ-серверов. Программа-клиент - это программа, форматирующая запрос

Система доменных имен (DNS).
Для адресации в Internet можно пользоваться IP‑адресом, так как в быту пользуются телефонными номерами. Однако, все привыкли к тому, что в компьютере файлам присваиваются символьные имена. Эт

Прикладной информационный уровень. Прикладные ресурсы.
Для пользователя наибольший интерес представляет прикладной информационный уровень, т.к. пользователь непосредственно работает с объектами, относящимися именно к этому уровню. До сих пор н

Электронная почта.
Это один из двух наиболее распространенных в настоящее время прикладных ресурсов. Электронная почта – это прикладной ресурс Internet, имеющий дело с данными в виде прикладных пакето

Структура адреса электронной почты.
Для того, чтобы абоненты могли обмениваться сообщениями через электронную почту, у каждого из них должен быть уникальный адрес. Структура адреса электронной почты ( e-mail – адреса) имеет вид, прив

Электронная почта через Web.
Существует возможность использовать электронную почту в рамках прикладного ресурса World Wide Web по протоколу НТТР. В Internet есть Web-серверы, работающие как почтовые серверы – Web /

Ресурс WWW.
Подавляющее число пользователей Internet работает с прикладным ресурсом World Wide Web (или сокращенно WWW), который по-русски называют Всемирной паутиной. WWW был разработан сначала в Цен

Структура URL - адреса.
Для вызова элемента прикладного ресурса нужно обратиться к тому серверу, на котором этот элемент расположен. Сервер является узлом Internet, и к нему можно обратиться по доменному имени или IP-адре

Компьютерные сети.
1.3.1. Классификация компьютерных сетей. Internet состоит из компьютерных сетей. По размерам и возможностям сети делятся на

Компьютерные коммуникации. Использование телефонных сетей для передачи данных.
Для передачи данных между удаленными компьютерами необходимы средства передачи сигнала на большие расстояния, т.е. средства компьютерной коммуникации. Упрощенно в любом средстве компьютерн

Навигация в Internet.
При запуске Web-броузера в окне Адрес будет адрес начальной страницы (например, http://www.mfua.ru ). Начальной может быть и пустая страница. Для перехода от начальной Web-страницы

Сохранение результатов поиска.
Для печати полной Web-страницы вызываются последовательно Меню à Файл à Печать à Выдача на печать Web-страницы по отдельным листам. Другой

Тема 3. Работа с электронной почтой.
3.1. Основы электронной почты. Электронная почта или e-mail - это средство для передачи электронных сообщений между пользователями сети; она предоставляет всем абонентам сети возмож

Работа с программой электронной почты.
При составлении писем и их чтении лучше работать в диалоговом или автономном режиме, а подключаться к Inernet-у только при отправке сообщений и копировании из почтового ящика сервера на компьютер.

HTML-документы и Web-страницы.
HTML-документы представляют собой файлы с расширением html. Если открыть такой документ при помощи какого-нибудь простого редактора, например, при помощи блокнота и сравнить его с тем, что в

Структура языка HTML.
HTML –язык гипертекстовой разметки - состоит из операторов (тегов), которые окружают некоторый текстовый или графический объект, определяя его расположение, форму, размеры, цвет, параметры анимации

Форматирование текста.
В HTML предусмотрено 6 стандартных размеров шрифта для оформления заголовков. Они устанавливаются при помощи тегов: <H1>Заголовок стиля 1</H1>; <H2>Заголовок сти

Вставка рисунков.
Вставка рисунка на страницу из файла в формате gif или jpg выполняется тегом <IMG> с атрибутами, перечисленными ниже. <IMG SRC="имя файла или полного пути в Интернете "

Вставка гиперссылок.
Текстовые и графические ссылки могут указывать на удалённые разделы в пределах одного большого документа. Для таких ссылок необходимо создать две части: якорь и непосредственно ссылку. Якорь опреде

Списки.
Заголовок списка создаётся тегом <LH>, за которым следует текст. Теги <LI> и </LI>обозначают элемент списка. Для создания ненумерованного списка используется тег

Таблицы.
На данном этапе развития методов форматирования Web-страниц таблицы являются мощнейшим средством компоновки контента. Края таблицы могут быть невидимыми, тогда пользователь даже не понимает, что ис

Фреймовые структуры.
Большинство современных броузеров могут показывать в одном окне несколько отдельных страниц. Достигается это разбиением страницы на кадры или фреймы. В каждом кадре может выводиться отдельная стран

Регистрация сайта в поисковых системах и каталогах.
После создания и размещения сайта в Internet-е необходимо позаботиться о том, чтобы сведения о нём стали доступны пользователям Internet-а. Для этого необходимо послать заявки в поисковые серверы с

Коммерческое использование Web-страниц.
Традиционный бизнес включает этапы: выпуск новой продукции, реклама, маркетинг, выпуск продукции на рынок в широком объёме, распространение продукции по регионам, послепродажная поддержка. После оз

Баннеры и баннерная реклама.
Баннер представляет собой простое или анимированное изображение, образующее ссылку на ресурс Internetа. Оформляется баннер как графическая ссылка. <A HREF = “http:// URL-адрес ресурса “

Электронная коммерция.
Представляет собой коммерческую деятельность, в которой взаимодействие между участниками на всех этапах осуществляется электронным способом. Схема взаимодействия участников электронной коммерции по

Электронный документооборот.
Внедрение компьютеров в делопроизводство привело к возникновению технологий обработки электронных версий документов и к использованию компьютерных сетей для перемещения документов между исполнителя

Электронная подпись.
Рукописная подпись является одним из основных реквизитов документа. Она подтверждает достоверность сведений документа и идентифицирует личность. Для повышения степени защиты сведений, изложенных в

Электронные деньги.
Деньги появились в результате развития натурального товарного обмена как всеобщий эквивалент. Самостоятельной стоимости они не имеют, но наделяются принудительным курсом, назначаемым государством.

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги