рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Пошукові системи(класифікація і сфери використання).

Пошукові системи(класифікація і сфери використання). - раздел Высокие технологии, Кириченко А.А. Максимова Т.Ю. Бовт В.В. Інтернет-технології для бізнесу Пошук Необхідних Відомостей У Великому Об'ємі Досить Різноманітної Інформації...

Пошук необхідних відомостей у великому об'ємі досить різноманітної інформації - завдання, яке людство вирішує вже багато століть. У міру зростання об'єму інформаційних ресурсів були розроблені досить досконалі пошукові засоби і прийоми, що дозволяють знайти необхідний документ. В якості основного інструменту для пошуку інформації у бібліотеках використовуються каталоги(алфавітні, систематичні і предметні). Проте кожен інструмент має свої недоліки.

При великих об'ємах інформації(які характерні для Internet) пошук інформації стає дуже складною процедурою. Для того, щоб знайти потрібні відомості в Inemet необхідно мати спеціальні знання і навички. Фахівець, що має такі знання і навички і здійснюючий пошук інформації по замовленнях, що поступили, називається інформаційним брокером.

Він знає, як влаштовані класифікатори, як їх інтерпретують систематизаторы, які існують інструменти для пошуку інформації в Inemet, технологічні прийоми і методики пошуку, особливості різних пошукових машин і так далі. У бесіді із замовником він вивчає його інформаційну потребу і перетворює її на пошуковий припис. У нашій країні фахівці такого профілю - доки рідкість, хоча потреба в них вже відчувається.

 

 

 

У Internet доступні інформаційно-пошукові системи(ІПС) трьох типів : класифікаційні, словникові і предметні.

Класифікаційні ІПС використовують ієрархічну організацію інформації, яка описується за допомогою класифікатора. Розділи класифікатора називаються рубриками. У бібліотечній справі для цієї мети використовується, наприклад, систематичний каталог.

Класифікатор розробляється і удосконалюється колективом авторів. Потім його використовує інший колектив фахівців, званих систематизаторами, які, знаючи класифікатор, читають документи і приписують їм класифікаційні індекси, що вказують, яким розділам класифікатора ці документи відповідають. Як приклад класифікаційній ІПС в Internet можна назвати Yahoo! (www.yahoo.com)у якій одночасно працює більше 100 систематизаторов, Excite, Look Smart, Yellow Web, "Сузір'я Інтернет", "Ay".

Класифікаційні ІПС мають ряд специфічних недоліків. Розробка класифікатора пов'язана з оцінкою відносної важливості різних областей людської діяльності. Будь-яка оцінка є соціальною дією - вона пов'язана з суспільством, культурою, соціальною групою, до якої належить людина, що виробляє оцінку. Тому класифікатори створені різними колективами в різних країнах сильно розрізняються. Крім того, у систематизаторов виникають складнощі з інтерпретацією матеріалів, написаних на іноземних мовах(не лише початкових документів, але і класифікаторів). Оскільки абсолютно строгої класифікації не вдається зробити нікому, завжди існують документи, які можна віднести до декількох розділів класифікатора.

Систематизаторы в складних випадках(коли неясно, до якого з розділів має бути віднесений документ) застосовують два прийоми: відсилання і посилання. Відсилання(у Yahoo! вона позначається знаком @) поміщається в тих розділах класифікатора, в які не потрапив цей документ, - в ній вказується, до якої рубрики він віднесений систематизатором. Посилання використовується в тих випадках, коли аналогічна інформація може знаходитися в інших розділах класифікатора.

Словникові ІПС використовують базу даних, побудовану із слів, що зустрічаються в документах Internet 'а. У такій базі при кожному слові зберігається список документів, з яких воно узяте. Оскільки усі морфологічні одиниці в словнику впорядковані, пошук потрібного слова може виконуватися досить швидко, без послідовного перегляду.

По одному слову знайти необхідну інформацію досить складно. Тому, кожна словникова ІПС має свою мову запитів, що дозволяє комбінувати слова, що найбільш повно характеризують шукану інформацію.

До словникових ІПС Internet 'а відносяться такі, як Alta Vista, Rambler, Япеех, Апорт.

Словникові ІПС здатні видавати списки документів, мільйони посилань, що містять. Навіть простий перегляд таких списків скрутний. Тому багато словникових ІПС надають можливість ранжирування результатів пошуку - найбільш важливі документи поміщаються в початок списку.

У мові запитів таких ІПС передбачені спеціальні засоби, наприклад, в режимі складного пошуку в Alta Vista можна вказати перелік термінів, які підвищують ранг знайденого документу(що для цієї ІПС особливо актуально, оскільки вона показує тільки перші 200 знайдених документів). Rambler і Япс1ех дозволяють вказати вагу кожного з термінів, що дозволяє досить точно настроювати порядок дотримання знайдених документів.

У предметних ІПС з пошуковим чином пов'язані списки ресурсів Мережі, що містять потрібну інформацію і посилання на близькі за тематикою сайти. У таких ІПС створюються кільцеві посилальні структури. Так, сервер www.webring.org містить декілька десятків тисяч тематичних кілець (середній розмір кільця - близько 12 серверів але є і кільця-гіганти, до складу яких входять тисячі серверів). Поки кільця були невеликими, пошук інформації труднощів не представляв. Для полегшення пошуку на вказаному сервері використовуються свої класифікаційна і словникова ІПС, що допомагають знайти необхідну інформацію.
За допомогою інформаційно-пошукових систем можна шукати цілком певні інформаційні об'єкти, список яких приведений на мал. 2.

 

Опис пошукових систем.

Пошукова система Alta Vista.

У кожної пошукової системи існує своя мова запитів, яка визначає правила, відповідно до яких формулюються запити на пошук інформації.

У класифікаційних і словникових ІПС запит складається на основі ключових слів, які є найбільш яскравою характеристикою шуканої інформації(по суті, без цих слів ця інформація обійтися не може). Краще, якщо ці ключові слова мають специфічний сенс, властивий тільки шуканому інформаційному матеріалу, що відрізняє цей матеріал від усіх інших.

Пошукова система AltaVista відноситься до розряду словникових ІПС і є однією з самих інформаційно насичених. Звернутися до неї можна по адресах:

http://www.altavista.digital.com/

http://altavista.telia.com/tgi - bin/telia7country=ru&lang=ru(ця адреса дозволяє звернутися до пошукової системи, працюючої російською мовою);

http://home.microsoft.com/intl/ru/access/allinome.asp(за цією адресою міститься доступ до декількох пошукових машин, у тому числі - працюючим російською мовою).

 

 

Мал. 2. Пошукові об'єкти в Internet

Розглянемо правила складання пошукових запитів, використання операторів і команд в мові запитів системи AltaVista :

1) Запит на пошук інформації(пошуковий припис) є пошуковим образом.

2) Пошуковий образ може складатися з одного або декількох ключових слів.

3) Залежно від способу з'єднання ключових слів в пошуковому запиті розрізняють прості і складні запити.

4) Складний запит відрізняється від простого тим, що в нім можна вказати дату створення шуканого документу(щоб виділити матеріали, що мають останнє оновлення після вказаної дати), спеціальну логіку пошуку(визначувану використанням операторів AND, OR, NOT, NEAR), вибрати один з трьох варіантів впорядковування результатів пошуку при їх виведенні : "тільки в якості підсумку", "компактна форма", і "стандартна форма"(остання використовується за умовчанням), і використати круглі дужки для виділення логічно самостійних частин запиту.

5) Ключових слів можуть набиратися на різних регістрах клавіатури - залежно від цього пошукова машина буде по- різному проводити пошук.

Наявність в ключовому слові заголовної букви змусить пошукову машину при простому пошуку шукати слова саме з таким написанням, як в запиті. Якщо ж заголовні букви не використовувалися, то пошукова машина враховує будь-які варіанти написання цих слів. Наприклад, якщо пошуковий припис складається з одного слова Computer, будуть знайдені інформаційні матеріали, що містять це слово саме в такому зображенні. Якщо ж це слово не міститиме заголовних букв, то при пошуку враховуватимуться слова в таких зображеннях, як computer, COMPUTER, COMPuter, та ін. Необхідно враховувати, що при використанні пошукового образу, що складається тільки з одного слова computer, AltaVista надає близько 2000 посилань.

Проглянути таку кількість посилань практично неможливо, тобто інформаційний пошук не можна вважати ефективним(при правильно складеному запиті необхідна інформація знаходиться в числі перших двох десятків посилань).

6) У тому випадку, якщо невідоме правильне написання слова, або інтерес представляє безліч однокорінних слів, використовується оператор невизначеності -(зірочка). Поставивши цей символ після будь-якої послідовності букв(не менше три), вплив яких необхідно врахувати при пошуку, можна здійснити широкий пошук, при якому ключове слово модифікуватиметься : пошук буде весьтись як для жорстко вказаної до зірочки сукупності букв, так і для слів, що містять будь-які букви(числом до 5) замість зірочки.

Наприклад, якщо вказати ключове слово comp*, те при пошуку враховуватимуться, як ключові - computer, computers, compute, та ін.

7) Для з'єднання декількох ключових слів можуть використовуватися оператори "пропуск", "лапки", логічні оператори " ", AND, OR, NOT, NEAR.

8) Оператор "пропуск" сполучає слова в пошуковому приписі таким чином, що для пошуку кожне з цих слів використовується окремо. При цьому, порядок слів в запиті не має значення. В процесі пошуку враховується тільки відстань кожного слова від початку документу і частота його використання в документі.

9) Оператор "лапки" сполучає слова так, що вони утворюють фразу, в якій усі вказані в приписі слова в документі стоять поряд один з одним і в тій же послідовності, як це вказано в приписі. Тому, якщо задати пошуковий припис у вигляді слів "personal computer" і у вигляді "computer personal", то результати пошуку будуть різними.

10) Оператор " ", сполучає слова, повідомляє пошукову машину, що в документі необхідно шукати основне слово(перше), але документ потрібно показувати в результаті пошуку тільки якщо далі в тексті трапляються інші слова з пошукового припису. Оператор ставиться безпосередньо перед кожним другорядним словом. Наприклад, по пошуковому образу:

computer personal digital

вестиметься пошук основного слова computer, але текст вважатиметься актуальним тільки якщо в нім трапляються так само слова personal і digital.

11) Оператор стоїть перед словом, означає, що основне слово повинне використовуватися в тексті без другорядного. Наприклад, пошуковий припис computer - personal повідомляє пошукову машину, що потрібно шукати основне слово computer, але в тексті не повинне зустрічатися слово personal(тобто цікавлять матеріали про комп'ютери, але не персональних).

12) Оператори AND, OR, NOT, NEAR використовуються в складних запитах.

13) Оператор AND(замість нього можна використати символ &) визначає, що слова, що сполучаються ним, повинні зустрічатися разом(тобто в простих запитах він еквівалентний знаку " ").

14) Оператор OR(замість нього можна використати знак "|") визначає, що слова, що сполучаються ним, незалежні один від одного(у простих запитах він еквівалентний пропуску).

15) Оператор NOT означає заперечення(у простих запитах він еквівалентний знаку "-").

16) Оператор NEAR(замість нього можна використати символ "~") визначає, що в шуканому тексті вказане їм ключове слово знаходиться від основного не далі, чим на 10 слів (наприклад, в пошуковому приписі:

провайдер* NEAR "дуже дешево" передбачається, що в шуканому тексті слово "провайдер" і словосполучення "дуже дешево" знаходяться не в різних кінцях тексту, а поруч один з одним - між ними може знаходитися не більше 10 слів).

17) Для обмеження пошуку використовуються спеціальні команди(теги) : anchor, applet, title, url, host, link, image, from, subject.

18) Команда anchor дозволяє знайти в Мережі слово, що міститься в "тілі" посилання. Для цього після команди anchor через двокрапку вказується шукане слово. Наприклад, пошуковий образ містить:

anchor: home

По цьому запиту буде знайдено усю безліч сторінок, що містять усередині посилань слово home, у тому числі - і в такому посиланні: "If you would like go home, press here".

19) Команда applet дозволяє знайти заданий назвою модуль Java. Наприклад, якщо модуль Java називається word, то знайти його можна, записавши пошуковий образ: applet: word .

20) Команда title використовується у тому випадку, якщо шукане слово знаходиться в заголовку тексту. Наприклад, за запитом виду:

title: links

будуть знайдені документи, що містять слово links в заголовку, у тому числі текст із заголовком "Cool Links".

21) Команда url пропонує шукати url- адресу, що містить задане слово. Наприклад, якщо невідомо, в якому кореневому домені знаходиться host- комп'ютер МЭСИ, можна задати пошуковий припис: url: mesi . Серед безлічі адрес з таким словом буде і адреса http://www.mesi.ru/.

22) Команда host дозволяє дізнатися, які Web- сайти є на заданому host- комп'ютері. Наприклад, для того, щоб дізнатися, які сайти є на хості www.intel.ru необхідно набрати запит: host: intel.ru . Якщо ж в запиті вказати тільки частину імені, то в результаті пошуку будуть знайдені сайти, що мають інші адреси, але що містять задану частину імені.

Використовуючи цю команду, можна вести пошук в заданій країні. Наприклад, за запитом host: *.ru kreml буде знайдено інформація про Московський, Рязанський і інших Кремлях. При цьому треба пам'ятати, що пошук ведеться тільки для сайтів, зареєстрованих в пошуковій системі AltaVista, інші сайти їй недоступні.

23) Команда link дозволяє знайти адреси сторінок(сайтів), що утримують посилання на конкретну(задану в пошуковому образі) Web - сторінку. Наприклад, для того, щоб дізнатися, хто посилається на сайт www.mesi.ru необхідно задати припис: link:www.mesi.ru . Результатом буде список сторінок, на яких містяться посилання на сайт mesi.ru .

24) Команда image дозволяє знайти ілюстрацію в Internet. Для цього потрібно знати назву файлу, в якому вона зберігається. Формат команди той же.

25) Команда from дозволяє шукати в телеконференціях Usenet поштове повідомлення, відправлене конкретною людиною, ім'я якої вказується після двокрапки в команді. Наприклад: from :Иван Федоров(чи Ivan Fedorov).

26) Команда subject дозволяє шукати повідомлення в телеконференціях Usenet на конкретну, задану в пошуковому приписі тему.

Пошукова система AltaVista може працювати(і вести пошук) на різних мовах, у тому числі і на росіянинові.

Описані принципи управління пошуковою системою багато в чому аналогічні використовуваним і в інших пошукових системах.

– Конец работы –

Эта тема принадлежит разделу:

Кириченко А.А. Максимова Т.Ю. Бовт В.В. Інтернет-технології для бізнесу

Нтернет технології для бізнесу... Зміст... Глава Види Інтернет представництв...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Пошукові системи(класифікація і сфери використання).

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Введення
Значення нових інформаційних технологій, пов'язаних з використанням Internet для бізнесу, важко переоцінити. У поточному році місткість інформаційного Internet - ринку в США склала 300 млрд. доларі

Web присутності в Інтернет.
Основне його завдання - оголосити світу про існування цієї фірми. Таке оголошення має певний комерційний сенс, оскільки наявність своєї Web - сторіночки створює певний імідж фірмі, вона виглядає со

Web для просування товарів і послуг.
Це передусім - засіб масової інформації, оскільки основними інструментами просування товарів і послуг є publicity, advertising, public relations - дисципліни, які в зарубіжних Внз вивчаються при пі

Web електронної комерції.
Web цього типу є електронним магазином, що називається іноді віртуальним магазином або віртуальним прилавком. Такий Web повинен містити домашню сторіночку з переліком послуг, що надаються відвідува

Web сервісного і гарантійного обслуговування.
Сервісне і гарантійне обслуговування клієнтів може здійснюватися з Web - сайту, побудованого аналогічно сайтам, розглянутим в п.п. 1.2 - 1.4. Але може знадобитися і спеціальна функція Internet - ти

Web внутріфірмового навчання співробітників.
Web - сайти для внутріфірмового навчання співробітників мають спеціальну організацію, в якій значне місце займає захист від несанкціонованого доступу. Web - сайт робиться закритим, тобто доступ до

Web віртуального співтовариства фірми.
У західних компаніях вводяться спеціальні посади для відстежування цільової аудиторії. Таку аудиторію треба знайти, сформувати, притягнути на свій сайт, утримати. Після цього її можна використати д

Web для спільного проектування.
Цей Web призначений для організації спільної роботи фахівців, що знаходяться на значній відстані один від одного. Для спільної роботи необхідно мати загальний погоджений з усіма план дій. Кожен уча

Представництв фірм.
Internet - це "мережа мереж". Це не глобальна обчислювальна мережа, а структура, що об'єднує глобальні обчислювальні мережі. Спочатку вважалося, що глобальна обчислювальна мережа

Адресація ресурсів Internet.
Ресурсами Internet є host - машини, машини - клієнти, програми(наприклад, сервер WWW, сервер FTP, та ін.), інформаційні ресурси(файли на серверах, host - машинах і машинах - клієнтах). Усі

Призначення і сфера застосування протоколів електронної пошти.
На host- комп'ютері ISP виділяються поштові скриньки для користувачів, в яких накопичується уся кореспонденція, що приходить для них. При підключенні користувача до вузла(host- комп'ютеру

Отримання пошти.
Для перевірки утримуваної поштової скриньки потрібне активироватьпрограмму Internet Mail, і в її основному вікні клацнути по кнопці "Переслати(Send and Receive). Програма починає підключення д

Створення відповіді на лист
Відповідь на листи, що прийшли, необхідно складати так, щоб той, що отримав його міг згадати, про що йшла мова раніше. Для цього відповідь повинна містити цитати з попередньої кореспонденції. Для с

Електронний автопідпис листа.
Під електронним автопідписом розуміється текст(чи файл), який автоматично вставляється в кінець написаного листа. Для створення такого підпису в основному вікні програми Internet Mail виби

Адресна книга.
При активній роботі з електронною поштою накопичується велика кількість адрес. Програма Internet Mail дозволяє зберігати ці адреси і пов'язану з ними інформацію в адресній книзі. Звернення

Пересилка файлів по e - mail.
Електронна пошта призначена для пересилки текстових повідомлень, що не містять серед текстових символів практично ніяких службових знаків. При спробі передачі по електронній пошті двійкови

Служба FTP.
Комунікативну функцію в Internet виконує електронна пошта(electronic mail, або скорочено e - mail). Другою основною функцією є зберігання інформації. Ця функція знайшла в Internet своє відображення

Використання видалених ресурсів(Telnet).
За допомогою Telnet можна встановити зв'язок з іншим комп'ютером і використати його можливості в інтерактивному режимі. Це простий сервіс, одна з найстаріших технологій Internet. Програма - клієнт

Телеконференції(News).
У 1979г. була реалізована ідея аспірантів з університетів Дюка і Кароліни, що шукали можливість обміну інформацією між комп'ютерами своїх учбових закладів. Спочатку для такого обміну використовував

Безпосереднє спілкування(IRC).
Internet дозволяє не лише отримувати різноманітну інформацію і обмінюватися повідомленнями, але і спілкуватися в реальній масштабі годині з будь-яким користувачем мережі, де б він не знаходився. Ця

Всесвітня павутина(WWW).
Свій початок цей вид сервісу веде з березня 1989г., коли Тім Бернерс-Ли з CERN запропонував керівництву цього міжнародного європейського наукового центру концепцію нової розподіленої інформаційної

Пошукова система Yandex.
У 1997г. за адресою: http://www.yandex.ru відкрилася нова російська пошукова машина Yandex(чи Яndex). По набору своїх пошукових можливостей вона не поступається найскладнішим пошуковим машинам Захо

Засоби архівації і відновлення інформації.
Архівація файлів - це спосіб зменшення їх розмірів(стискування). Архівація потрібна для скорочення об'єму інформації при розміщенні її на магнітних носіях, і для скорочення часу на передачу файлів

Гіпертекст, послідовність створення гіпертекстових систем.
Ідея гіпертексту була описана в 1945 році Vannevar Bush в його пропозиціях по створенню електромеханічної інформаційної системи Мешех. У 1965г. Ted Nelson ввів в обіг сам термін "гіпертекст&qu

Архітектура сервісу WWW.
Сервіс WWW(Word Wide Web, або 3W - "всесвітня павутина") дозволяє організувати величезну кількість інформації в компактне сховище з легким доступом до наявних матеріалів. Найменш

WYSIWYG - системи проектування Web- сайтів.
Абревіатура WYSIWIG(від What You See Is What You Get) означає системи, в яких екранна форма не програмується, а "збирається" на екрані. Після закінчення складання форми система сама сотав

Склад, структура і функціональні можливості FrontPage.
Пакет FrontPage призначений для створення не дуже складних Web- сайтів. Він складається з трьох частин: редактора FrontPage Editor, провідника FrontPage Explorer, і WEB- сервера Microsoft Personal

Провідник FrontPage(FrontPage Explorer).
FrontPage Explorer(Провідник) здатний відображати Web- сайт на трьох різних панелях: структурній панелі(Outline View), панелі зв'язків(Link View) і загальної панелі(Summary View), що дозволяють бач

Редактор FrontPage(FrontPage Editor).
Інформаційне наповнення сторінок може бути виконане за допомогою FrontPage Editor або інших засобів(наприклад, Word 97). Проте, FrontPage Editor має більше можливостей. Можливості FrontPag

Динамічні Web- документи.
Динамічна сторінка - це сторінка, зміст якої створюється автоматично, "на льоту". При вступі запиту на неї сервер за допомогою спеціально передбаченого механізму(CGI) звертається до корпо

Засоби гіпертекстової розмітки.
Гіпертекстова розмітка застосовується для вказівки, в якій частині екрану і яким чином має бути відображений текст і як пов'язані між собою тексти, що становлять гіпертекстову базу даних. З цими ці

Wеb-представительство.
Зовнішні умови визначають, хто буде основним відвідувачем сайту; які джерела інформації є "своїми" для типового відвідувача, стиль викладу матеріалу в цих джерелах, точка зору, загальний

Контроль даних, що вводяться.
Введені користувачем дані мають бути в обов'язковому порядку піддані контролю, оскільки в середньому кваліфікований оператор припускається однієї помилки на 10 введених символів(кваліфікованим є оп

Тестування сайту.
Після того, як робота над сайтом завершена, необхідно провести його тестування. Сайт є складною конструкцією, до його перевірки необхідно підходити з різних сторін, виявлені при перевірці недоліки

Дослідження ефективності сайту.
Починати дослідження ефективності створеного сайту необхідно з першого ж його "робочого дня". При дослідженні ефективності сайту необхідно отримувати і фіксувати наступну інформацію: скіл

Основна
1. Н.Рэнделл, Д. Джонс "Mikrosoft FrontPage. Якнайповніше керівництво", C- Пб, BHV, 1997. 2. Луіс Кан, Лаура Коган "Мій вузол WEB", М., "Російська Редакція",

Додаткова
7. А.Чупалов "Як заробляти гроші в Інтернет", С-П., Пітер, 1997. 8. Винс Имери "Як зробити бізнес в Інтернет", Київ, Комиздат, 1997. 9. Дэ.Хеллер, До.Хеллер &q

Глоссарій
Гіпертекст - засіб з'єднання інформації, що міститься в одному документі, з інформацією з того ж документу. Глобальна обчислювальна мережа - мережа великої протяжності. Як правило включає

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги