рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Пошукова система Yandex.

Пошукова система Yandex. - раздел Высокие технологии, Кириченко А.А. Максимова Т.Ю. Бовт В.В. Інтернет-технології для бізнесу У 1997Г. За Адресою: Http://www.yandex.ru Відкрилася Нова Російська Пошукова ...

У 1997г. за адресою: http://www.yandex.ru відкрилася нова російська пошукова машина Yandex(чи Яndex). По набору своїх пошукових можливостей вона не поступається найскладнішим пошуковим машинам Заходу, спеціально розрахована на російськомовні запити і враховує особливості російської лексики, пропонує дещо більше можливостей для інтелектуального пошуку.

Аналогічно AltaVista, Yandex розрізняє заголовні і прописні букви. Якщо ключове слово написане прописними буквами, то пошукова машина не розрізняє прописні і заголовні букви, т.е при завданні ключового слова computer в пошуку враховуватимуться і Computer, і COMPUTER, та ін. Тоді, як якщо в пошуковому образі міститиметься хоч би одна заголовна буква, при пошуку братимуться до уваги тільки слова, що мають це зображення.

У Yandex немає необхідності використати оператор невизначеності(аналогічний зірочці в AltaVista), оскільки при завданні ключового слова прописними буквами в процесі пошуку використовуватимуться і слова, що стоять в інших відмінках, в різних відмінах, в єдиному і множинному числі.

У Yandex так само, як в AltaVista можна будувати прості і складні запити. Але побудова складних запитів вимагає більш високої кваліфікації особи, що проводить пошук.

Для з'єднання ключових слів в простих запитах використовуються оператори, що означають символами : &, |, ~, (, ). Серед них тільки тильда(~) має інше призначення - в Yandex вона означає заперечення(і еквівалентна знаку в AltaVista). Проте, вказані оператори мають істотну особливість: ключові слова, що сполучаються ними, повинні знаходитися в межах одного абзацу.

Подвоювання оператора зв'язку вказує, що слова повинні знаходитися в межах усього тексту(а не тільки одного абзацу).

У Yandex передбачений "пошук з відстанню" - можна вказати, що ключові слова в шуканому тексті повинні знаходитися на відстані не більше, наприклад, трьох слів(і в одному абзаці). Відстань задається символом /, за яким йде цифра, що визначає відстань. Наприклад, задавши припис:

круглий /Зшар

пошукова машина шукатиме документи, що містять в межах одного абзацу слова "круглий" і "куля", причому, розділені вони можуть бути не більші, ніж трьома словами. Якщо відстань задана негативним числом, це означає, що друге слово передує першому.

Замість одного слова в пошуковому приписі можна використати цілі вирази. Логічно самостійні елементи цих виразів можуть полягати в дужках.

Особливості пошуку інформації в Інтернет.

Інтернет як глобальний засіб обміну інформацією нерідко використовується для пошуку необхідних даних. Способів пошуку інформації множина (в дужках вказані випадки, коли такий спосіб пошуку найбільш застосуємо): Пошук за допомогою пошукових машин

(конкретні речі) Каталоги і колекції посилань(загальніші поняття) Рейтинги(найпопулярніші ресурси) Конференції, чати і сторінки посилань на тематичних сайтах(рідкісні, спеціалізовані речі). Обмежені тимчасові, фізичні і фінансові можливості людей змушують найчастіше застосовувати для цього спеціальні каталоги і пошукові машини(пошукові системи) - свого роду бібліотекарі, що індексують доступний їм масив інформації в Інтернет.

У цьому розділі виділені особливості і розглянуті загальні правила роботи найбільш відомих каталогів і пошукових систем.

Каталоги є систематизованими групами адрес, об'єднаними, як правило, з тематики. До зручності їх застосування можна віднести те, що, якщо користувачеві відома тема шуканого документу, він досліджуватиме відповідну гілку каталогу, не відволікаючись на сторонні документи, що не відносяться до справи. Проте, об'єм каталогу обмежений фізичними можливостями редакторської групи і її суб'єктивністю у виборі матеріалу.

У них відсутня інформація на вузькі, спеціальні теми, та і саму тематику шуканого документу не завжди можна сформулювати в межах класифікації каталогу. Нижче приведені можливості зарубіжних і російських каталогів.

Yahoo! - найпопулярніший каталог, що містить велику інформацію про десятки тисяч Web- вузлів. Перший рівень ієрархії містить 14 тематичних категорій, які розгалужуються ще на 4 - 5 підрівнів. Має власну машину пошуку, що дозволяє : 1) шукати по базі Yahoo!

по Usenet або по адресах електронної пошти; 2) обмежити пошук матеріалами, розміщеними за останній день, тиждень, місяць, рік або 3 роки; 3) видати статті, що містять хоч би одно ключове слово або усі ключові слова; 4) шукати за однокорінними словами або тільки по вказаних ключових; 5) видати результати по 10, 25, 50 або 100 на одній сторінці(детальніше нижче).

Excite Reviews - Містить огляди 60 тис. вузлів Інтернет(ієрархічний каталог)

City.Net - відомості про країни і міста.

Galaxy - Ієрархічний каталог з детальним описом тематичних категорій на першій сторінці. Здійснює пошук по категорії пошуку, за одному або декількома ключовими словами, коротке і детальне виведення результатів пошуку, перехід на сторінки Gopher і Telnet.

Yellow Pages - Пошук інформації про 16 млн. американських компаніях в різних областях діяльності, а також персональні дані і електронні адреси приватних осіб.

Russia on the Net - Перший каталог російських ресурсів.
Сузір'я Інтернет - Охоплює близько 400 серверів. Можливість усікання термінів. Містить назви і короткі характеристики серверів. Приваблива графіка. Невелика зона пошуку, слабка ієрархія.
Жовті сторінки Інтернет - Близько 1200 Web- серверів. Великий об'єм інформації, добре продумана структура.
Скарби Інтернет - Каталог Web - pecypcoB на сервері Relcom. АУ! - Молодий каталог, що швидко розвивається.

Таблица 2. Сводная таблица некоторых предметных каталогов
  List.Ru Апорт Яндекс Rambler
Общая характеристика 19 разделов верхнего уровня, каталог ресурсов по регионам (подраздел рубрики Государство Российское) 14 разделов верхнего уровня, каталог ресурсов по регионам (подраздел рубрики Страны и регионы) 10 осн. разделов, 7 комбинир., допол­нительная классиф-я по региону, источнику инф- и, целевой аудитории и сектору экономики. 56 разделов (Рейтинг - одноуровневы й каталог)
Сортировка ресурсов внутри раздела Алфавит, оценка гидов, популярность (посещаемость), дата Алфавит, хиты (посещаемость), лига (оценка гидов), индекс цитируемости (оценка числа ссылок на данный ресурс), оценка (мнение пользователей) Алфавит, дата добавления, индекс цитируемости (кол-во ссылок на данный ресурс с других ресурсов) по посеща­емости
Булевские операторы язык Япс1ех язык А по от язык Япс1ех язык Rambler
Поиск по фразе        
Префиксы        
Итеративный поиск (в результатах)        
Замена части слова        

Пошукових серверів всього відомо більше 150, що розрізняються по регіонах охоплення, принципах проведення пошуку(а отже, по вхідній мові і характеру сприйманих запитів), об'ємі індексної бази, швидкості оновлення інформації, здатності шукати "нестандартну" інформацію і тому подібне. Основними критеріями вибору пошукових серверів є об'єм індексної бази сервера і міра розвиненості самої пошукової машини, тобто рівень складності сприйманих нею запитів. Традиційно пошукові системи мають три елементи:

1. Робот(кроулер, павук, агент), який переміщається по Мережі і збирає інформацію;

Кроулеры переглядають заголовки і повертають тільки перше посилання.

Павуки - програми, що здійснюють загальний пошук інформації в Мережі і повідомляють про зміст знайденого документу, індексуючи його і витягаючи підсумкову інформацію.

Агенти - самі "інтелектуальні" з пошукових засобів. Вони можуть робити більше, ніж просто шукати : вони можуть виконувати навіть транзакції від Вашого імені. Вже зараз вони можуть шукати сайти специфічної тематики і повертати списки сайтів, відсортованих по їх відвідуваності. Адміністратори пошукових систем можуть визначити, які сайти або типи сайтів агенти повинні відвідати і проиндексировать. Агенти можуть обробляти зміст документів, знаходити і індексувати інші види ресурсів, не лише сторінки.

Деякі, наприклад, індексують кожне окреме слово в документі, що зустрічається, тоді як інші індексують тільки найбільш важливих 100 слів в кожному, індексують розмір документу і число слів в нім, назва, заголовки і підзаголовки і так далі. Вони можуть також бути запрограмовані для витягання інформації із вже існуючих баз даних.

Роботи реалізовані як програмна система, яка просить інформацію з видалених ділянок Інтернет, використовуючи стандартні мережеві протоколи. Перший робот був створений для того, щоб виявити і порахувати кількість веб-серверів в Мережі. Усі роботи можуть бути запрограмовані так, щоб переходити по різних посиланнях різної глибини вкладеності, виконувати індексацію і навіть перевіряти посилання в документі. Із-за їх природи вони можуть застрявати в циклах(чорних дірах).

На практиці роботи зберігають майже усю інформацію про те, де вони побували. Навіть якщо робот зміг визначити, чи повинна вказана сторінка бути виключена з його бази даних, він вже поніс накладні витрати на запит самого файлу, а робот, який вирішує ігнорувати великий відсоток документів, дуже марнотратний. Намагаючись виправити цю ситуацію, Інтернет-співтовариство прийняло "Стандарт виключень для роботів". Цей стандарт описує використання простого структурованого текстового файлу, доступного у відомому місці на сервері ("/robots.

txt") і використовуваного для того, щоб визначити, яка з частин посилань сервера повинна ігноруватися роботами. Усі "розумні" пошукові машини спочатку звертаються до цього файлу, який має бути присутнім на кожному сервері. На сьогодні цей файл обов'язково проситься пошуковими роботами тільки таких систем як Altavista, Excite, Infoseek, Lycos, OpenText і WebCrawler. Цей засіб може бути також використаний для того, щоб попередити роботів про чорні діри.

спеціалізується в конкретній області. Цей стандарт є вільним, але його дуже просто здійснити і в нім є значний тиск на роботів із спробою їх підпорядкування.

1. База даних, яка містить усю інформацію, що збирається роботами.

Проиндексировать довільний документ, що знаходиться в Мережі, дуже складно. Перші роботи просто зберігали назву документу і якори(anchor) в самому тексті, але новітні роботи вже використовують більше просунуті механізми і взагалі розглядають повний зміст документу. Проіндексована інформація відсилається базі даних(БД) пошукового механізму. Вид побудованого індексу визначає, який пошук може бути зроблений користувачем пошукового механізму і як отримана інформація буде інтерпретована.

Люди можуть поміщати інформацію прямо в індекс, заповнюючи особливу форму для того розділу, в який вони хотіли б помістити свою інформацію. БД автоматично оновлюються за певний період часу з тим, щоб мертві посилання були виявлені і видалені.

2. Призначений для користувача інтерфейс для взаємодії з БД пошукової системи. Коли користувач шукає інформацію в Інтернет, він заповнює пошукову форму на сторінці пошукової системи. Тут можуть використовуватися ключові слова, дати і інші критерії. Критерії в пошуковій формі повинні відповідати критеріям, використовуваним агентами при індексації ресурсів Мережі. Як формат, так і семантика запитів варіюються залежно від вживаної пошукової машини і конкретної предметної області.

Запити складаються так, щоб зона пошуку була максимально конкретизована і звужена. Перевага віддається використанню декількох вузьких запитів в порівнянні з одним розширеним. Мови запиту різних машин пошуку в основному є поєднанням наступних функцій(Таблиця 3).

Операторы булевой алгебры AND, OR, NOT:
  AND (И) - осуществляется поиск документов, содержащих все термины, соединенные данным оператором;
  OR (ИЛИ) - искомый текст должен содержать хотя бы один из терминов, соединенных данным оператором;
  NOT (НЕ) - поиск документов, в тексте которых отсутствуют термины, следующие за данным оператором.
Операторы расстояния - ограничивают порядок следования и расстояния между словами, например:  
  NEAR - второй термин должен находиться на расстоянии от первого, не превышающем определенного числа слов;  
  FOLLOWED BY - термины следуют в заданном порядке;  
  ADJ - термины, соединенные оператором, являются смежными.  
Возможность усечения терминов - использование символа " * " вместо окончания термина позволяет включить в искомый список все слова, производные от его начальной части (шаблона).  
Учет морфологии языка - машина автоматически учитывает все формы данного термина, возможные в языке, на котором ведется поиск.  
Возможность поиска по словосочетанию, фразе.  
Ограничение поиска элементом документа (слова запроса должны находиться именно в заголовке, первом абзаце, ссылках и т.д.).  
Ограничения по дате опубликования документа.  
Ограничения на количество совпадений терминов.  
Возможность поиска графических изображений.  
Чувствительность к строчным и прописным буквам.  

Таблиця. 3. Мови запиту різних машин пошуку

На основі введеної користувачем пошукового рядка у БД відшукується предмет запиту і виводиться список відповідних посилань. Число документів, отриманих в результаті пошуку за запитом, може бути величезне. Проте, завдяки ранжируванню документів, вживаному у більшості пошукових машин, на перших сторінках списку практично усі документи виявляться релевантними(у ідеалі). Основні принципи визначення релевантности наступні:

1. Кількість слів запиту в текстовому вмісті документу (в html - коді).

2. Теги, в яких ці слова розташовуються.

3. Місце розташування шуканих слів в документі.

4. Питома вага слів(густина), відносно яких визначається релевантность, в загальній кількості слів документу.

Ці принципи застосовуються усіма пошуковими системами. А представлені нижче використовуються деякими, але досить відомими(на зразок AltaVista, HotBot).

1. Час - як довго сторінка знаходиться у базі пошукового сервера. Безліч сайтів живуть максимум місяць. Якщо ж сайт існує досить довго, це означає, що власник дуже досвідчений в цій темі.

2. Індекс цитованості - число посилань на цю сторінку з інших сторінок, зареєстрованих у БД.

Існують особливості показу отриманого списку - деякі пошукові системи показують тільки посилання; інші виводять посилання з першими декількома пропозиціями, що містяться в документі або заголовок документу разом з посиланням.

Результат запиту(список посилань) обробляється в два етапи. На першому етапі(автоматична обробка) проводиться відсікання очевидно нерелевантних джерел, що потрапили у вибірку в силу недосконалості пошукової машини або недостатньої "інтелектуальності" запиту. Подальша(ручна) обробка здійснюється користувачем шляхом послідовного звернення на кожного зі знайдених ресурсів і аналізу інформації, що знаходиться там.

Коли користувач клацає на посилання зі списку, то перед запитом відповідного документу у того сервера, на якому він знаходиться, пошукові системи заносять у свою БД відмітку про призначену для користувача перевагу. Зібрана інформація про поведінку користувачів(формулювання запитів і вибрані зі списку ресурси) успішно використовується в рекламних компаніях в Мережі.

Нижче порівнюються найбільш відомі не-россиские пошукові системи.

AltaVista. Охоплює більше 30 млн. сторінок на 225000 серверах, забезпечує доступ до 3 млн. статей в 14000 телеконференціях Usenet. Має два режими: Simple query і Advanced query. У режимі Simple можна вводити шаблони для пошуку не менше чим з трьома вказаними символами на початку слова. Якщо слово містить хоч би одну заголовну букву, ведеться пошук з урахуванням регістра. Нижче рядки введення видаються раді з пошуку. У режимі Advanced можна створювати складні запити, грунтовані на логічних операторах AND, OR, NOT, NEAR і вказувати критерії сортування отриманих результатів.

Можна вказувати діапазон дат публікації. Надає можливість пошуку зображень. Зручний інтерфейс. Висока швидкодія, багатоваріантний пошуковий припис, можливість пошуку російською мовою з урахуванням морфології. Система не упорядковує результати пошуку, тому її доцільно застосовувати для специфічного або вичерпного пошуку.

системі здійснюється за допомогою робота. При цьому робот має наступні пріоритети:

- слова, що містяться в тегу <title> мають вищий пріоритет;

- ключові фрази в <Meta> тегах;

- ключові фрази, що знаходяться на початку сторіночки;

- ключові фрази в ALT - посиланнях

- ключові фрази по кількості входженьприсутність слівфраз; Якщо тегів на сторінці немає, використовує перші 30 слів, які індексує і показує замість опису(tag description)

Найцікавіша можливість AltaVista - це розширений пошук. Тут варто відразу обмовитися, що, на відміну від багатьох інших систем AltaVista підтримує одномісний оператор NOT. Окрім цього, є ще і оператор NEAR, який реалізує можливість контекстного пошуку, коли терміни повинні розташовуватися поруч в тексті документу. AltaVista дозволяє пошук по ключових фразах, при цьому вона має досить великий словник фразеологізму.

Крім усього іншого, при пошуку в AltaVista можна задати ім'я поля, де повинне зустрітися слово: гіпертекстове посилання, applet, назва образу, заголовок і ряд інших полів. На жаль, детально процедура ранжирування в документації по системі не описана, але видно, що ранжирування застосовується як при простому пошуку, так і при розширеному запиті. Реально цю систему можна віднести до системи з розширеним булевим пошуком.

HotBot - Охоплює 54 млн. сторінок. Можливий пошук російською мовою. Є популярним пошуковим засобом завдяки наявності механізмів побудови складних пошукових запитів. В основному, 1-а сторінка результатів, отриманих у відповідь на пошуковий запит, приходить з Direct Hit, потім беруться результати з Inktomi. Список каталогів надається Open Directory. HotBot почав надавати свої послуги в травні 1996 року, а в жовтні 1998 року він був куплений Lycos.

Infoseek. Охоплює 1,5 млн. сторінок. Мова запитів дозволяє використати усі можливі варіанти логічних виразів. Менш повні, чим на інших серверах, результати пошуку, незручний інтерфейс. У цій системі індекс створює робот, але він індексує не увесь сайт, а тільки вказану сторінку. При цьому робот має такі пріоритети:

- слова в заголовку <title> мають найвищий пріоритет;

- слова в тегу keywords, description і частота входженьповторень в самому тексті;

- при повторенні однакових слів поруч викидає з індексу

- Допускає до 1024 символів для тега keywords, 200 символів для тега description;

- Якщо теги не використовувалися, індексує перші 200 слів на сторінці і використовує як опис;

Система Infoseek має досить розвинене інформаційно¬пошуковою мовою, що дозволяє не просто вказувати, які терміни повинні зустрічатися в документах, але і своєрідно зважувати їх. Досягається це за допомогою спеціальних знаків " " - термін зобов'язаний бути в документі, і - термін має бути відсутнім в документі. Окрім цього, Infoseek дозволяє проводити те, що називається контекстним пошуком. Це означає, що, використовуючи спеціальну форму запиту, можна зажадати тієї, що послідовної, що спільної, що зустрічається слів.

Також можна вказати, що деякі слова повинні спільно зустрічатися не лише в одному документі, а навіть в окремому параграфі або заголовку. Є можливість вказівки ключових фраз, що є єдиним цілим, аж до порядку слів. Ранжирування при видачі здійснюється по числу термінів запиту в документі, по числу фраз запиту за вирахуванням загальних слів. Усі ці чинники використовуються як вкладені процедури. Підводячи підсумки, можна сказати, що Infoseek відноситься до традиційних систем з елементом зважування термінів при пошуку.

Infoseek Ultra - 50 млн. сторінок WWW, можливий пошук російською мовою, пошук зображень.

Lycos. Охоплює 68 млн. сторінок. Можна вибрати параметри пошуку : одно, декілька ключових слів або фраза; усікання термінів; обмеження на число збігів; міра відповідності результатів пошуку ключовим словам; форму виведення результатів(коротку або детальну); кількість знайдених термінів на кожній сторінці. Невисока швидкодія і оперативність оновлення інформації. У Lycos використовується наступний механізм індексації :

- слова в <title> заголовку мають вищий пріоритет;

- слова на початку сторінки;

- слова в посиланнях;

- якщо в його базі індексу є сайти, посилання з яких вказує на індексований документ - релевантность цього документу зростає.

Як і більшість систем, Lycos дає можливість застосовувати простий запит і витонченіший метод пошуку. У простому запиті в якості пошукового критерію вводиться пропозиція на природній мові, після чого Lycos проводить нормалізацію запиту, видаляючи з нього так звані stop- слова, і тільки після цього приступає до його виконання. Майже відразу видається інформація про кількість документів на кожне слово, а пізніше і список посилань на формально релевантні документи.

У списку проти кожного документу вказується його міра близькості запиту, кількість слів із запиту, що потрапили в документ, і оцінна міра близькості, яка може бути більша або менше формально вичисленою.

логічні оператори в рядку разом з термінами, але використати логіку через систему меню Lycos дозволяє. Така можливість застосовується для побудови розширеної форми запиту, призначеної для досвідчених користувачів, що вже навчилися працювати з цим механізмом. Таким чином, видно, що Lycos відноситься до системи з мовою запитів типу "Like this", але намічається його розширення і на інші способи організації пошукових приписів. У жовтні 1998 Lycos придбав HotBot, який, нині, використовується як окрема служба.

WAIS є однією з найбільш витончених пошукових систем Internet. У ній не реалізовані лише пошук по нечітких множинах і імовірнісний пошук. На відміну від багатьох пошукових машин, система дозволяє будувати не лише вкладені булеві запити, рахувати формальну релевантность по різних заходах близькості, зважувати терміни запиту і документу, але і здійснювати корекцію запиту по релевантности. Система також дозволяє використати усікання термінів, розбиття документів на поля і ведення розподілених індексів.

Не випадково саме ця система була вибрана в якості основної пошукової машини для реалізації енциклопедії "Британика" на Internet.

Yahoo. Секрет успіху Yahoo полягає в людях. Yahoo має близько 150 редакторів, для того, щоб складати і редагувати вміст своїх каталогів. Yahoo має базу даних у більш ніж 1 млн. проіндексованих сайтів. Також, у разі нестачі своєї власної бази даних, Yahoo використовує базу даних Google(до липня 2000 року Yahoo користувався базою даних Inktomi). Yahoo є старою пошуковою системою, яка почала надавати свої послуги в 1994 році. Мова Yahoo досить проста: усі слова слід вводити через пропуск, вони з'єднуються зв'язкою AND або OR.

При видачі не вказується міра відповідності документу запиту, а тільки підкреслюються слова із запиту, які зустрілися в документі. При цьому не проводиться нормалізація лексики і не проводиться аналіз на "загальні" слова. Добрі результати пошуку виходять тільки тоді, коли користувач знає, що у базі даних Yahoo інформація є напевно. Ранжирування проводиться по числу термінів запиту в документі. Yahoo відноситься до класу простих традиційних систем з обмеженими можливостями пошуку.

 

Табл.4. Сводная таблица по ведущим поисковым машинам
  Яндекс Rambler Апорт! AltaVista Google
Зона поиска Русская часть Интернета. Поиск по страницам сайтов из раздела каталога, по регионам, спец. поиск по новостям, товарам, картинкам. Русская часть Интернета. Русская часть Интернета. Спец.поиск по новостям, товарам, картинкам, MP3 Спец.поиск по новостям, товарам, развлечениям , аудио (MP3) и видео. Спец.поиск по университетам США, Apple, Linux, BSD
База на нач.2001 Более 31 млн. ДОК. Более 12 млн. ДОК. Более 14 млн. ДОК. Более 250 млн. док. 1,25 млрд страниц
Тип индекса­ ции полнотекстовая индексация полнотекст. индекс. полнотекст. индекс., индекс, по ссылкам полнотекст. индекс. полнотекст. индекс., индекс, по ссылкам
Дополи. сервисы Каталог, Народ.Ру, Закладки.Ру, система ГУРУ, CY и пр. Каталог, рейтинг- класси- фикатор Тор100 Каталог, интернет- покупки и др. Каталог, хост-инг, регистра-ция доменного имени, перевод . Каталог, содер-жащий 15 разде-лов и 1,5 млн. Web- страниц
Синтаксис языка поиска
Логич. И пробел или & (в пре-делах предложения) &&(в пределах ДОК.) AND, &, пробел между словам и по умолчанию И, AND, &,+, пробел по умолч. AND, & (только при сложном поиске) по умолч. для всех слов поиска
Логич. ИЛИ   OR, | ИЛИ, OR, I OR (по умолч.), (сложи. поиск) OR
Бинарн. оператор И-НЕ ~ (в пределах предложения) — (в пределах документа) не используется заменяется префиксным оператором " (AND - пробел по умолчанию) AND NOT, ! (только при сложном поиске) заметается префиксным оператором
Префикс обяз. (+) и запрещ (-) слов + - не используются + - +,- (только при простом поиске) + -
Труп. слов О О О О не используется
Расстоя­ ние между ключ. словами /(пш)-в словах, &&/(п ш) - в предложениях (- назад, + вперед) в расшир. поиск е - выдача док. только с миним. расстоянием между словами сл2(...), с2(...), w2(...), [2,...] (- назад, + вперед) NEAR (только при сложном поиске в пре­делах 10 слов) не используется
Поиск фразы !! II нет II II II ? !! II II II II ? 5
Замена части слова нет *, ? (замена любого символа) * (только в конце слова) Ж нет
Язык док-та выбор: любой, кириллица, латиница выбор: любой, русский, английский выбор: русский, английский выбор из 25 языков выбор из 25 языков
Поиск по полям заголовки, ссылки, мета­тэги, файлы и подписи картинок, в текстах ссылок, в названиях скриптов, объектов и апплетов., поиск похожих док., сужение поиска на выбранные сайты заголовки, адреса, названия док. (только при расшир. поиске), поиск похожих доку. заголовки, ссылки, мета­тэги, файлы и подписи кар­тинок, адреса, тексты ссылок, сужение поиска на выбранные сайты заголовки, ссылки, мета­тэги, файлы и подписи кар­тинок, адреса, тексты ссылок, названия скрип-тов, объектов и апплетов ссылки и поиск похожих документов, сужение поиска на выбранные сайты
Морфо­ логия все склонения и спряжения по умолч. ! (точн. словоформа) # (все формы слов), @ (однокоренн ые слова) ! (указание нормальной формы) нет нет
Поиск по датам есть есть есть есть нет
Возможности расширенной формы, качество помощи
Расшир. форма поиска словарный фильтр, дата, сайт, ссылка, изображение, специальный объект документ, дата, режимы AND, OR, расстояние между словами, усечение слова документ, заго-ловок, изобра­жение, дата, 5 разделов (сайты, MP3, картинки, това-ры, новости) булевский вопросник, дата, сайт, ссылка, изображение, текст и пр. ограничения по сайту, языку, ссылкам
Вывод списка ссылок задание числа результатов на странице, всех элементов формы вывода задание числа результатов на странице, формы вывода задание формы выдачи задание числа результатов на странице, всех элементов формы вывода задание числа результатов на странице, всех элементов формы вывода
Ранжиро вание рез-тов поиска сортировка по релевантности или по дате сортировка по релевантност и или дате по популярности сайта по терминам, указанным в SORT по числу ссылок на страницу с других страниц (цитируемость )
Поиск в рез-тах поиска Да. С помощью установки флажка Да. С помощью переключател я области поиска Да. С помощью уст. флажка Да. С помощью SORT BY нет
Качество раздела помощи детальное описание языка запросов, таблица синтаксиса и раздел по поиску в категориях краткий раздел HELP подробный справ, по языку запросов, много русских синони-мов для основ­ных операторов самый большой из рассмотрен­ных в этой таблице учебник on­line по языку запросов очень ограниченный раздел HELP
Семейн. фильтр есть нет нет есть нет

Перспективи розвитку засобів пошуку в Інтернет
Безперечними є наступні тенденції Інтернет:


- зростання об'єму доступної інформації і інформаційних потреб користувачів
- розширення меж Інтернет за рахунок приєднання нових країн

- посилення комерціалізації сервісів

- збільшення швидкості, пропускної спроможності і числа способів доступу в Мережу

- поглиблення диференціації сервісів по цільових аудиторіях(кухлі по інтересах)

- об'єднання однорідних сервісів в єдині портали(місця масового обслуговування)

- впливи "дай"-протокола відбитися на розвитку засобів збору інформації про поведінку користувачів в Мережі

Усе це підштовхне автоматизацію засобів пошуку і семантичної обробки інформації таких, як:

- персональні автономні інтелектуальні агенти(типу "Search ")

- персоналізація і інтелектуалізація пошукових механізмів на пошукових порталах(налаштування способу виведення списку посилань, використання механізму Cookies, заповнення спеціальних анкет і "підписка на запит", семантичне ранжирування результатів запиту)

 

– Конец работы –

Эта тема принадлежит разделу:

Кириченко А.А. Максимова Т.Ю. Бовт В.В. Інтернет-технології для бізнесу

Нтернет технології для бізнесу... Зміст... Глава Види Інтернет представництв...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Пошукова система Yandex.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Введення
Значення нових інформаційних технологій, пов'язаних з використанням Internet для бізнесу, важко переоцінити. У поточному році місткість інформаційного Internet - ринку в США склала 300 млрд. доларі

Web присутності в Інтернет.
Основне його завдання - оголосити світу про існування цієї фірми. Таке оголошення має певний комерційний сенс, оскільки наявність своєї Web - сторіночки створює певний імідж фірмі, вона виглядає со

Web для просування товарів і послуг.
Це передусім - засіб масової інформації, оскільки основними інструментами просування товарів і послуг є publicity, advertising, public relations - дисципліни, які в зарубіжних Внз вивчаються при пі

Web електронної комерції.
Web цього типу є електронним магазином, що називається іноді віртуальним магазином або віртуальним прилавком. Такий Web повинен містити домашню сторіночку з переліком послуг, що надаються відвідува

Web сервісного і гарантійного обслуговування.
Сервісне і гарантійне обслуговування клієнтів може здійснюватися з Web - сайту, побудованого аналогічно сайтам, розглянутим в п.п. 1.2 - 1.4. Але може знадобитися і спеціальна функція Internet - ти

Web внутріфірмового навчання співробітників.
Web - сайти для внутріфірмового навчання співробітників мають спеціальну організацію, в якій значне місце займає захист від несанкціонованого доступу. Web - сайт робиться закритим, тобто доступ до

Web віртуального співтовариства фірми.
У західних компаніях вводяться спеціальні посади для відстежування цільової аудиторії. Таку аудиторію треба знайти, сформувати, притягнути на свій сайт, утримати. Після цього її можна використати д

Web для спільного проектування.
Цей Web призначений для організації спільної роботи фахівців, що знаходяться на значній відстані один від одного. Для спільної роботи необхідно мати загальний погоджений з усіма план дій. Кожен уча

Представництв фірм.
Internet - це "мережа мереж". Це не глобальна обчислювальна мережа, а структура, що об'єднує глобальні обчислювальні мережі. Спочатку вважалося, що глобальна обчислювальна мережа

Адресація ресурсів Internet.
Ресурсами Internet є host - машини, машини - клієнти, програми(наприклад, сервер WWW, сервер FTP, та ін.), інформаційні ресурси(файли на серверах, host - машинах і машинах - клієнтах). Усі

Призначення і сфера застосування протоколів електронної пошти.
На host- комп'ютері ISP виділяються поштові скриньки для користувачів, в яких накопичується уся кореспонденція, що приходить для них. При підключенні користувача до вузла(host- комп'ютеру

Отримання пошти.
Для перевірки утримуваної поштової скриньки потрібне активироватьпрограмму Internet Mail, і в її основному вікні клацнути по кнопці "Переслати(Send and Receive). Програма починає підключення д

Створення відповіді на лист
Відповідь на листи, що прийшли, необхідно складати так, щоб той, що отримав його міг згадати, про що йшла мова раніше. Для цього відповідь повинна містити цитати з попередньої кореспонденції. Для с

Електронний автопідпис листа.
Під електронним автопідписом розуміється текст(чи файл), який автоматично вставляється в кінець написаного листа. Для створення такого підпису в основному вікні програми Internet Mail виби

Адресна книга.
При активній роботі з електронною поштою накопичується велика кількість адрес. Програма Internet Mail дозволяє зберігати ці адреси і пов'язану з ними інформацію в адресній книзі. Звернення

Пересилка файлів по e - mail.
Електронна пошта призначена для пересилки текстових повідомлень, що не містять серед текстових символів практично ніяких службових знаків. При спробі передачі по електронній пошті двійкови

Служба FTP.
Комунікативну функцію в Internet виконує електронна пошта(electronic mail, або скорочено e - mail). Другою основною функцією є зберігання інформації. Ця функція знайшла в Internet своє відображення

Використання видалених ресурсів(Telnet).
За допомогою Telnet можна встановити зв'язок з іншим комп'ютером і використати його можливості в інтерактивному режимі. Це простий сервіс, одна з найстаріших технологій Internet. Програма - клієнт

Телеконференції(News).
У 1979г. була реалізована ідея аспірантів з університетів Дюка і Кароліни, що шукали можливість обміну інформацією між комп'ютерами своїх учбових закладів. Спочатку для такого обміну використовував

Безпосереднє спілкування(IRC).
Internet дозволяє не лише отримувати різноманітну інформацію і обмінюватися повідомленнями, але і спілкуватися в реальній масштабі годині з будь-яким користувачем мережі, де б він не знаходився. Ця

Всесвітня павутина(WWW).
Свій початок цей вид сервісу веде з березня 1989г., коли Тім Бернерс-Ли з CERN запропонував керівництву цього міжнародного європейського наукового центру концепцію нової розподіленої інформаційної

Пошукові системи(класифікація і сфери використання).
Пошук необхідних відомостей у великому об'ємі досить різноманітної інформації - завдання, яке людство вирішує вже багато століть. У міру зростання об'єму інформаційних ресурсів були розроблені доси

Засоби архівації і відновлення інформації.
Архівація файлів - це спосіб зменшення їх розмірів(стискування). Архівація потрібна для скорочення об'єму інформації при розміщенні її на магнітних носіях, і для скорочення часу на передачу файлів

Гіпертекст, послідовність створення гіпертекстових систем.
Ідея гіпертексту була описана в 1945 році Vannevar Bush в його пропозиціях по створенню електромеханічної інформаційної системи Мешех. У 1965г. Ted Nelson ввів в обіг сам термін "гіпертекст&qu

Архітектура сервісу WWW.
Сервіс WWW(Word Wide Web, або 3W - "всесвітня павутина") дозволяє організувати величезну кількість інформації в компактне сховище з легким доступом до наявних матеріалів. Найменш

WYSIWYG - системи проектування Web- сайтів.
Абревіатура WYSIWIG(від What You See Is What You Get) означає системи, в яких екранна форма не програмується, а "збирається" на екрані. Після закінчення складання форми система сама сотав

Склад, структура і функціональні можливості FrontPage.
Пакет FrontPage призначений для створення не дуже складних Web- сайтів. Він складається з трьох частин: редактора FrontPage Editor, провідника FrontPage Explorer, і WEB- сервера Microsoft Personal

Провідник FrontPage(FrontPage Explorer).
FrontPage Explorer(Провідник) здатний відображати Web- сайт на трьох різних панелях: структурній панелі(Outline View), панелі зв'язків(Link View) і загальної панелі(Summary View), що дозволяють бач

Редактор FrontPage(FrontPage Editor).
Інформаційне наповнення сторінок може бути виконане за допомогою FrontPage Editor або інших засобів(наприклад, Word 97). Проте, FrontPage Editor має більше можливостей. Можливості FrontPag

Динамічні Web- документи.
Динамічна сторінка - це сторінка, зміст якої створюється автоматично, "на льоту". При вступі запиту на неї сервер за допомогою спеціально передбаченого механізму(CGI) звертається до корпо

Засоби гіпертекстової розмітки.
Гіпертекстова розмітка застосовується для вказівки, в якій частині екрану і яким чином має бути відображений текст і як пов'язані між собою тексти, що становлять гіпертекстову базу даних. З цими ці

Wеb-представительство.
Зовнішні умови визначають, хто буде основним відвідувачем сайту; які джерела інформації є "своїми" для типового відвідувача, стиль викладу матеріалу в цих джерелах, точка зору, загальний

Контроль даних, що вводяться.
Введені користувачем дані мають бути в обов'язковому порядку піддані контролю, оскільки в середньому кваліфікований оператор припускається однієї помилки на 10 введених символів(кваліфікованим є оп

Тестування сайту.
Після того, як робота над сайтом завершена, необхідно провести його тестування. Сайт є складною конструкцією, до його перевірки необхідно підходити з різних сторін, виявлені при перевірці недоліки

Дослідження ефективності сайту.
Починати дослідження ефективності створеного сайту необхідно з першого ж його "робочого дня". При дослідженні ефективності сайту необхідно отримувати і фіксувати наступну інформацію: скіл

Основна
1. Н.Рэнделл, Д. Джонс "Mikrosoft FrontPage. Якнайповніше керівництво", C- Пб, BHV, 1997. 2. Луіс Кан, Лаура Коган "Мій вузол WEB", М., "Російська Редакція",

Додаткова
7. А.Чупалов "Як заробляти гроші в Інтернет", С-П., Пітер, 1997. 8. Винс Имери "Як зробити бізнес в Інтернет", Київ, Комиздат, 1997. 9. Дэ.Хеллер, До.Хеллер &q

Глоссарій
Гіпертекст - засіб з'єднання інформації, що міститься в одному документі, з інформацією з того ж документу. Глобальна обчислювальна мережа - мережа великої протяжності. Як правило включає

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги