Правила формирования запросов для поиска информации в интернете

Пробелили символ &- логическое И. Означает, что каждое из слов запроса должно входить в одно и то же предложение искомого документа. Сдвоенный символ &&- в пределах документа

Запятаяили символом| -логическое ИЛИ. Означает, что в искомом документе в одном предложении должно содержаться одно из этих слов.

Тильда ~ -бинарный оператор И НЕ .Наличие указывает, что в предложении будет искаться только первое слово из запроса, а второе будет игнорироваться. Сдвоенные символы ~~указывает на то, что поиск терминов, содержащихся в запросе будет производиться в пределах всего документа.

Круглые скобки ()– группирование слов в предложение, для этого его надо взять в скобки. Вместо одного слова в запросе можно подставлять целое выражение. Скобки задают также порядок действия логических операторов .Внутри скобок можно использовать все знаки пунктуации и ограничение расстояния.

Фигурные скобки {}– естественно-языковый запрос

Знак / .Если между двумя словами поставлен этот знак и за ним сразу введено число, значит требуется, чтобы расстояние между словами не превышало этого числа слов. Если порядок слов и расстояние между ними точно известны, можно использовать пунктуация /+n– т.е. задается поиск слов, стоящих подряд.

Символы /(nm).Ограничение по расстоянию в общем виде между словами. Где n – минимально, а m – максимально допустимое расстояние. Практически все знаки пунктуации в запросе можно комбинировать с ограничением расстояния. Если знаки ограничения по расстоянию стоят после двойных операторов [например &&/(nm)], то употребленные там числа – это расстояние не в словах, а в предложениях .

title=слово(или сочетание слов в круглых скобках) после знака равенства должны искаться в заголовках документов. В этом случае синтаксис запроса имеет вид $title (термин )

А- для поиска в ссылках. В этом случае синтаксис запроса имеет вид $A(это/+1 ссылка/+1 на/+1сайт/+1 СумГУ).

$$ - для ограничения области поиска – осуществлять его не по всему документу, а только по тем, которые были найдены в предыдущем поиске. В этом случае синтаксис запроса имеет вид $title (термин)$$

subtree=название раздела – позволяет при индексировании задать нужные каталоги и названия разделов, к которым они будут относиться. В этом случае синтаксис запроса имеет вид студент#subtree=ssu. Задается поиск документов в разделе ssu, содержащих слово студент.

слово:число- оператор веса и уточнения запроса позволяет пользователю повлиять на порядок сортировки. Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, содержащих взвешенное выражение. Например студент отличник:5 - то наверху списка окажутся документы, где чаще встречается слово

отличник.

слово<-уточняющее слово– позволяет увеличить релевантность документов, содержащих уточняющее выражение. Например по запросу студент<-отличник будут найдены все документы, содержащие слово студент, при этом первыми будут выданы документы, содержащие слово отличник.

Вывод документа: название документа, начало текста, размер файла, URL ссылающийся на оригинальный документ, дата последнего обновления, степень соответствия запросу, кодировка. Обеспечивается подсветка искомых слов в найденных документах. Есть возможность поиска похожих документов и повторного поиска только в найденных документах.

Для каждого найденного документа Яnдех вычисляетвеличину релевантностисодержания документа поисковому запросу. Список найденных документов перед выдачей пользователю сортируется по этой величине в порядке убывания. Релевантность документа зависит от ряда факторов, в т.ч. от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

Наличие индексации дает возможность выделить слова, найденные согласно запроса в тексте. Слова выделяются угловыми стрелочками. Каждая стрелочка ссылается на следующее или предыдущее «найденное» слово.

Если запрошенное слово было найдено в заголовке, то оно выделяется там угловыми скобками, а внизу выдается соответствующее сообщение.