Понятие информационно - поисковой системы

Понятие информационно - поисковой системы. Информационно-поисковая система - совокупность информационно поискового правил перевода с естественного языка на информационно - поисковый и обратного перевода, а также критерия соответствия, предназначенная для осуществления информационного поиска.

В число составных частей конкретной информационно поисковой системы ИПС, кроме информационно-поискового языка, правил перевода и критерия соответствия, входят также средства ее технической реализации, массив текстов документов, в котором осуществляется информационный поиск, и люди, непосредственно участвующие в этом поиске. 1.2 Процесс поиска Информационный поиск - процесс отыскания в некотором множестве текстов документов всех таких, которые посвящены указанной в запросе теме предмету или содержат нужные потребителю факты, сведения.

ИП осуществляется посредством информационно-поисковой системы и выполняется вручную либо с использованием средств механизации или автоматизации. Непременным участником ИП является человек. В зависимости от характера информации, которая содержится в выдаваемых информационно - поисковой системой ИПС текстах, ИП может быть документальным, в том числе библиографическим, и фактографическим.

ИП нужно отличать от логической переработки информации, без которой невозможна непосредственная выдача человеку ответов на задаваемые им вопросы. При ИП отыскиваются и могут быть найдены такие и только такие факты или сведения, которые были введены в ИПС. Перед вводом в ИПС текста документа определяется его основное смысловое содержание тема или предмет, которое затем переводится и записывается на одном из информационно-поисковых языков.

Эта запись называется поисковым образом текста. Так же поступают и когда в ИПС вводят определнным образом записанные факты, сведения. Поступивший запрос также переводится на информационно-поисковый язык, образуя поисковое предписание. Поскольку поисковые образы текстов и поисковые предписания записаны на одном и том же языке, выражения на котором допускают только одно истолкование, то, возможно сравнивать их формально, не вникая в смысл. Для этого задаются определнные правила критерии соответствия, устанавливающие, при какой степени формального совпадения поискового образа с поисковым предписанием текст следует считать отвечающим на информационный запрос и подлежащим выдаче.

Техническая эффективность ИП характеризуется двумя относительными показателями коэффициентом точности отношением числа текстов, отвечающих на информационный запрос, к общему числу текстов в данной выдаче и коэффициентом полноты отношением числа текстов, отвечающих на информационный запрос, к общему числу таких текстов, содержащихся в данной ИПС. Необходимые значения этих показателей зависят от специфики информационных потребностей.

Например, при поиске патентных описаний с целью проведения экспертизы патентной заявки на новизну необходима 100-ная полнота выдачи при поиске, ориентированном на обычного исследователя или инженера, очень хорошей считается точность выдачи около 80 , полнота около 50. Рис.1 Процесс поиска ИП может быть двух типов избирательное или адресное распространение информации и ретроспективный поиск.

При избирательном распространении информации ИП производится по постоянным запросам некоторого числа потребителей абонентов, осуществляется периодически обычно один раз в неделю или в две недели и выполняется лишь в массиве текстов, поступивших в ИПС за этот период времени. Между ИПС и потребителями абонентами устанавливается эффективно действующая обратная связь абонент сообщает, в какой степени этот текст соответствует запросу и нужна ли ему копия полного текста, о степени соответствия этого текста его информационной потребности, которая позволяет уточнять потребности абонентов, своевременно реагировать на изменения этих потребностей и оптимизировать работу системы.

При ретроспективном поиске ИПС отыскивает содержащие требуемую информацию тексты во всм накопленном массиве текстов по разовым запросам. 1.3