рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Информационный язык

Работа сделанна в 2005 году

Информационный язык - Курсовая Работа, раздел Связь, - 2005 год - Основные принципы информационно-поисковых систем Информационный Язык. Информационно-Поисковый Язык - Знаковая Система, Предназ...

Информационный язык. Информационно-поисковый язык - знаковая система, предназначенная для описания путм индексирования основного смыслового содержания текстов документов или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска.

Любой абстрактный информационно поисковый язык ИПЯ состоит из алфавита списка элементарных символов, правил образования и правил интерпретации. Правила образования устанавливают, какие комбинации элементарных символов допускаются при построении слов и выражений, а правила интерпретации - как надлежит понимать эти слова и выражения.

ИПЯ должен располагать лексико-грамматическими средствами, необходимыми для выражения основного смыслового содержания любого текста и смысла любого информационного запроса по данной отрасли или предмету, быть недвусмысленным допускать одно истолкование каждой записи, удобным для алгоритмического сопоставления и отождествления полного или частичного записей основного смыслового содержания текстов и смыслового содержания информационных запросов. При разработке конкретного ИПЯ учитываются специфика отрасли или предмета, для которой этот язык создатся, особенности текстов, образующих поисковый массив, характер информационных потребностей, для удовлетворения которых создается данная информационно - поисковая система.

В большинстве ИПЯ основной словарный состав лексика задатся его перечислением и представляет собой фрагмент лексики того или иного естественного языка. Отобранные из естественного языка слова и словосочетания, в совокупности образующие основной словарный состав, служат как бы алфавитом данного ИПЯ. Правила образования в таких ИПЯ выполняют функцию синтаксиса.

В некоторых ИПЯ основной словарный состав задатся полностью или частично методом порождения, который заключается в том, что для таких ИПЯ правила образования устанавливают, как из данного алфавита строить слова ИПЯ, а из этих слов выражения фразы и какие из них будут правильно построенными. В середине 20 в. в качестве ИПЯ широко применяются классификации библиотечно-библиографические и языки дескрипторного типа. 1.4 Перевод Уже давно осталась позади романтика создания ИПЯ, как естественного языка.

Если даже пользователю предлагается вводить запросы на естественном языке, то это не значит, что система будет осуществлять семантический разбор запроса пользователя. Проза жизни заключается в том, что обычно фраза разбивается на слова, из этого списка удаляются запрещенные и общие слова, иногда производится нормализация лексики, а затем все слова связываются либо логическим AND, либо OR. Таким образом запрос типа Software that is used on Unix Platform будет преобразован в Unix AND Platform AND Software что будет означать примерно следующее Найди все документы, в которых слова Unix, Platform и Software встречаются одновременно.

Возможны и варианты. Так в большинстве систем фраза Unix Platform будет опознана как ключевая фраза, и не будет разделяться на отдельные слова. Вообще говоря, и все три слова могут быть опознаны как одна ключевая фраза. Другой подход заключается в вычислении близости между запросом и документом.

В этом случае, в соответствии с векторной моделью представления документов и запросов вычисляется мера близости. К настоящему времени известно около дюжины различных мер близости. Наиболее часто применяется cos угла между поисковым образом документа и запросом пользователя. Именно эти проценты соответствия документа запросу и выдаются в качестве справочной информации при списке найденных документов. Наиболее продвинутым языком запросов является следующий кроме обычного набора AND, OR, NOT, эта система позволяет использовать еще и NEAR. Последний оператор позволяет организовать контекстный поиск.

Все документы в системе разбиты на поля, поэтому в запросе можно указать в какой части документа пользователь хочет увидеть ключевое слово в ссылке, заголовке и т.п Можно также задать поле ранжирования выдачи и критерий близости документов запросу. 1.5Дескриптор Дескриптор позднелат. descriptor, от лат. describо описываю - лексическая единица слово, словосочетание информационно-поискового языка, служащая для описания основного смыслового содержания документов.

Дескрипторы служат также для формулировки информационных запросов при поиске документов в информационно - поисковой системе 1.6 Критерий соответствия Критерий соответствия - совокупность правил, по которым при информационном поиске определяется степень соответствия поискового образа документа поисковому предписанию и принимается решение о выдаче или невыдаче этого документа в ответ на информационный запрос.

Наряду с информационно-поисковым языком критерий соответствия является одним из элементов информационно-поисковой системы. 1.7 Индексирование Индексирование - процесс выражения главного предмета или темы текста какого-либо документа в терминах информационно-поискового языка. Применяется для облегчения поиска необходимого текста среди множества других. Проводится Индексирование И как целого документа, так и его части.

Для И нередко используются заглавия текстов. При И опускаются сопутствующие предметы или темы. Это служит причиной того, что при поиске не найденными остаются тексты, для которых предмет или тема информационного запроса является не главной, а сопутствующей. Различают 2 основных типа И. классификационное и координатное. При классификационном И, или классифицировании, тексты в зависимости от их содержания включаются в соответствующий класс один или несколько, в котором собираются все тексты, имеющие в основном одинаковое смысловое содержание.

Каждому такому тексту присваивается индекс этого класса, служащий далее его поисковым образом. При координатном И основное смысловое содержание текста выражается перечнем полнозначных слов, выбираемых либо из самого текста или его заглавия, либо из специального нормативного словаря. В первом случае такие лексические единицы называются ключевыми словами, а во втором дескрипторами. Каждое ключевое слово или дескриптор обозначает класс, в который потенциально входят все тексты, где в выражения основного смыслового содержания входит это слово. Логическое произведение классов, которые обозначены всеми словами, выражающими в совокупности основное смысловое содержание текста, как бы образует некоторый сложный класс.

Построенный таким способом сложный класс обозначается перечнем ключевых слов или дескрипторов, и этот перечень служит поисковым образом данного текста или выражением на информационно - поисковом языке смыслового содержания запроса.

Таким образом, при координатном И смысловое содержание текста выражается как бы указанием его координат в некотором n-мерном смысловом пространстве. Разновидностью координатного И является пермутационное, или циклическое, И, которое основано на использовании ключевых слов заглавия текста и заключается в том, что все ключевые слова заглавия вместе с контекстом поочердно выводятся в поисковую колонку. В этой колонке ключевые слова даются в алфавитном порядке. На основе координатного И созданы и более сложные информационно-поисковые языки.

Основное преимущество координатного И перед классификационным заключается в том, что координатное И не создат никаких затруднений при поиске текстов по любому, заранее не предусмотренному сочетанию признаков. Особым типом И следует считать раскрытие смыслового содержания текста через приводимую вместе с ним библиографию имена авторов и библиографические описания их работ, на которые ссылается автор данного текста.

Такое И служит основой для составления указателей цитированной литературы весьма эффективного инструмента не только для поиска документов, но и для решения других задач науковедческих, прогностических и т. д

– Конец работы –

Эта тема принадлежит разделу:

Основные принципы информационно-поисковых систем

Одним из наиболее ярких явлений этого процесса является возникновение и развитие глобальной информационной компьютерной сети. С появлением… В самом деле, если подумать то Интернет- это единая информационная среда, но с… Да и не только Интернет стал толчком для создания Информационно-поисковых систем.

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Информационный язык

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Понятие информационно - поисковой системы
Понятие информационно - поисковой системы. Информационно-поисковая система - совокупность информационно поискового правил перевода с естественного языка на информационно - поисковый и обратного пер

Архитектура современных информационно-поисковых систем WWW
Архитектура современных информационно-поисковых систем WWW. Рассмотрим типовую схему такой системы. В различных публикациях, посвященных конкретным системам, приводятся схемы, которые отличаются др

Информационные ресурсы и их представление в системе
Информационные ресурсы и их представление в системе. Как видно из схемы документальным массивом ИПС Internet является все множество документов шести основных типов WWW-страницы, Gopher-файлы, докум

Традиционные информационно-поисковые языки и их модификации
Традиционные информационно-поисковые языки и их модификации. Наиболее распространенным ИПЯ является язык, позволяющий составить логические выражения из набора терминов. При этом используются

Информационно-поисковые языки Интернет
Информационно-поисковые языки Интернет. При описании и классификации информационно-поисковых систем ставилась задача проанализировать наиболее популярные и наиболее типичные системы, которыми польз

Применение языков на практике
Применение языков на практике. Рассмотрим теперь небольшой сравнительный пример использования описанных выше поисковых машин. В качестве запроса использовалась фраза Best on the Web Подразумевалось

Интерфейс системы
Интерфейс системы. Важным фактором является вид представления информации в программе-интерфейсе. При этом различают два типа интерфейсных страниц страницы запросов и страницы результатов пои

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги