Словари тезаурусы

Словари тезаурусы. Следующий тип словарей - тезаурусы греч. thesauros - сокровище сокровищница Зарецкая Е. Н. Риторика Теория и практика речевой коммуникации 4-е изд М. Дело 2002 480 с Тезаурус - это идеографический словарь в котором показаны семантические отношения родовидовые синонимические и др. между лексическими единицами.

Структурной основой тезауруса обычно служит иерархическая система понятий обеспечивающая поиск от смысла к лексическим единицам т.е. поиск слов исходя из понятия. Для поиска в обратном направлении т.е. от слова к понятию используется алфавитный указатель. В идеале тезаурус должен быть устроен следующим образом. Выбирается самое общее понятие связанное с человеческими представлениями о мире скажем Вселенная.

Оно задается некоторым словом. Потом это понятие расчленяется на два в тезаурусе лучше использовать бинарную т.е. двоичную систему членения хотя это и необязательно других понятия. Например живое - неживое т.е. Вселенная будет члениться на живую природу и неживую природу. Живая природа может быть расчленена на разумное и неразумное. Разумное членится на мужчин и женщин. Неразумное - на органическое и неорганическое и т.д. В результате последовательного двоичного членения каждого понятия получается древообразная структура Мурина Л.А. Ровдо И.С. Долбик Е.Е. Экзамен по русскому языку.

Пособие для поступающих в вузы. Л.А.Мурина И.С.Ровдо Е.Е.Долбик и др Минск ТетраСистемс 2000 255 с Вселенная 1 Живое 2.1. Неживое 2.2. Разумное 3.2.1.1. Неразумное 3.2.1.2. Мужчины 4.3.2.1.1.1. Женщины 4.3.2.1.1.2. Органическое 4.3.2.1.2.1. Неорганическое 4.3.2.1.2.2. Тезаурус - это огромное понятийное дерево заключающее общее знание человека о мире. Внизу этого дерева находятся далее нечленимые в смысловом отношении конкретные понятия.

Например слово слеза которое вряд ли в смысловом отношении можно разделить. Те единицы которые находятся внизу дерева т.е. далее нечленимые называются терминальными элементами. Вне всякого сомнения может быть нарисовано не все такое дерево а только какой-то узел. Поэтому обычно в тезаурусе дерево представлено так каждый узел дерева снабжен номером - первая цифра соответствует удалению от вершины вторая показывает соответствует эта единица более левой или более правой ветви.

В словаре около каждого слова должен стоять номер вне зависимости от того терминальное это слово т.е. связанное с нечленимым понятием или находящееся в узлах. Словарь-тезаурус в частности является блестящим словарем синонимов потому что в один и тот же узел попадают слова представляющие в языке сходное значение ведь это понятийный словарь. Два множества на которые распадается узел между собой являются антонимами.

Такой словарь антонимов оказывается полным и точным так как каждое понятие представлено набором конкретных языковых единиц. Словари синонимов и антонимов - побочные результаты создания тезауруса. Первый тезаурус изданный в середине прошлого века построен П.М. Роже. Он существует в двух видах на английском и французском языках. По-английски он называется Rogets International Thesaurus of English words and phrases. Тезаурус Роже построен не на бинарном принципе членения. В качестве главного выделено понятие Категории Categories которое членится на 8 смысловых частей Абстрактные отношения Abstract relations Космос Space Физические явления Physics Вещество Matter Ощущение Sensation Разум Intellect Воля Volition и Любовь Affections каждая из которых в свою очередь членится на несколько других и т.д. пока не образуются синонимические ряды слов которые и представляют собой терминальные блоки Мурина Л.А. Ровдо И.С. Долбик Е.Е. Экзамен по русскому языку.

Пособие для поступающих в вузы. Л.А.Мурина И.С.Ровдо Е.Е.Долбик и др Минск ТетраСистемс 2000 255 с Для абсолютного большинства языков мира полных тезаурусов не существует до сих пор. Но существуют тезаурусы частичные не всего языка а подъязыков например тезаурус металлургии медицинский тезаурус и т.д. В практике информационной работы большое распространение получили информационно-поисковые тезаурусы главная задача которых - единообразная замена лексических единиц текста стандартизованными словами и выражениями дескрипторами при индексировании документов и использование родовидовых и ассоциативных связей между дескрипторами при автоматизированном информационном поиске документов.

В теоретическом отношении тезаурус имеет непреходящую ценность так как структурирует представление человечества о мире. Кроме того тезаурус является одной из возможных моделей семантической системы лексики.