Унифицированная система медицинского языка UMLS

 

В 1986 году Национальная медицинская библиотека США начала разработку Унифицированной системы медицинского языка UMLS. Ее основная цель - значительное улучшение возможностей поиска биомедицинской информации и обеспечение интеграции различных информационных систем, включая системы ведения электронной истории болезни, библиографические и фактографические базы данных, экспертные системы. В результате работы над системой UMLS были созданы три источника знаний:

- метатезаурус;

- лексикон SPECIALIST;

- семантическая сеть.

Метатезаурус обеспечивает синонимическую связь между различными терминами, взятыми из 60 биомедицинских словарей и классификаций, в том числе не англоязычных. Версия 2000 года охватывает 730 155 концепций, 1 338 650 терминов и 1 718 083 строки источников, в том числе 39 768 строк русских рубрик классификации MeSH. Наибольший вклад в метатезаурус принадлежит рубрикатору MeSH (426 716 строк), затем системе клинических кодов Рида (347 569 строк) и номенклатуре SNOMED International, версия 3.5 (164 180 строк). Для сравнения укажем, что классификация МКБ-10 (ICD-10) представлена в метатезаурусе 13 503 строками.

Лексикон SPECIALIST содержит синтаксическую информацию о построении многих терминов, сюва-компоненты и ряд английских слов, отсутствующих в метатезаурусе.

Семантическая сеть классифицирует каждую концепцию (например, <Заболевание или синдром>, <Вирус>), описывает возможные связи между концепциями (например, <Вирус> вызывает <Заболевание или синдром>, отношения обобщения и детализации, и др.).

Таким образом, Унифицированная система медицинского языка является не самостоятельной классификацией наподобие МКБ, а надстройкой над наиболее известными биомедицинскими классификациями, значительно облегчающей поиск литературных источников и построение медицинских баз знаний.