Экспертные системы распознавания

 

Рассмотренная классификация систем распознавания и принципы их функционирования отражают современное состояние вопроса. Все виды систем распознавания базируются на строго формализованном описании каждого класса объектов или явлений на языке признаков. Другое дело, как получены эти описания — то ли на основе методов непосредственной обработки исходной информации об объектах, то ли на основе методов обучения или самообучения. И также не имеет значения, какие признаки — детерминированные, вероятностные, логические, структурные или те, и другие, и третьи при этом используются.

Отличительная особенность всех современных функционирующих систем распознавания заключается в том, что их основу составляют вполне определенный алфавит классов и словарь признаков. При этом каждый класс объектов или явлений на основе априорных данных четко описывается на языке этих признаков. Кроме того, в состав математического обеспечения современных систем входят правила принятия решений — алгоритмы распознавания. Они предназначены для сопоставления апостериорной информации о каждом распознаваемом объекте, представляемой в виде совокупности конкретных значений присущих ему признаков, выявленных в результате проведения с помощью измерительных средств опытов, с априорной информацией о классах объектов. На основе этого сопоставления и принимается решение об отнесении неизвестного объекта к определенному классу, если система не отказывается от его распознавания. Последнее происходит, как правило, в тех ситуациях, когда на входе системы появляется объект, относящийся к классу, который не содержится в ее алфавите классов.

Именно рассмотрению современных систем распознавания в указанной трактовке и посвящено содержание настоящей книги.

Рассмотрим вкратце перспективные системы распознавания, связанные с разработкой ЭВМ пятого поколения. Известно, что впервые задача разработки принципиально новых ЭВМ была поставлена японскими учеными и инженерами, создавшими специальный научно-исследовательский центр по обработке информации. В 1981 г. центр опубликовал отчет, содержащий детальный план научно-исследовательских и опытно-конструкторских работ, посвященный созданию к 1991 г. прототипа ЭВМ пятого поколения. Не будем рассматривать особенности этих ЭВМ, связанных с их элементной базой и архитектурой, принципиальными и конструктивными решениями процессоров, запоминающих и терминальных устройств, а также программными средствами и языками программирования, так как имеется сравнительно много публикаций. Важно отметить, что ЭВМ пятого поколения будут «интеллектуальными» машинами, обладающими элементами искусственного интеллекта.

Остановимся на двух, едва ли не основных аспектах искусственного интеллекта, связанных непосредственно с проблематикой распознавания, которые найдут программное отражение в перспективных ЭВМ пятого поколения [4].

Первый аспект искусственного интеллекта состоит в том, что эти машины, как планируется, должны быть приспособленными к «дружелюбному» отношению к пользователям, заключающемуся в том, что последние, даже не специалисты в области ЭВМ, смогут общаться с ними с помощью естественных для человека средств общения — речи, рукописного текста, изображений. Реализация интеллектуального человеко-машинного интерфейса сопряжена с возможностью решения задач распознавания и понимания естественного языка. Для этого ЭВМ пятого поколения будут снабжены системами распознавания (речи, рукописных текстов, изображений), принципиально отличающимися от современных систем распознавания.

Как известно, каждому человеку свойственна своя уникальная дикция, присущ свой уникальный почерк. Это исключает возможность при построении алфавита классов соответствующих систем распознавания пользоваться принципом «буква — класс», так как каждый из нас произносит и пишет любую букву и цифру по-своему. Использование же принципа «слово — класс» привело бы к алфавиту классов необъятных размеров, состоящему из многих сотен или даже тысяч классов. Именно в связи с этими обстоятельствами ЭВМ пятого поколения будут обладать специальными базами знаний, в данном случае знаний в области соответствующего языка — его орфографии, синтаксиса, лексики, формальных правил построения фраз на данном языке. Взаимодействие «понимающих программ» иначе распознающих систем с базами знаний и должно обеспечить эффективный «дружелюбный» диалог на естественном языке пользователя и ЭВМ.

Эффективных «понимающих программ», насколько известно, пока не существует. На описании их прообразов, которые разрабатываются как у нас в стране, так и за рубежом, не будем останавливаться, так как работы в этом направлении находятся на самых ранних стадиях.

Второй аспект искусственного интеллекта, который будет свойствен машинам пятого поколения (хотя можно рассуждать и так: машины пятого поколения обеспечат практическую реализацию ряда аспектов искусственного интеллекта) состоит в широкими эффективном использовании экспертных систем различного назначения. Хотя экспертные системы не являются порождением ЭВМ пятого поколения, они существуют и сегодня, будучи реализованными на современных ЭВМ, тем не менее именно технические характеристики ЭВМ пятого поколения должны обеспечить возможность построения высокоэффективных экспертных систем.

Существуют различные суждения о том, что представляет собой экспертная система. Однако не входя в противоречие с различными точками зрения, можно утверждать следующее. Экспертная система представляет собой совокупность знаний эксперта или группы экспертов в данной конкретной предметной области (например, та или другая область медицины, аэродинамика или газовая диамика, двигатели внутреннего сгорания или реактивные двигатели, турбины газовые или гидравлические и т. п.). Эти знания определенным образом структурированы и программно реализованы в соответствующих базах знаний, доступ к которым осуществляется с помощью информационно-поисковых систем.

Наличие баз знаний в различных предметных областях позволяет широкому кругу пользователей путем диалога с ЭВМ получать нужные сведения. Однако этим не ограничивается назначение перспективных экспертных систем. Более того, это не основное ее назначение. Главное состоит в том, что благодаря специальным программам логических выводов экспертные системы смогут давать интеллектуальные советы или принимать интеллектуальные решения, в том числе при распознавании неизвестных объектов или явлений.

Как и некоторые из существующих в настоящее время систем распознавания, экспертные системы распознавания будут представлять собой многоуровневые системы.

Верхний уровень системы призван на основе обработки логических выводов нижнего (нижних) уровня вырабатывать окончательные решения. При этом системы как нижнего, так и верхнего уровней должны делать выводы не так, как это делается в современных системах распознавания — путем сопоставления измерительной апостериорной информации с априорной, формализованной в виде описания классов на языке признаков, а методами дедукции, индукции, по аналогии с другими методами, свойственными только человеку. Предполагается, что эти функции будут реализованы в виде программного обеспечения на специальных языках, позволяющих решать задачи (в том числе распознавания) с помощью последовательности логических выводов. При этом полученные логические выводы должны порождать новые высказывания, новые знания, пополняющие базу знаний.

Одним из научных фундаментов экспертных систем распознавания является теория нечетких множеств, основы которой созданы американским математиком Л. Заде. Именно классы объектов в этих системах распознавания будут представляться в виде нечетких множеств, а принадлежность объектов или явлений к этим классам будет базироваться на уравнениях, выполняющих функции эквивалентности применительно к данным, характеризующим эти нечеткие множества. При этом значения принадлежности к этим множествам будут определяться либо коэффициентами вероятности, либо коэффициентами принадлежности, которые могут принимать значения и большие единицы.

Введение в рассмотрение нечетких множеств позволяет весьма основательно расширять описания классов за счет полутонов, нюансов, которые бывает подчас достаточно трудно формализовать (например, объект почти круглой формы, нежно-голубого цвета, примерно равный по объему бильярдному шару, и т. п.). Важная особенность экспертных систем распознавания состоит в том, что они будут функционировать в режиме диалога пользователя (врача — в системах медицинской диагностики, инженера — в системах технической диагностики и т. д.) с ЭВМ. Машина, получив исходную экспериментальную информацию о распознаваемом объекте или явлении, выбрав необходимые знания из базы знаний и произведя надлежащие логические выводы и применяя методы индукции, дедукции, аналогии, генерирует гипотезы о принадлежности распознаваемого объекта к тому или иному классу, не противоречащие полученной информации. Кроме того, машина определяет и сообщает пользователю, какую необходимо получить дополнительную информацию об объекте или явлении. Ее использование в процедурах распознавания может привести либо к установлению одной-единственной гипотезы (не обязательно из числа первоначально сформированных), либо к генерированию новых. В ходе последующего диалога, реализуемого на основе получения дополнительной информации, формируется окончательное решение о распознаваемом объекте или явлении.

 

Глава 2 ОБЩАЯ ПОСТАНОВКА ПРОБЛЕМЫ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ЯВЛЕНИЙ

 

Выше были обсуждены основные задачи, возникающие при построении систем распознавания, и приведена достаточно полная их классификация. Теперь рассмотрим содержательную и формальную постановку проблемы распознавания, базирующиеся на следующих положениях. Во-первых, решение задач распознавания требует в общем случае построения специальной системы распознавания. Во-вторых, решение задачи распознавания необходимо (также в общем случае) для того, чтобы система управления, стоящая над системой распознавания, могла принимать правильные решения. Например, система медицинской диагностики призвана устанавливать диагноз больных для того, чтобы врач мог принимать обоснованные решения о выборе стратегии лечения; система геологической разведки — распознавать наличие и характеристики полезных ископаемых в интересах принятия решений относительно их разработки; система распознавания целей — определять их вид, назначение, характеристики для того, чтобы принимались решения относительно необходимых мер противодействия этим целям, и т. д.

Исходя из сказанного, системы распознавания должны строиться так, чтобы обеспечивать системе управления возможность наиболее эффективно распоряжаться своими ресурсами, допустимым набором решений, а само построение систем распознавания, как и любых технических систем, не может быть осуществлено без учета соответствующих ограничений.

Предлагаемая ниже постановка проблемы распознавания существенно отличается от традиционной, утвердившейся в литературе по распознаванию образов.