Постановка задачи распознавания

 

Пусть задано множество объектов или явлений Ω={w1 ..., ..., wz}, а также множество возможных решений L={l1, ..., lk}, которые могут быть приняты системой управления по результатам решения задачи распознавания. Введем в рассмотрение множество возможных вариантов разбиения объектов на классы А = {А1 ..., Аr}. Будем полагать, что если выбран вариант разбиения Аα,α=1,...,r, то множество Ω подразделяется на mα классов, т. е.

Пусть первоначальная информация позволяет построить априорное признаковое пространство (составить априорный словарь признаков), описываемое многомерным вектором хα= {х1 ..., xN} Информация относительно множества решений L={11, ..., lk} позволяет произвести исходное разбиение множества объектов на классы, т. е. составить априорный алфавит классов. В первом варианте подразделения объектов на классы (α= 1), т. е. когда Аα1 их число равно mα=m1=k+1. Исходное множество объектов Ω = {w1, ..., wz} (обучающую выборку) подразделим на подмножества — классы

Пусть первоначальная информация позволяет построить априорное признаковое пространство (составить априорный словарь признаков), описываемое многомерным вектором xα={x1, ..., .., xN}. Информация относительно множества решений L= {11, ..., lk } позволяет произвести исходное разбиение множества объектов на классы, т. е. составить априорный алфавит классов. В первом варианте подразделения объектов на классы (α= 1), т. е. когда Aα=A1, их число равно mα=m1=k+1. Исходное множество объектов Ω = { w1, ..., wz } (обучающую выборку) подразделим на подмножества — классы

Если обучающая выборка достаточно представительна, то непосредственной обработкой исходной информации можно определить описания классов.

При статистическом подходе к задаче распознавания такими описаниями являются априорные вероятности Р(ΩA11) появления объектов соответствующих классов, а также условные плотности распределения значений признаков по классам, т. е. функции

Если объем исходной априорной информации недостаточен для непосредственного описания классов, то они могут быть получены с помощью процедуры обучения.

Наличие описаний классов в принципе позволяет определить решающие правила (решающие границы), использование которых обеспечивает минимизацию ошибок при распознавании неизвестных объектов.

Обозначим оценку апостериорной вероятности правильного решения задачи распознавания, усредненную по всем возможным значениям признаков априорного словаря, описываемого вектором хд. Эта оценка может быть получена проведением статистических испытаний (метод Монте — Карло) математической модели системы распознавания (см. гл. 10).

Если бы не было ограничений на величину ресурсов, ассигнованных на построение измерительных устройств, предназначенных для определения признаков х1, х2, ..., то можно было бы полагать, что основные характеристики системы распознавания — алфавит классов и словарь признаков — определены, и можно приступать к построению системы распознавания. В условиях ограничений, когда реализовать априорное признаковое пространство хαα={х1 ..., xN} в полном объеме не представляется возможным, приходится его сокращать по сравнению с априорным, т. е. переходить от априорного словаря признаков к рабочему.

Рассмотрим вектор l={l1 ..., lN}, компоненты которого lj={10 (в зависимости от того, используется ли данный признак априорного словаря в рабочем словаре или нет). Кроме того, введем обозначение для рабочего словаря xp = {xj1 ..., xjn}, где j1, ..., jnÎ1, ..., N, т. е. множество признаков рабочего словаря состоит из элементов множества признаков априорного словаря (рабочий словарь представляет собой подмножество множества признаков априорного словаря).

Обозначим Сj стоимость создания измерительного устройства, обеспечивающего определение хj-то признака, j=l, ..., N, а С0 — общую величину ресурсов, ассигнованных на создание всех измерителей. Если то в качестве рабочего словаря системы распознавания может быть использован априорный словарь. Однако в общем случае, как правило, суммарная стоимость создания комплекса технических средств, обеспечивающих измерение всех признаков априорного словаря, превышает величину С0, т. е.Затраты на создание комплекса технических средств системы, обеспечивающих измерение признаков рабочего словаря, определяются величинами

Обозначим G(ΩA1i) выигрыш, связанный с реализацией возможных решений при распознавании объекта w, отнесенного к классу ΩAi в варианте классификации А1. Тогда математическое ожидание выигрыша от выбора варианта А1 при использовании априорного словаря признаков

 

(2.3)

 

Величину R уместно рассматривать в качестве критерия эффективности системы распознавания. И следовательно, с его максимизацией нужно связывать увеличение эффективности ее функционирования.

В условиях ограничений, определяемых величиной С0, возникает следующая экстремальная задача: необходимо в пределах С0 найти такой вариант разбиения объектов на классы и такое пространство признаков, при которых обеспечивается максимальное значение критерия эффективности системы R. Другими словами, необходимо определить Аα0 из множества А = {А1, ..., Аα, ..., Аr} и вектор l=l0, которые при наилучшем решающем правиле доставляют экстремальное (максимальное) значение величины R при соблюдении ограничений на величину С£ С0, т.е.

 

(2.4)

 

с учетом

При этом А0 определяет алфавит классов, а l0 — оптимальный рабочий словарь признаков.

Итак, общая постановка проблемы распознавания объектов или явлений может быть сформулирована следующим образом: в условиях первоначального (априорного) описания исходного множества объектов на языке априорного словаря признаков необходимо в пределах выделенных ресурсов на построение измерительной аппаратуры определить оптимальный алфавит классов и оптимальный рабочий словарь признаков, которые при наилучшем решающем правиле обеспечивают наиболее эффективное использование решений, принимаемых по результатам распознавания неизвестных объектов или явлений системой управления.