Частные подходы к принятию решений при распознавании

Решение задачи оптимизации распознавания в рассмотренной постановке требует наличия определенных данных. Когда они отсутствуют, приходится пользоваться частными подходами к принятию решений. Остановимся на некоторых из них.

Критерий заданного превышения максимальной вероятности по отношению ко всем остальным. Положим, что в результате проведения экспериментов у объекта w определены значения v-признаков x1 = x01, ..., хv0v и установлены условные апостериорные вероятности отнесения его к классам Ωi, i= 1, ..., m, т. е. величины Р(Ωiv), где av = {xl= x01, x2= x02, ..., хv= x0v}. Решение о принадлежности этого объекта к тому или другому классу в соответствии с рассматриваемым критерием производится на основании соотношения

 

(9.18)

 

где aij — некоторые числа для какого-либо фиксированного класса i при всех j¹i, j= 1, .., m.

При выполнении условия (9.18) принимается гипотеза Hi которая означает утверждение — объект принадлежит классу Ωi. Величины аij связаны с вероятностями ошибочного решения следующим образом. Обозначим bij вероятность принять гипотезу Hj, в то время как справедлива гипотеза Hi.

 

(9.19)

 

Тогда вероятность ai отклонить гипотезу Hi в то время как она справедлива, равна

 

(9.20)

 

Так как в соответствии с принятым критерием вероятность не совершить ошибку при принятии гипотезы Hi должна быть в аij раз больше вероятности совершить ошибку при том же условии о принятии гипотезы Hi то

 

(9.21)

 

Пусть для каждого f-го класса значения вероятностей bij, ошибочных решений равны между собой, т. e. тогда

Если, кроме того, предположить, что то , где m — число классов, для которых Следовательно,

Пусть тогда если a0 — выбранное значение вероятности ошибочного решения, то в соответствии с (9.19) гипотеза Hi принимается, когда неравенство

 

(9.22)

 

выполняется для всех j¹i, 1£i, j£m. В противном случае необходимо учитывать (v+ 1)-й признак, поскольку при v-признаках не обеспечивается уровень (1 —a0) доверительной вероятности. Например, если вероятность ошибки принять равной a0 = 0,05, то для двух гипотез вероятность отнести объект к одному классу должна быть в 19 раз больше вероятности отнести объект к другому классу. Для трех классов наибольшее значение вероятности P(Ωi|av) должно быть в 38 раз больше всех других вероятностей P(Ωi|av) j¹i, и т. д.

Значение ошибочного решения a0 может быть выбрано из следующих соображений. Пусть при использовании v-признаков получено r исключающих друг друга гипотез Нj, j=1, 2, ..., r. Предположим, что С, — стоимость ошибки при принятии гипотезы Нj и при правильном ответе плата не производится. Тогда математическое ожидание платы за одно решение

 

(9.23)

 

где P(Ωi|av) — вероятность гипотезы Нj, aj — соответствующая вероятность ошибки.

Обозначим Сv+1 стоимость определения (v+l)-ro признака, а Р* — вероятность того, что на (v— 1)-м шаге процесс закончится принятием определенного решения (например, однозначного решения). Тогда после проведения (v — 1)-го эксперимента средняя плата за ошибки, включая стоимость этого эксперимента,

 

(9.24)

 

При рационально принять решение на v-m эксперименте, а при рационально проводить (v+ 1)-эксперимент.

Перепишем неравенствов виде и положим, что aj=a0 при всех j==1, ..., r. Тогда выбранное значение вероятности ошибочного решения

 

(9.25)

 

Критерий идеального наблюдателя (критерий Зигерта—Котельникова). В случае, когда нет возможности определить аи, решение о принадлежности объекта тому или другому классу может быть принято на основе критерия идеального наблюдателя, обеспечивающего минимум ошибочных решений.

Пусть все множество объектов подразделено на классы Ω1 и Ω2 и априорные вероятности появления объектов этих классов равны Р(Ω1)и Р(Ω2). соответственно. Кроме того, стоимости правильных решений с1122=0, а стоимости ошибочных решений c12 = c21.

Критическое (пороговое) значение отношения или коэффициента правдоподобия в этом случае равно отношению априорных вероятностей:

 

(9.26)

 

Пусть экспериментально установлено, что значение признака у распознаваемого объекта будет х=х0. Тогда коэффициент правдоподобия

 

(9.27)

 

В соответствии с критерием идеального наблюдателя объект относится к классу Ω1 если l(х0)<l0, и относится к классуΩ2, если l(х0)>l0

Если установлено значение х0, при котором имеет место равенство P(Ωl)fl(x0) = P(Ω2)f2(x0), то в соответствии с рассматриваемым критерием объект относится к классу Ω1, если измеренное значение признака этого объекта х00, и к классу Ω2, если х0>x0.

Критерий идеального наблюдателя совпадает с критерием максимума апостериорной вероятности, когда число классов m=2. В соответствии с критерием максимума апостериорной вероятности решение о принадлежности объекта классу Ωr, r= 1, ..., m, принимается тогда, когда апостериорная вероятность отнесения объекта к этому классу больше, чем апостериорная вероятность отнесения его ко всем остальным классам, т. е. wÎΩr, если Р(Ωr0)=mахР(Ωr0), i=1, ..., m.

Апостериорные вероятности того, что объект относится к классам Ω1 и Ω2, соответственно равны.

 

(9.28)

 

(9.29)

 

Объект относится к классу Ω1 если

 

(9.30)

 

и к классу Ω2, если

 

(9.31)

 

Граница соответствует равенству

 

(9.32)

 

или с учетом (9.29) и (9.30) — равенству

 

(9.33)

 

Таким образом, критерий максимума апостериорной вероятности, как и критерий идеального наблюдателя, предусматривает в качестве порога критическое значение коэффициента правдоподобия.

Критерий заданного превышения максимальной апостериорной вероятности над суммарной апостериорной вероятностью всех остальных гипотез. Пусть в результате проведения экспериментов установлены значения признаков {x1 = x10, ..., xN=xN0) распознаваемого объекта и пусть, кроме того, В соответствии с рассматриваемым критерием решение о принадлежности распознаваемого объекта к классу Ωr, r=l, ..., m, принимается в случае, если

 

(9.34)

 

Применение подобного критерия оправдано в случаях, когда решение о принадлежности распознаваемого объекта Ωr-му классу сопряжено со значительным риском.

Принятие решений при неполных данных. В ряде практически важных случаев не представляется возможным измерить всю совокупность признаков, используемых для описания объектов. Подобная ситуация имеет место из-за самых разнообразных причин. Например, у врача может не оказаться под рукой той или другой аппаратуры, необходимой для определения соответствующих симптомов заболевания; геолог в полевых условиях, как правило, лишен возможности произвести подробные исследования физических и химических свойств исследуемых материалов, и т. д. Уже говорилось, что в самом общем случае планирования работы систем распознавания решение на проведение очередной серии экспериментов или о прекращении экспериментов производится именно при неполных данных, т. е. когда известна лишь часть признаков, характеризующих распознаваемый объект. В подобных ситуациях решающее правило может быть основано на критерии максимума апостериорной информации. Рассмотрим основные методы решения задачи.

Метод 1. Он может быть использован, когда известна условная плотность вероятности значений любого, наперед заданного подмножества признаков, принадлежащего множеству признаков рабочего словаря.

Положим, что заданы алфавит классов Ωi i= 1, ..., m, априорные вероятности Р(Ωi) рабочий словарь признаков х = {х1 ..., xN}, условные плотности распределения fi(xj1 ..., xjk), где {j1 ..., jk}Î {l,...,N},k£N.

Пусть в результате проведения экспериментов установлены значения некоторых признаков (xj1=x0j1, ..., xjk=x0jk) распознаваемого объекта. Обозначим это событие b и определим значения апостериорной вероятности принадлежности объекта со классам:

 

(9.35)

 

Решающее правило, основанное на критерии максимума апостериорной вероятности, состоит в следующем: wÎΩr, если

Метод 2. Он может быть применен, когда удается определить наиболее вероятные значения признаков, не определяемых экспериментально, и, как и в предыдущем методе, стоимости правильных решений c11 = c22 = 0, а стоимости ошибочных решений c12 = c21.

Обозначим b событие, состоящее в том, что в результате экспериментов установлены значения признаков xl = x10, ..., xN-1= x0N-1 объекта со и, кроме того, xN-k+l =x*N-k+1 ..., xN=x*N, где x*N-k+1 ..., x*N — наиболее вероятные значения признаков объекта e, которые экспериментально не определены. Значения апостериорной вероятности принадлежности объекта w классам таковы:

 

(9.36)

 

Решающее правило, основанное на критерии максимума апостериорной вероятности, состоит в следующем: wÎΩr, если