Критерий Неймана—Пирсона

 

При построении некоторых систем распознавания могут быть неизвестны не только априорные вероятности появления объектов соответствующих классов, но и платежная матрица (1.7). В подобных системах для построения алгоритма классификации целесообразно воспользоваться критерием Неймана—Пирсона, суть которого состоит в следующем. Исходя из того, какие решения принимаются на основании результатов распознавания неизвестных объектов, определяется допустимое (заданное) значение условной вероятности ошибки первого рода, затем определяется такая граница между классами, придерживаясь которой удается добиться минимума условной вероятности ошибки второго рода.

Пусть из каких-либо соображений принято решение, что допустимая условная вероятность ошибки первого рода не должна превышать некоторой постоянной величины А, т. е. Q1£A.

Требуется определить решение х0 задачи при ограничении вида Очевидно, что решение х0 удовлетворяет уравнению так как при выборе другого значения х¢00 условная вероятность ошибок второго рода Q2 возрастает. Выбрать же х¢00 нельзя по условиям задачи.

В заключение рассмотрим геометрическую интерпретацию названных критерив. Для этого в координатах D2 = 1 — Q2 и Q1 построим рабочую характеристику (рис. 4.4), заметив, что когда Q1 = 0, то Q2=1 и D2=0, и, наоборот, при Q1 = l Q2 = 0 и D2=l. Так как

 

 

то, продифференцировав D2 пo Q1 получим

 

 

Но ¶D2/¶Q1 есть тангенс угла наклона касательной к рабочей характеристике при l=l0. Поэтому для определения Q1 и D2 на основе применения критерия Байеса на рабочей характеристике найдем точку, касательная в которой имеет наклон, равный l0=P(Ωl)c1/P(Ω2)c2, т. е. tga = A0. Теперь ордината этой точки определяет условную вероятность правильного решения, а абсцисса — условную вероятность ошибки первого рода.

Для определения Q1 и D2 на основе использования минимаксного критерия необходимо учесть, что производная от среднего риска по априорной вероятности P(Ω1) в точке его максимума равна нулю. Так как `R=c11P(Ωl)(1— Ql) + cl2P(Ωl)Ql + c22[l-P(Ω1)]D2 + c21[l-P(Ω1)](l-D2), то ¶R/¶P(Ωl) = c11(l-Ql)+ c12Q1—c22D2 — c21(1 - D2)=0. В координатах Q1 и D2 — это уравнение прямой. Если с11 = с22, то

 

(4.41)

 

с угловым коэффициентом g = tgb=(c11— c12)/(c21 — с22).

Проведем на графике (см. рис. 4.4) эту прямую АВ. Координаты точки пересечения прямой с рабочей характеристикой определяют условные вероятности Q1 и D2=l — Q2 в условиях применения минимаксного критерия. Тангенс угла наклона касательной в этой точке равен l0.