Критерий Байеса

 

Критерий Байеса — правило, в соответствии с которым стратегия решений выбирается таким образом, чтобы обеспечить минимум среднего риска. Применение критерия Байеса целесообразно в случае, когда система распознавания многократно осуществляет распознавание неизвестных объектов или явлений в условиях неизменного признакового пространства, при стабильном описании классов и неизменной платежной матрице.

Минимум риска, усредненного по множеству решений задачи распознавания неизвестных объектов, обеспечивается тогда, когда решения о принадлежности объектов классу Ω1 и Ω2 принимаются в соответствии со следующим правилом: если измеренное значение признака у данного объекта расположено в области R1 то объект относится к классу Ω1 если в области R2 — к классу Ω2

Стратегию, основанную на этом правиле, называют байесовской стратегией, а минимальный средний риск — байесовским риском.

Использование другой стратегии, отличной от байесовской, сопряжено с увеличением среднего риска. Пусть, например, используется некоторая стратегия А, в соответствии с которой решение о принадлежности объекта классу Ω1 принимается тогда, когда измеренное значение признака х=х0А, и классу Ω2, когда х=х0А (рис. 4.2).

Разность среднего риска RãА при подобной стратегии и байесовского риска Rãmin в предположении, что с11=c22 = 0, c12 = c1 и с21 = с2, составит

 

 

(4.25)

 

В области r2ÎR2 .f2 (x)>l0f1(x). Значит, RãA—Rãmin>0, т. е. RãA>Rãmin

При выборе стратегии В, в соответствии с которой принимается решение о принадлежности объекта классу Ω1 если х<хB, и классу Ω2, если х>хB, разность средних рисков подобной и байесовской стратегии

 

(4.26)

 

В областиЗначит, RãB—Rãmin>0, т. е. RãB>Rãmin т. е.

 

 

Рис. 4.2

Байесовская стратегия может быть описана также следующим образом. Пусть в результате опыта установлено, что значение признака у распознаваемого объекта w составляет величину х=х0. Тогда условная вероятность принадлежности объекта классу Ω1 (условная вероятность первой гипотезы в соответствии с теоремой гипотез или формулой Байеса)

 

(4.27)

 

а условная вероятность принадлежности объекта классу Ω2 (условная вероятность второй гипотезы)

 

(4.28)

 

где — совместная плотность распределения вероятностей значений признака х по классам, в свою очередь величины— апостериорные вероятности, принадлежности распознаваемого объекта классам Ω1 и Ω2, соответственно.

Условные риски, связанные с решениями wÎΩ1 и wÎΩ2, соответственно

 

(4.29)

 

Система распознавания, основанная на байесовской стратегии, должна решать задачу с минимальным условным риском. Это значит, что предпочтение решению coeCli следует отдавать тогда, когда Подставим в это выражение значения определяемые (4.29). Тогда неравенства или определят, в каких условиях необходимо принять решение о том, что wÎΩ1

Таким образом, байесовский подход к решению задачи распознавания состоит в вычислении условных апостериорных вероятностей и принятии решения на основании сравнения их значений. Именно такой подход обеспечивает минимум среднего риска и минимум ошибочных решений.

Если число классов больше двух и равно т, то апостериорная вероятность отнесения объекта к Ω-му классу будет

 

(4.30)

 

Когда объект характеризуется N признаками xj, j=1, ..., N и признаки распознаваемого объекта приняли значения x1 = x01; х2 = х02; ...; xN=x0N, вероятность того, что при осуществлении события aN=(x01, x02, ..., х0N) объект относится к i-му классу, равна

 

(4.31)

 

Рассмотрим другую форму записи байесовского критерия отнесения объекта к соответствующему классу. Пусть имеются классы Ω1 и Ω2. Априорные вероятности появления объектов этих классов соответственно P(Ω1) и Р(Ω2), с11 =с22 = 0, cl2 = c1 и с21 = с2. Известны также многомерные условные плотности распределения вероятностей значений признаков f11 ..., xN) и f21..., xN) по классам. Тогда условные вероятности ошибок первого и второго рода соответственно

 

(4.32)

 

Средний риск

 

(4.33)

 

Так как интеграл от плотности вероятности по областям R1 и R2 равен единице, то

Откуда

 

(4.34)

 

Задача состоит в том, чтобы минимизировать значение среднего риска. Для этого необходимо так выбрать области R1 и R2, чтобы интеграл в (4.34) принял наибольшее отрицательное значение. Это достигается тогда, когда подынтегральное выражение принимает наибольшее отрицательное значение и вне области R1 не существует такой области, где подынтегральное выражение отрицательно, т. е. с2Р(Ω2)f21 ..., xN) – c1P(Ω1)f11 ..., xN)<0. Отсюда следует уже известное решающее правило. Распознаваемый объект w, признаки которого, как установлено в результате проведения экспериментов, равны xl = x01, х2 = х02, ..., xN=x0N, относится к классу Ω1 если

 

(4.35)

 

где — пороговое значение коэффициента правдоподобия.