Критерий Байеса

Критерий Байеса — правило, в соответствии с которым стратегия решений выбирается таким образом, чтобы обеспечить минимум среднего риска. Применение критерия Байеса целесообразно в случае, когда система распознавания многократно осуществляет распознавание неизвестных объектов или явлений в условиях неизменного признакового пространства, при стабильном описании классов и неизменной платежной матрице.

Минимум риска, усредненного по множеству решений задачи распознавания неизвестных объектов, обеспечивается тогда, когда решения о принадлежности объектов классу Ω₁ и Ω₂ принимаются в соответствии со следующим правилом: если измеренное значение признака у данного объекта расположено в области R₁ то объект относится к классу Ω₁ если в области R₂ — к классу Ω₂

Стратегию, основанную на этом правиле, называют байесовской стратегией, а минимальный средний риск — байесовским риском.

Использование другой стратегии, отличной от байесовской, сопряжено с увеличением среднего риска. Пусть, например, используется некоторая стратегия А, в соответствии с которой решение о принадлежности объекта классу Ω₁ принимается тогда, когда измеренное значение признака х=х⁰<х_А, и классу Ω₂, когда х=х⁰>х_А (рис. 4.2).

Разность среднего риска Rã_А при подобной стратегии и байесовского риска Rã_min в предположении, что с₁₁=c₂₂ = 0, c₁₂ = c₁ и с₂₁ = с₂, составит

(4.25)

В области r₂ÎR₂ .f₂ (x)>l₀f₁(x). Значит, Rã_A—Rã_min>0, т. е. Rã_A>Rã_min

При выборе стратегии В, в соответствии с которой принимается решение о принадлежности объекта классу Ω₁ если х<х_B, и классу Ω₂, если х>х_B, разность средних рисков подобной и байесовской стратегии

(4.26)

В областиЗначит, Rã_B—Rã_min>0, т. е. Rã_B>Rã_min т. е.

Рис. 4.2

Байесовская стратегия может быть описана также следующим образом. Пусть в результате опыта установлено, что значение признака у распознаваемого объекта w составляет величину х=х⁰. Тогда условная вероятность принадлежности объекта классу Ω₁ (условная вероятность первой гипотезы в соответствии с теоремой гипотез или формулой Байеса)

(4.27)

а условная вероятность принадлежности объекта классу Ω₂(условная вероятность второй гипотезы)

(4.28)

где — совместная плотность распределения вероятностей значений признака х по классам, в свою очередь величины— апостериорные вероятности, принадлежности распознаваемого объекта классам Ω₁ и Ω₂, соответственно.

Условные риски, связанные с решениями wÎΩ₁ и wÎΩ₂, соответственно

(4.29)

Система распознавания, основанная на байесовской стратегии, должна решать задачу с минимальным условным риском. Это значит, что предпочтение решению coeCli следует отдавать тогда, когда Подставим в это выражение значения определяемые (4.29). Тогда неравенства или определят, в каких условиях необходимо принять решение о том, что wÎΩ₁

Таким образом, байесовский подход к решению задачи распознавания состоит в вычислении условных апостериорных вероятностей и принятии решения на основании сравнения их значений. Именно такой подход обеспечивает минимум среднего риска и минимум ошибочных решений.

Если число классов больше двух и равно т, то апостериорная вероятность отнесения объекта к Ω-му классу будет

(4.30)

Когда объект характеризуется N признаками x_j, j=1, ..., N и признаки распознаваемого объекта приняли значения x₁ = x⁰₁; х₂ = х⁰₂; ...; x_N=x⁰_N, вероятность того, что при осуществлении события a_N=(x⁰₁, x⁰₂, ..., х⁰_N) объект относится к i-му классу, равна

(4.31)

Рассмотрим другую форму записи байесовского критерия отнесения объекта к соответствующему классу. Пусть имеются классы Ω₁ и Ω₂. Априорные вероятности появления объектов этих классов соответственно P(Ω₁) и Р(Ω₂), с₁₁ ⁼с₂₂ = 0, c_l₂ = c₁ и с₂₁ = с₂. Известны также многомерные условные плотности распределения вероятностей значений признаков f₁ (х₁ ..., x_N) и f₂(х₁..., x_N) по классам. Тогда условные вероятности ошибок первого и второго рода соответственно

(4.32)

Средний риск

(4.33)

Так как интеграл от плотности вероятности по областям R₁ и R₂ равен единице, то

Откуда

(4.34)

Задача состоит в том, чтобы минимизировать значение среднего риска. Для этого необходимо так выбрать области R₁ и R₂, чтобы интеграл в (4.34) принял наибольшее отрицательное значение. Это достигается тогда, когда подынтегральное выражение принимает наибольшее отрицательное значение и вне области R₁ не существует такой области, где подынтегральное выражение отрицательно, т. е. с₂Р(Ω₂)f₂(х₁ ..., x_N) – c₁P(Ω₁)f₁(х₁ ..., x_N)<0. Отсюда следует уже известное решающее правило. Распознаваемый объект w, признаки которого, как установлено в результате проведения экспериментов, равны x_l = x⁰₁, х₂ = х⁰₂, ..., x_N=x⁰_N, относится к классу Ω₁ если

(4.35)

где — пороговое значение коэффициента правдоподобия.