Теория свидетельств Демпстера-Шефера

Подход, принятый в теории Демпстера-Шефера (ТДШ) [64] отличается от байесовского подхода и метода коэффициентов уверенности тем, что, во-первых, здесь используется не точечная оценка уверенности (коэффициент уверенности), а интервальная оценка. Такая оценка характеризуется нижней и верхней границей, что более надежно. Во-вторых, ТДШ позволяет исключить взаимосвязь между неопределенностью (неполнотой знаний) и недоверием, которая свойственна байесовскому подходу.

В рамках ТДШ множеству высказываний А приписывается диапазон значений [Bl(А),Р1(А)], в котором находятся степени доверия (правдоподобия) каждого из высказываний. Здесь В1(А) - степень доверия к множеству высказываний, изменяющая свои значения от 0 (нет свидетельств в пользу А) до 1 (множество высказываний А истинно); Р1(А) - степень правдоподобия множества высказываний А, определяемая с помощью формулы: Pl(A) = 1-Bl(not A)

Предположим, что существуют две конкурирующие гипотезы h₁ и h₂. При отсутствии информации, поддерживающей эти гипотезы, мера доверия и правдоподобия каждой их них принадлежат отрезку [0; 1]. По мере накопления эти интервалы будут уменьшатся, а доверие гипотезам – увеличиваться. В теории Демпстера-Шефера неопределенность знаний представляется с помощью некоторого множества X. Элементы этого множества соответствуют возможным фактам или заключениям. Неопределенность состоит в том, что заранее неизвестно, какое из возможных значений примет факт или заключение х Î X. Для характеристики степени определенности в ТДШ вводится некоторая единичная мера уверенности (ее называют также единичной массой уверенности), которая распределяется между элементами X. При этом, если вся масса (степень) уверенности приходится на один элемент х Î X, то никакой неопределенности нет. Неопределенность возникает, когда масса уверенности распределяется между несколькими элементами х Î X. Распределение масс уверенности (Рисунок 6.2) между элементами множества X, представлено в виде точек [64].Здесь Х={х₁, х₂, х₃}.

Рисунок 6.2 Распределение масс уверенности

С каждым элементом множества X жестко связана соответствующая масса уверенности. Так, х₁ соответствует m₁= 0,3 x₂-m₂= 0,1 x₃-m₃= 0,2. Имеются также свободные массы уверенности m₄= 0,2 m₅= 0,2, которые относятся сразу к нескольким элементам. Масса m₄ свободно перемещается между элементами x₁ и x₂, а масса m₅ - между элементами x₂ и x₃, т.е. m₄ закреплена за подмножеством {x_1, x₂}, а m₅- за подмножеством {x_2, x₃, }. Массы выражают степень уверенности в возможных значениях фактов или заключений. Так, степень уверенности в значении х₁ может изменяться от 0,3 до 0,5. Таким образом, степень незнания соответствует массе, местоположение которой не определено.

В общем случае распределение масс уверенности задается функцией m(А), обладающей следующими свойствами:

m(Ø)=0,

∑m(А)=1,

Здесь А - множество, образованное из подмножеств X, которым назначены соответствующие массы (степени) уверенности; m(А)- функция, которая задает отображение А на интервал [0, 1]. Для примера (Рисунок 6.2) имеем:

А = {Ø, {х₁}, {х₂}, {х₃}, {х₁,х₂}, {х₂,х₃}, {х₁,х₃}},

а распределение масс уверенности задаётся функцией m(А), характеризуемой множеством значений:

т(А) = {0; 0,3; 0,1; 0,2; 0,2; 0,2; 0}.

Обратим внимание, что А состоит из подмножеств. Обозначим каждое такое подмножество через А_i. Степень доверия к высказываниям, соответствующим подмножеству А_i, может быть вычислена по формуле

Здесь суммирование выполняется по всем остальным подмножествам A_j входящим A₁ . Например:

Bl({х₁,х₂}) = m(A₁)+m(A₂)+m(A₃)=m({x₁})+m({x₂})+m({x₁, x₂})=

0.3+0.1+0.2=0.6

Результаты вычислений степеней правдоподобия даны ниже (Таблица 6.2).

Таблица 6.2 Значения Bl(A_i) и Pl(A_i)

A_i	Ø	{х₁}	{х₂}	{х₃}	{х₁,х₂}	{х₂,х₃}	{х₁,х₃}	X
Bl(A_i)		0.3	0.1	0.2	0.6	0.5	0.5
Pl(A_i)		0.5	0.5	0.4	0.8	0.7	0.9

Степень правдоподобия подмножества А_i определяется по формуле:

Величины Bl(A_i) и Pl(A_i) имеют простую интерпретацию: Bl(A_i) представляет общую массу уверенности, которая остается, если из X удалить все элементы, не ассоциируемые с A_i. Pl(A_i) представляет максимальную массу уверенности, которую можно получить, если сдвинуть свободные массы к элементам множества A_i. Причем Bl(A_i) ≤ Pl(A_i) . Иными словами, Bl(A_i) представляет нижнюю границу доверия к A_i, а Pl(A_i) - верхнюю.

Важнейшим элементом ТДШ является правило комбинации свидетельств:

Сумма в числителе правила распространяется на множество A_k = A_1i ∩ A_2j. Правило является эвристическим и позволяет осуществлять распределение степеней доверия в ходе вывода. Например, мерой доверия m_n(Z) гипотезе Z – для n=3 источников свидетельств считается сумма произведений гипотетических мер доверия m₁(X) и m₂(Y), совместное вхождение которых поддерживает Z, т.е. X ∩ Y =Z. Знаменатель в правиле Демстера допускает пустое пересечение X Y, а сумма мер доверия должна быть нормализована.

Рассмотрим применение правила Демпстера для задачи медицинской диагностики, описанное в [76].

Предположим, что рассматривается область Q, содержащая четыре гипотезы:

1. пациент был без сознания (С);

2. у него был грипп (F);

3. мигрень (H);

4. менингит (М).

Необходимо связать меры доверия со множествами гипотез в рамках Q. Например, лихорадка свидетельствеут в пользу {C,F,M}. Так как елементы Q трактуется как взаимоисключающие гипотезы, подтверджение одной из них может влиять на достоверность других.

Пусть есть свидетельство, что у пациента лихорадка. Оно поддерживает {C,F,M} с вероятностью 0,6. Назовем это первой мерой доверия m₁. Если это всего лишь гипотеза, то m₁{C,F,M}=0,6 , где m₁{Q}=0,4 остаток (1-0.6) оставшуюся часть распределения достоверности, т.е. все другие возможные меры доверия Q, а не достоверность дополнения {C,F,M}.

Затем были получен факт о новом проявлении болезни- у пациента рвота, которая свидетельствует о {С,F,Н} со степенью доверия 0,7. Пусть это будет мера доверия свидетельства m₂. Тогда имеем m₂{C,F,Н}=0,7 , где m₂{Q}=0,3.

Получаем таким образом множество X – набор подмножеств Q на котором m₁принимает ненулевые значения, и Y - набор подмножеств Q на котором m₂принимает ненулевые значения.

Применим правило Демпстера [76] для определения объединенной меры доверия m₃: перемножим X и Y. Знаменатель равен 1, т.к. пока не существует пустых множеств X ∩ Y. Результат вычислений Таблица 6.3.

Таблица 6.3 Применение правила Демстера для объединения свидетельств m₁и m₂

m₁	m₂	m₃
m₁{C,F,M}=0,6	m₂{C,F,Н}=0,7	m₂{C,F}=0,42
m₁{Q}=0,4	m₂{C,F,Н}=0,7	m₂{C,F,H}=0,28
m₁{C,F,M}=0,6	m₂{Q}=0,3	m₂{C,F,M}=0,18
m₁{Q}=0,4	m₂{Q}=0,3	m₃{Q}=0,12

Обратите внимание на рассуждения и группировки гипотез. Четыре множества столбца m₃ представляют собой все возможные пересечения X и Y. Этих данных явно недостаточно для установки диагноза, что и отражают полученные числа.

Добавим данные лабораторного анализа, который свидетельствует в пользу менингита m₄{M}=0,8 и m₄{Q}=0,2.

Применим еще раз правило Демпстера [76] для определения объединенной меры доверия m_5. Результат вычислений Таблица 6.4.

Так как m₅{M} получается в нескольких случаях, то общая вероятность m₅{M}=(0,144+0,096)=0,240.

В результате пересечения нескольких пар множеств получается пустое множество {}, значит знаменатель в уравнение Демпстера нужно считать как

(1-(0,336+0,224))=0,44.

Таблица 6.4 Применение правила Демстера для объединения свидетельств m₃и m₄

m₃	m₄	m₅
m₂{C,F}=0,42	m₄{M}=0,8	m₅{}=0,336
m₃{Q}=0,12	m₄{M}=0,8	m₅{M}=0,096
m₂{C,F}=0,42	m₄{Q}=0,2	m₅{C,F}=0,084
m₃{Q}=0,12	m₄{Q}=0,2	m₅{Q}=0,024
m₂{C,F,H}=0,28	m₄{M}=0,8	m₅{}=0,224
m₂{C,F,M}=0,18	m₄{M}=0,8	m₅{M}=0,144
m₂{C,F,H}=0,28	m₄{Q}=0,2	m₅{C,F,H}=0,056
m₂{C,F,M}=0,18	m₄{Q}=0,2	m₅{C,F,M}=0,036

Окончательные значения меры доверия имеют вид:

m₅{M}=0,240/0.44=0.545	m₅{C,F}=0.084/0.44=0.191
m₅{C,F,H}=0.056/0.44=0.127	m₅{C,F,M}=0,82

m₅{}=0,336+0.224=0.56

m₅{Q}=0,024/0.44=0.055

Высокая достоверность пустого множества m₅{}=0.56 означает существование конфликта свидетельств на множестве мер доверия m_j т.к. в примере даны некорректные с точки зрения медицины данные.

При существовании больших множеств гипотез вычисление мер доверия может оказаться громоздким, но все же значительно меньше чем при использовании теоремы Байеса (раздел 6.2).

Правило Демстера- пример рассуждений субъективных вероятностей, в отличие от объективных вероятностей Байеса.