Смешанные стратегии.

Рассмотрим пример;

  В1 В2 min
А1 5
А2
max 6  

 

λ =5;

β = 6;

λ ≠β;

В этой задаче нет седловой точки и игроки должны применять смешанные стратегии. Для нахождения смешанных стратегий используется несколько методов:

1) Определение цены игры методом подбрасывания монеты;

2) Определение относительных частот применения смешанных стратегий;

3) Использование частот и вероятностей, полученных при многократной игре;

 

Определение цены игры методом подбрасывания монеты:

 

  В1 В2 min
А1 5
А2
max 6  

 

Пусть смешанная стратегия игрока А определяется подбрасыванием монеты:

А1 – «орел», А2 – «решка».

Средний выигрыш против первой стратегии:

 

а против второй:

В обоих случаях результат для игрока А будет лучше, чем при выборе любой стратегии. Цена игры всегда лежит в пределах: λ.

Определение относительных частот применения смешанных стратегий:

 

  В1 В2  
А1
А2
   

 

Если игра не имеет седловой точки, то наилучшей будет смешанная стратегия. Для нахождения оптимальной стратегии нужно выполнить следующее:

a)Рассмотрим стратегии игрока В. Из первой строки вычитаем числа второй, тогда частоту применения первой стратегии примем равной 4, а частоту второй стратегии – 1, то есть стратегии игроком В1 и В2 должны применятся в отношении 4:1

Отметим, что если число, характеризующее относительную частоту окажется отрицательным, то на знак не обращают внимания.

б) Аналогичным образом определяются частоты применения стратегий игрока А и они относятся как 2:3.

в) Найдем цену игры при применении против первой стратегии игрока В. Она будет равна:

Можно убедиться, что средний выигрыш игрока А в данном случае больше, чем при применении любых других стратегий.

 

Использование вероятностей применения стратегий для получения цены смешанных стратегий.

 

В случае если нижняя цена игры меньше верхней, то седловой точки нет. В этом случае для каждого игрока нужно указать вектор частот, с которыми нужно применять ту или иную стратегию.

Для игрока А: Р=(р1…рm), где р1 +…+ рm =1.

Pi ≥0 – частота применения стратегии Аi.

Для игрока В: Q =(q1…qn), где q1+…+qn =1.

qj≥0 – частота применения стратегии Вj

В этом случае средний выигрыш игрока А:

νА (P0Q)≤ νA(P0Q0)≤ νA(PQ0)

оптимальная цена игры

В этом случае νA(P0Q0 ) называют ценой игры и обозначают через ν и λ≤ν≤β.

Пример:

Рассмотрим решение игры(смотри таблицу.

q 1-q В данном примере седловая точка отсутствует, тогда оптимальная

  В1 В2 λ
А1 - 5 -5
А2 -7 -7
β  

цена игры

-5≤ν≤4

Припишем строкам вероятности р и 1-р.

Умножив столбец поэлементно на первый столбец и сложив произведения получим линейную зависимость:

W(p) = -5p+4(1-p)= -9p+4 (1) – это средний выигрыш игрока А при применении игроком В первой стратегии.

Умножив столбец поэлементно на второй столбец и сложив произведения получим

W(p) = 8p+(-7)(1-p)= 15p-7(2) – это средний выигрыш игрока А при применении игроком В второй стратегии.

Приравняем (1) и (2)

-9p+4=15p-7 Отсюда p1= ; p2=1-p1= ;

Таким образом оптимальная смешанная стратегия игрока А - это p(), т.е. игрок А должен применять первую стратегию игрока В с частотой p1= и вторую стратегию игрока В с частотой p2= .

Подставив в зависимости (1 и 2) соответственно p1 и p2 получим цену игры ν =; ν = (3)

Теперь припишем столбцам вероятности q и 1-q. Умножив строку (q ,1-q) на левую строку и сложив произведения, получим W(q) = (- 5)q+8(1-q)= -13q+8 (4) – средний выигрыш игрока А при применении им первой стратегии.

Аналогично со второй строкой

W(q) = 4q+(-7)(1-q)= 11q-7 (5) – средний выигрыш игрока А при применении им второй стратегии.

Приравнивая зависимости 4 и 5 получим

-13q+8=11q-7 q1= ; q2=1- = , т.е. оптимальная смешанная стратегия игрока В – это Q ( ;)

Подставив в зависимости(4,5) соответственно q1 и q2 , получим цену игры игрока В.

ν= ν= - (6)

Сравнивая (3 и 6) находим что ν= ν= -- это и есть оптимальная цена игры, которая возможна при оптимальной смешанной стратегии P0= и Q0=.

Таким образом оптимальная цена игры νА () = - и действительно -5≤ - ≤ 4