Рассмотрим пример;
В1 | В2 | min | |
А1 | 5 | ||
А2 | |||
max | 6 |
λ =5;
β = 6;
λ ≠β;
В этой задаче нет седловой точки и игроки должны применять смешанные стратегии. Для нахождения смешанных стратегий используется несколько методов:
1) Определение цены игры методом подбрасывания монеты;
2) Определение относительных частот применения смешанных стратегий;
3) Использование частот и вероятностей, полученных при многократной игре;
Определение цены игры методом подбрасывания монеты:
В1 | В2 | min | |
А1 | 5 | ||
А2 | |||
max | 6 |
Пусть смешанная стратегия игрока А определяется подбрасыванием монеты:
А1 – «орел», А2 – «решка».
Средний выигрыш против первой стратегии:
а против второй:
В обоих случаях результат для игрока А будет лучше, чем при выборе любой стратегии. Цена игры всегда лежит в пределах: λ.
Определение относительных частот применения смешанных стратегий:
В1 | В2 | ||
А1 | |||
А2 | |||
Если игра не имеет седловой точки, то наилучшей будет смешанная стратегия. Для нахождения оптимальной стратегии нужно выполнить следующее:
a)Рассмотрим стратегии игрока В. Из первой строки вычитаем числа второй, тогда частоту применения первой стратегии примем равной 4, а частоту второй стратегии – 1, то есть стратегии игроком В1 и В2 должны применятся в отношении 4:1
Отметим, что если число, характеризующее относительную частоту окажется отрицательным, то на знак не обращают внимания.
б) Аналогичным образом определяются частоты применения стратегий игрока А и они относятся как 2:3.
в) Найдем цену игры при применении против первой стратегии игрока В. Она будет равна:
Можно убедиться, что средний выигрыш игрока А в данном случае больше, чем при применении любых других стратегий.
Использование вероятностей применения стратегий для получения цены смешанных стратегий.
В случае если нижняя цена игры меньше верхней, то седловой точки нет. В этом случае для каждого игрока нужно указать вектор частот, с которыми нужно применять ту или иную стратегию.
Для игрока А: Р=(р1…рm), где р1 +…+ рm =1.
Pi ≥0 – частота применения стратегии Аi.
Для игрока В: Q =(q1…qn), где q1+…+qn =1.
qj≥0 – частота применения стратегии Вj
В этом случае средний выигрыш игрока А:
νА (P0Q)≤ νA(P0Q0)≤ νA(PQ0)
оптимальная цена игры
В этом случае νA(P0Q0 ) называют ценой игры и обозначают через ν и λ≤ν≤β.
Пример:
Рассмотрим решение игры(смотри таблицу.
q 1-q В данном примере седловая точка отсутствует, тогда оптимальная
В1 | В2 | λ | |
А1 | - 5 | -5 | |
А2 | -7 | -7 | |
β |
цена игры
-5≤ν≤4
Припишем строкам вероятности р и 1-р.
Умножив столбец поэлементно на первый столбец и сложив произведения получим линейную зависимость:
W(p) = -5p+4(1-p)= -9p+4 (1) – это средний выигрыш игрока А при применении игроком В первой стратегии.
Умножив столбец поэлементно на второй столбец и сложив произведения получим
W(p) = 8p+(-7)(1-p)= 15p-7(2) – это средний выигрыш игрока А при применении игроком В второй стратегии.
Приравняем (1) и (2)
-9p+4=15p-7 Отсюда p1= ; p2=1-p1= ;
Таким образом оптимальная смешанная стратегия игрока А - это p(), т.е. игрок А должен применять первую стратегию игрока В с частотой p1= и вторую стратегию игрока В с частотой p2= .
Подставив в зависимости (1 и 2) соответственно p1 и p2 получим цену игры ν1А =; ν2А = (3)
Теперь припишем столбцам вероятности q и 1-q. Умножив строку (q ,1-q) на левую строку и сложив произведения, получим W(q) = (- 5)q+8(1-q)= -13q+8 (4) – средний выигрыш игрока А при применении им первой стратегии.
Аналогично со второй строкой
W(q) = 4q+(-7)(1-q)= 11q-7 (5) – средний выигрыш игрока А при применении им второй стратегии.
Приравнивая зависимости 4 и 5 получим
-13q+8=11q-7 q1= ; q2=1- = , т.е. оптимальная смешанная стратегия игрока В – это Q ( ;)
Подставив в зависимости(4,5) соответственно q1 и q2 , получим цену игры игрока В.
ν1В = ν2В = - (6)
Сравнивая (3 и 6) находим что ν1А = ν2В = -- это и есть оптимальная цена игры, которая возможна при оптимальной смешанной стратегии P0= и Q0=.
Таким образом оптимальная цена игры νА () = - и действительно -5≤ - ≤ 4