Смешанные стратегии.

Рассмотрим пример;

	В₁	В₂	min
А₁			5
А₂
max	6

λ =5;

β = 6;

λ ≠β;

В этой задаче нет седловой точки и игроки должны применять смешанные стратегии. Для нахождения смешанных стратегий используется несколько методов:

1) Определение цены игры методом подбрасывания монеты;

2) Определение относительных частот применения смешанных стратегий;

3) Использование частот и вероятностей, полученных при многократной игре;

Определение цены игры методом подбрасывания монеты:

	В₁	В₂	min
А₁			5
А₂
max	6

Пусть смешанная стратегия игрока А определяется подбрасыванием монеты:

А₁ – «орел», А₂ – «решка».

Средний выигрыш против первой стратегии:

а против второй:

В обоих случаях результат для игрока А будет лучше, чем при выборе любой стратегии. Цена игры всегда лежит в пределах: λ.

Определение относительных частот применения смешанных стратегий:

	В₁	В₂
А₁
А₂

Если игра не имеет седловой точки, то наилучшей будет смешанная стратегия. Для нахождения оптимальной стратегии нужно выполнить следующее:

a)Рассмотрим стратегии игрока В. Из первой строки вычитаем числа второй, тогда частоту применения первой стратегии примем равной 4, а частоту второй стратегии – 1, то есть стратегии игроком В₁ и В₂ должны применятся в отношении 4:1

Отметим, что если число, характеризующее относительную частоту окажется отрицательным, то на знак не обращают внимания.

б) Аналогичным образом определяются частоты применения стратегий игрока А и они относятся как 2:3.

в) Найдем цену игры при применении против первой стратегии игрока В. Она будет равна:

Можно убедиться, что средний выигрыш игрока А в данном случае больше, чем при применении любых других стратегий.

Использование вероятностей применения стратегий для получения цены смешанных стратегий.

В случае если нижняя цена игры меньше верхней, то седловой точки нет. В этом случае для каждого игрока нужно указать вектор частот, с которыми нужно применять ту или иную стратегию.

Для игрока А: Р=(р₁…р_m), где р₁ +…+ р_m =1.

P_i ≥0 – частота применения стратегии А_i.

Для игрока В: Q =(q₁…q_n), где q₁+…+q_n =1.

q_j≥0 – частота применения стратегии В_j

В этом случае средний выигрыш игрока А:

ν_А (P⁰Q)≤ ν_A(P⁰Q⁰)≤ ν_A(PQ⁰)

оптимальная цена игры

В этом случае ν_A(P⁰Q⁰) называют ценой игры и обозначают через ν и λ≤ν≤β.

Пример:

Рассмотрим решение игры(смотри таблицу.

q 1-q В данном примере седловая точка отсутствует, тогда оптимальная

	В₁	В₂	λ
А₁	- 5		-5
А₂		-7	-7
β

цена игры

-5≤ν≤4

Припишем строкам вероятности р и 1-р.

Умножив столбец поэлементно на первый столбец и сложив произведения получим линейную зависимость:

W(p) = -5p+4(1-p)= -9p+4 (1) – это средний выигрыш игрока А при применении игроком В первой стратегии.

Умножив столбец поэлементно на второй столбец и сложив произведения получим

W(p) = 8p+(-7)(1-p)= 15p-7(2) – это средний выигрыш игрока А при применении игроком В второй стратегии.

Приравняем (1) и (2)

-9p+4=15p-7 Отсюда p₁= ; p₂=1-p₁= ;

Таким образом оптимальная смешанная стратегия игрока А - это p(), т.е. игрок А должен применять первую стратегию игрока В с частотой p₁= и вторую стратегию игрока В с частотой p₂= .

Подставив в зависимости (1 и 2) соответственно p₁ и p₂получим цену игры ν_1А =; ν_2А = (3)

Теперь припишем столбцам вероятности q и 1-q. Умножив строку (q ,1-q) на левую строку и сложив произведения, получим W(q) = (- 5)q+8(1-q)= -13q+8 (4) – средний выигрыш игрока А при применении им первой стратегии.

Аналогично со второй строкой

W(q) = 4q+(-7)(1-q)= 11q-7 (5) – средний выигрыш игрока А при применении им второй стратегии.

Приравнивая зависимости 4 и 5 получим

-13q+8=11q-7 q₁= ; q₂=1- = , т.е. оптимальная смешанная стратегия игрока В – это Q ( ;)

Подставив в зависимости(4,5) соответственно q₁и q₂ , получим цену игры игрока В.

ν_1В= ν_2В= - (6)

Сравнивая (3 и 6) находим что ν_1А= ν_2В= -- это и есть оптимальная цена игры, которая возможна при оптимальной смешанной стратегии P⁰= и Q⁰=.

Таким образом оптимальная цена игры ν_А () = - и действительно -5≤ - ≤ 4