Реферат Курсовая Конспект
Смешанные стратегии. - Лекция, раздел Науковедение, Курс лекций по дисциплине: МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ Рассмотрим Пример; В...
|
Рассмотрим пример;
В1 | В2 | min | |
А1 | 5 | ||
А2 | |||
max | 6 |
λ =5;
β = 6;
λ ≠β;
В этой задаче нет седловой точки и игроки должны применять смешанные стратегии. Для нахождения смешанных стратегий используется несколько методов:
1) Определение цены игры методом подбрасывания монеты;
2) Определение относительных частот применения смешанных стратегий;
3) Использование частот и вероятностей, полученных при многократной игре;
Определение цены игры методом подбрасывания монеты:
В1 | В2 | min | |
А1 | 5 | ||
А2 | |||
max | 6 |
Пусть смешанная стратегия игрока А определяется подбрасыванием монеты:
А1 – «орел», А2 – «решка».
Средний выигрыш против первой стратегии:
а против второй:
В обоих случаях результат для игрока А будет лучше, чем при выборе любой стратегии. Цена игры всегда лежит в пределах: λ.
Определение относительных частот применения смешанных стратегий:
В1 | В2 | ||
А1 | |||
А2 | |||
Если игра не имеет седловой точки, то наилучшей будет смешанная стратегия. Для нахождения оптимальной стратегии нужно выполнить следующее:
a)Рассмотрим стратегии игрока В. Из первой строки вычитаем числа второй, тогда частоту применения первой стратегии примем равной 4, а частоту второй стратегии – 1, то есть стратегии игроком В1 и В2 должны применятся в отношении 4:1
Отметим, что если число, характеризующее относительную частоту окажется отрицательным, то на знак не обращают внимания.
б) Аналогичным образом определяются частоты применения стратегий игрока А и они относятся как 2:3.
в) Найдем цену игры при применении против первой стратегии игрока В. Она будет равна:
Можно убедиться, что средний выигрыш игрока А в данном случае больше, чем при применении любых других стратегий.
Использование вероятностей применения стратегий для получения цены смешанных стратегий.
В случае если нижняя цена игры меньше верхней, то седловой точки нет. В этом случае для каждого игрока нужно указать вектор частот, с которыми нужно применять ту или иную стратегию.
Для игрока А: Р=(р1…рm), где р1 +…+ рm =1.
Pi ≥0 – частота применения стратегии Аi.
Для игрока В: Q =(q1…qn), где q1+…+qn =1.
qj≥0 – частота применения стратегии Вj
В этом случае средний выигрыш игрока А:
νА (P0Q)≤ νA(P0Q0)≤ νA(PQ0)
оптимальная цена игры
В этом случае νA(P0Q0 ) называют ценой игры и обозначают через ν и λ≤ν≤β.
Пример:
Рассмотрим решение игры(смотри таблицу.
q 1-q В данном примере седловая точка отсутствует, тогда оптимальная
В1 | В2 | λ | |
А1 | - 5 | -5 | |
А2 | -7 | -7 | |
β |
цена игры
-5≤ν≤4
Припишем строкам вероятности р и 1-р.
Умножив столбец поэлементно на первый столбец и сложив произведения получим линейную зависимость:
W(p) = -5p+4(1-p)= -9p+4 (1) – это средний выигрыш игрока А при применении игроком В первой стратегии.
Умножив столбец поэлементно на второй столбец и сложив произведения получим
W(p) = 8p+(-7)(1-p)= 15p-7(2) – это средний выигрыш игрока А при применении игроком В второй стратегии.
Приравняем (1) и (2)
-9p+4=15p-7 Отсюда p1= ; p2=1-p1= ;
Таким образом оптимальная смешанная стратегия игрока А - это p(), т.е. игрок А должен применять первую стратегию игрока В с частотой p1= и вторую стратегию игрока В с частотой p2= .
Подставив в зависимости (1 и 2) соответственно p1 и p2 получим цену игры ν1А =; ν2А = (3)
Теперь припишем столбцам вероятности q и 1-q. Умножив строку (q ,1-q) на левую строку и сложив произведения, получим W(q) = (- 5)q+8(1-q)= -13q+8 (4) – средний выигрыш игрока А при применении им первой стратегии.
Аналогично со второй строкой
W(q) = 4q+(-7)(1-q)= 11q-7 (5) – средний выигрыш игрока А при применении им второй стратегии.
Приравнивая зависимости 4 и 5 получим
-13q+8=11q-7 q1= ; q2=1- = , т.е. оптимальная смешанная стратегия игрока В – это Q ( ;)
Подставив в зависимости(4,5) соответственно q1 и q2 , получим цену игры игрока В.
ν1В = ν2В = - (6)
Сравнивая (3 и 6) находим что ν1А = ν2В = -- это и есть оптимальная цена игры, которая возможна при оптимальной смешанной стратегии P0= и Q0=.
Таким образом оптимальная цена игры νА () = - и действительно -5≤ - ≤ 4
– Конец работы –
Эта тема принадлежит разделу:
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ... МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ... Курс лекций по дисциплине...
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Смешанные стратегии.
Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов