рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Смешанные стратегии.

Смешанные стратегии. - Лекция, раздел Науковедение, Курс лекций по дисциплине: Методы исследования операций Рассмотрим Пример;   В...

Рассмотрим пример;

  В1 В2 min
А1 5
А2
max 6  

 

λ =5;

β = 6;

λ ≠β;

В этой задаче нет седловой точки и игроки должны применять смешанные стратегии. Для нахождения смешанных стратегий используется несколько методов:

1) Определение цены игры методом подбрасывания монеты;

2) Определение относительных частот применения смешанных стратегий;

3) Использование частот и вероятностей, полученных при многократной игре;

 

Определение цены игры методом подбрасывания монеты:

 

  В1 В2 min
А1 5
А2
max 6  

 

Пусть смешанная стратегия игрока А определяется подбрасыванием монеты:

А1 – «орел», А2 – «решка».

Средний выигрыш против первой стратегии:

 

а против второй:

В обоих случаях результат для игрока А будет лучше, чем при выборе любой стратегии. Цена игры всегда лежит в пределах: λ.

Определение относительных частот применения смешанных стратегий:

 

  В1 В2  
А1
А2
   

 

Если игра не имеет седловой точки, то наилучшей будет смешанная стратегия. Для нахождения оптимальной стратегии нужно выполнить следующее:

a)Рассмотрим стратегии игрока В. Из первой строки вычитаем числа второй, тогда частоту применения первой стратегии примем равной 4, а частоту второй стратегии – 1, то есть стратегии игроком В1 и В2 должны применятся в отношении 4:1

Отметим, что если число, характеризующее относительную частоту окажется отрицательным, то на знак не обращают внимания.

б) Аналогичным образом определяются частоты применения стратегий игрока А и они относятся как 2:3.

в) Найдем цену игры при применении против первой стратегии игрока В. Она будет равна:

Можно убедиться, что средний выигрыш игрока А в данном случае больше, чем при применении любых других стратегий.

 

Использование вероятностей применения стратегий для получения цены смешанных стратегий.

 

В случае если нижняя цена игры меньше верхней, то седловой точки нет. В этом случае для каждого игрока нужно указать вектор частот, с которыми нужно применять ту или иную стратегию.

Для игрока А: Р=(р1…рm), где р1 +…+ рm =1.

Pi ≥0 – частота применения стратегии Аi.

Для игрока В: Q =(q1…qn), где q1+…+qn =1.

qj≥0 – частота применения стратегии Вj

В этом случае средний выигрыш игрока А:

νА (P0Q)≤ νA(P0Q0)≤ νA(PQ0)

оптимальная цена игры

В этом случае νA(P0Q0 ) называют ценой игры и обозначают через ν и λ≤ν≤β.

Пример:

Рассмотрим решение игры(смотри таблицу.

q 1-q В данном примере седловая точка отсутствует, тогда оптимальная

  В1 В2 λ
А1 - 5 -5
А2 -7 -7
β  

цена игры

-5≤ν≤4

Припишем строкам вероятности р и 1-р.

Умножив столбец поэлементно на первый столбец и сложив произведения получим линейную зависимость:

W(p) = -5p+4(1-p)= -9p+4 (1) – это средний выигрыш игрока А при применении игроком В первой стратегии.

Умножив столбец поэлементно на второй столбец и сложив произведения получим

W(p) = 8p+(-7)(1-p)= 15p-7(2) – это средний выигрыш игрока А при применении игроком В второй стратегии.

Приравняем (1) и (2)

-9p+4=15p-7 Отсюда p1= ; p2=1-p1= ;

Таким образом оптимальная смешанная стратегия игрока А - это p(), т.е. игрок А должен применять первую стратегию игрока В с частотой p1= и вторую стратегию игрока В с частотой p2= .

Подставив в зависимости (1 и 2) соответственно p1 и p2 получим цену игры ν =; ν = (3)

Теперь припишем столбцам вероятности q и 1-q. Умножив строку (q ,1-q) на левую строку и сложив произведения, получим W(q) = (- 5)q+8(1-q)= -13q+8 (4) – средний выигрыш игрока А при применении им первой стратегии.

Аналогично со второй строкой

W(q) = 4q+(-7)(1-q)= 11q-7 (5) – средний выигрыш игрока А при применении им второй стратегии.

Приравнивая зависимости 4 и 5 получим

-13q+8=11q-7 q1= ; q2=1- = , т.е. оптимальная смешанная стратегия игрока В – это Q ( ;)

Подставив в зависимости(4,5) соответственно q1 и q2 , получим цену игры игрока В.

ν= ν= - (6)

Сравнивая (3 и 6) находим что ν= ν= -- это и есть оптимальная цена игры, которая возможна при оптимальной смешанной стратегии P0= и Q0=.

Таким образом оптимальная цена игры νА () = - и действительно -5≤ - ≤ 4

– Конец работы –

Эта тема принадлежит разделу:

Курс лекций по дисциплине: Методы исследования операций

Федеральное агенство по образованию.. Московский государственный строительный университет.. Курс лекций по дисциплине..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Смешанные стратегии.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Экономико-математическая модель. ТЗ
Транспортные задачи(ТЗ)- частный случай задачи линейного программирования. В ТЗ существуют поставщики и потребители грузов. У каждого поставщика имеется определенное количест

Метод северо-западного угла.
С помощью метода северо-западного угла реализуется первоначальный план поставок.   Таблица 2.1   Nj M

Метод потенциалов нахождения оптимального решения.
Введем показатель U1 для каждой строки и V1 для каждого столбца. Эти показатели называются потенциалами поставщиков и потребителей. Потенциалы подбираются так, чтобы для запол

Открытая (не сбалансированная) модель ТЗ.
Открытая модель сводится к закрытой. Если суммарная мощность поставщика больше суммарного спроса потребителей, то вводится фиктивный потребитель, к которому присваивается спрос равный разнице между

Постановка задачи динамического программирования.
Рассматривается управляемый процесс. В результате управления система (объект управления) приводится из начального состояния S0 в конечное S(S0 → S). Предположим, что упр

Принцип оптимальности.
Впервые был сформулирован Р. Беллманом в 1953 году. Каково бы не было состояние системы в результате какого-либо числа шагов на ближайшем шаге нужно выбрать управление так, чтобы оно приво

Задачи замены оборудования без приведения затрат к текущему моменту времени.
1) Постановка задачи: В эксплуатации находятся оборудование, цена нового оборудования S. Известны затраты на эксплуатацию оборудования С t зависящие от времени. В результ

Задачи замены оборудования с учетом приведения затрат к текущему моменту времени.
  1) Постановка задачи: В эксплуатация находится с первоначальной ценой S. Известны затраты на эксплуатацию оборудования в периоды 1, 2, 3 . . . t - С1, С

Детерминированные задачи упорядочивания.
  1) Постановка задачи: Имеется несколько изделий, каждое из которых надо обработать на двух машинах последовательно (сначала на первой, потом на второй). Известны вре

Решение игры с седловой точкой.
  B1 B2 А1 -4 А2

Дублирование и доминирование стратегий.
Если матрица игры содержит несколько одинаковых строк или стобцов, то из них оставляют одну строку(столбец), а отброшенным стратегиям присваиваем нулевые вероятности. Это дублирование с

Решение игры 2хn.
Самым удобным способом для определения оптимальной стратегии игроков в игре 2хn является графическим способом.   Пример:  

Марковские процессы.
Для математического описания многих случайных процессов может быть применен аппарат, разработанный в теории вероятностей, для так называемых Марковских случайных процессов. Они обладают следующим с

Простейший пуассоновский поток событий.
Для простейшего потока справедливы три свойства: 1) Стационарность потока λ = const. Интенсивность λ – частота появления события или среднее число событий, поступающих в СМО в ед

Система дифференциальных уравнений Колмогорова.
Рассмотрим математическое описание процесса с дискретными состояниями системы и непрерывным временем на примере случайного процесса, размеченный граф которого размещен на рисунке:

Уравнение Колмогорова для простейшего потока событий.
Особый интерес представляют вероятности системы Рi(t) в предельном стационарном режиме, т.е. при t→∞, которые называются предельными вероятностями состояний. Т.к. пр

Системы массового обслуживания с отказом.
В качестве показателей эффективности СМО с отказами будет рассматривать: А – абсолютную пропускную способность СМО, т.е. среднее число заявок, обслуживаемых системой в единицу времени;

Системы массового обслуживания с ожиданием
В качестве показателей эффективности СМО с ожиданием, кроме уже известных показателей – абсолютной А и относительной Q пропускной способности, вероятности отказа ρотк, среднего числ

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги