рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Игра в смешанных стратегиях

Игра в смешанных стратегиях - раздел Образование, методы ОПТИМАлЬНЫХ РЕШЕНИЙ   Если Платежная Матрица Не Имеет Седловой Точки, То Если Игрок...

 

Если платежная матрица не имеет седловой точки, то если игрок будет пользоваться смешанными стратегиями, т.е. при каждом ходе менять стратегию случайным образом, то игрок А выигрывает больше, чем a, а игрок В проигрывает больше, чем b.

Рассмотрим платежную матрицу (7.1). Пусть игрок А использует чистые стратегии А1, А2, … Аi,…Аm с вероятностями p1, p2, … pi,…pm, причем =1, а игрок В использует свои чистые стратегии В1, В2, … Вj,…Bn с вероятностями q1, q2, … qj,… qn, причем = 1.

Тогда набор SA = (p1, p2, … pi,…pm) называется смешанной стратегией игрока А, а набор SB = (q1, q2, … qj,… qn) - смешанной стратегией игрока В.

Поскольку игроки выбирают свои стратегии случайным образом, то вероятность выбрать комбинацию АiВj по теории вероятности равна (Pi × qj). При использовании смешанных стратегий игра становится случайной, тогда говорят о среднем значении выигрыша, который определяется платежной функцией

f(SA, SB) = . (7.2)

 

Смешанные стратегии = (,,…) и = (,,…) называются оптимальными, т.е. дающими каждой стороне максимальный возможный для нее средний выигрыш (для А) или минимальный средний проигрыш (для В), если они образуют седловую точку для платежной функции (7.2), т.е. если выполняется следующее условие:

f(SA, ) £ f(,) £ f(, SB).

 

Величина u = f(, SB) называется ценой игры.

Теорема 2. В смешанных стратегиях любая матричная игра имеет седловую точку, или каждая матричная игра с нулевой суммой имеет решение в смешанных стратегиях.

 

Решение игры в смешанных стратегиях

Теорема 3. Для того чтобы смешанные стратегии и были оптимальными в игре с матрицей (7.1) и ценой игры u, необходимо и достаточно, чтобы выполнялись следующие неравенства:

³ u; j = , причем = 1; (7.3)

£ u; i = , причем = 1. (7.4)

 

Нахождение оптимальной стратегии можно свести к решению задачи линейного программирования.

Пусть требуется найти оптимальные стратегии для игры с заданной платежной матрицей (7.1), для которой aij строго больше нуля (аij >0, i=,j = ), тогда цена игры u > 0. Найдем оптимальную стратегию игрока А – ().

Разделим левую и правую части в выражении (7.3) на положительную величину u:

³ 1; = .

Введем обозначение = Хi, тогда

Хi ³ 1; j = ; = .

Поскольку игрок А стремится сделать свой гарантированный выигрыш (u) как можно большим (u ® max), то величина должна быть как можно меньше (u ® min), тогда имеем следующую задачу линейного программирования:

f(x) = ® min, (7.5)

Хi ³ 1; j = , (7.6)

Хi ³ 0; i = . (7.7)

 

Если Х* = (,,…) – оптимальный план задачи (7.5) – (7.7), а минимум функции f(x) = f(x*) = f*, то цена игры u при этом составит u = , а т.к. = Хi, тогда = (u × ,… u × ) = (,…) – оптимальная смешанная стратегия игрока А.

Для игрока В используя выражение (7.4), получим

g(y) = ® max.

yj £ 1, i = .

yj ³ 0; j = .

Решение игры u = ;

= (u × ,… u × ) = (,…).

 

Пример. Найти оптимальные смешанные стратегии игры, заданной следующей платежной матрицей:

 

  В1 В2 В3 нижняя цена игры a = 4, верхняя цена игры b = 5, т.е. a ¹ b – седловой точки нет.
А1
А2

 

Сведем данную задачу к задаче линейного программирования.

Найдем оптимальную стратегию игрока А – ():

f(x) = X1 + X2 ® min.

 

X1 + 8X2 ³ 1,

10X1 + 4X2 ³ 1,

3X1 + 5X2 ³ 1,

 

X1 , X2 ³ 0.

 

f(x) = 0,21; X1 = 0,026; X2 = 0,184,

отсюда

u = = 4,76; P1 = 4,76 × 0,026 = 0,124;

P2 = 4,76 × 0,184 = 0,876.

Найдем оптимальную стратегию игрока В – ():

g(y) = y1 + y2 + y3 ® max.

y1 + 10y2 + 3y3 £ 1,

8y1 + 4y2 + 5y3 £ 1,

y1 , y2 , y3 ³ 0.

 

g(y) = 0,21; y1 = 0; y2 = 0,0526; y3 = 0,158,

 

отсюда

q1 = 0; q2 = 4,76 × 0,0526 = 0,25;

q3 = 4,76 × 0,158 = 0,75.

 

Таким образом, применяя свою первую чистую стратегию с вероятностью 0,124 и вторую – с вероятностью 0,876, игрок А выигрывает величину 4,76. Игрок В, применяя свою вторую чистую стратегию с вероятностью 0,25 и третью – с вероятностью 0,75, проигрывает величину 4,76, иначе он проигрывает больше.

 

Игра два на два (2 х 2)

Рассмотрим игру, в которой у игроков А и В по две стратегии. Платежная матрица имеет вид

 

  В1 В2   (7.8)
А1 a11 a12
А2 a21 a22

Рассмотрим случай, когда игра не имеет седловой точки.

Теорема 4. Пусть и – оптимальные смешанные стратегии игры с платежной матрицей (7.1) и ценой игры u, тогда для любого i, при котором выполняется строгое неравенство

qj < u,

имеет место равенство pi = 0. А если pi > 0, то

qj = u.

Аналогично, если для некоторых j

× pi > u,

то для этих j qj = 0. А если qj > 0, то

× pi = u.

Определим оптимальную смешанную стратегию игрока А, а для этого решим систему трех уравнений с тремя неизвестными

 

а11 × p1 + а21 × p2 = u,

а12 × p1 + а22 × p2 = u,

p1 + p2 = 1.

Решив следующую систему, найдем оптимальную стратегию игрока В:

а11 × q1 + а12 × q2 = u,

а21 × q1 + а22 × q2 = u,

q1 + q2 = 1.

 

Рассмотрим первую систему. Вычитая из первого равенства второе, получая

11 - а12) × p1 + (а21 - а22) × p2 = 0.

 

Подставим P2 = 1 – P1, тогда

11 – а12) × p1 + (а21 – а22) (1– p1 ) = 0,

отсюда оптимальная смешанная стратегия для игрока А – S*( p1, p2)

это – хорошо

P1 = (а22 – а21)/( а11 – а12 + а22 – а21),

P2 = 1– P1 = (а11 – а12)/( а11 – а12 + а22 – а21).

цена игры

u = ( а11 × а22 – а21 × а12)/( а11 – а12 + а22 – а21).

Рассуждая аналогично, для определения оптимальной стратегии игрока В получая

q1 = (а22 – а12)/( а11 – а12 + а22 – а21),

q2 = (а11 – а21)/( а11 – а12 + а22 – а21).

Пример. Имеются две конкурирующие фирмы А и В, выпускающие изделия двух модификаций. Изучение спроса покупателей показало, что если выпускаются изделия первой модификации обеими фирмами, А1 и В1, то 40 % покупателей предпочитают изделия фирмы А и 60 % - фирмы В. Если выпускаются изделия А1 и В2, то 90 % покупателей приобретают изделия А. Если изготавливаются изделия А2 и В1, будет продано 70 % изделий фирмы А. Наконец, если выпускаются изделия второй модификации А2 и В2 обеими фирмами, то 20 % покупателей предпочитают изделия фирмы А.

Решение. Представим выигрыш фирмы А в табличной форме

а11 = 40 % - 60 % = -20 %; а12 = 90 % - 10 % = 80 %;

а21 = 70 % - 30 % = 40 %; а22 = 20 % - 80 % = -60 %.

 

В1 В2 ai
А1 -20 -20
А2 -60 -60
bj  

Нижняя цена игры составляет (-20), верхняя равна 40. Игра не имеет седловой точки. Найдем оптимальные смешанные стратегии

p1 = (-60 - 40)/(-20 –80-60-40) = ; p2 = ;

u = [-20 × (-60)- 40 × 80]/ (-20 –80-60-40) = 10;

q1 = (-60 - 80)/(-20 –80-60-40) = ; q2 = .

Выигрыш фирмы А в соответствии с ценой игры составит 10 %. Следовательно, предпочтение покупателей можно выразить как А – В = 10 %, но А + В = 100 %, тогда А = 55 %; В = 45 %. Следовательно, при таких оптимальных стратегиях изделия фирмы А будут покупать 55 % потребителей, а фирма В – 45 % потребителей.

 

Геометрическое решение игры

 

Пусть игра 2 х 2 имеет платежную матрицу (7.8). Изобразим на оси абсцисс отрезок горизонтальной линии единичной длины и обозначим концы отрезка через нуль и единицу. Из точек 0 и 1 по осям ординат восстановим перпендикулярные линии и изобразим на них выигрыши игрока А при использовании им соответственно чистых стратегий А1 и А2. Все промежуточные точки отрезка () будут изображать смешанные стратегии:

 

 

При оптимальной смешанной стратегии выигрыш игрока А будет составлять величину u и отмечен точкой М.

 

Произведем аналогичные построения для игрока В:

 

 

 

При графическом решении игр возможны и другие ситуации:

 

 

 
 

 

 

Пример. Найдем графическое и аналитическое решение игры:

 

  В1 В2 a = 4, b = 5, a ¹ b - следовательно, седловой точки нет.
А1
А2

 
 

Найдем оптимальную смешанную стратегию игрока А

 

Найдем оптимальную смешанную стратегию игрока В:

 

 

 

Игры 2 х n и m х 2

 

Допустим, платежная матрица задана и имеет вид 2 х n:

 

  В1 В2 Вn Игрок А имеет две стратегии, а игрок В – неограниченное число стратегий.
А1 a11 a12 a1n
А2 a21 a22 a2n

 

Допустим, платежная матрица имеет вид m х 2:

 
 

 

Минимум М находится на пересечении стратегий А1 и Аm, остальные отбрасываются, далее игра решается как задача 2 х 2.

 

 

Пример. Пусть игра задана в виде платежной матрицы

 

  В1 В2 В3 Игра (2 х 3) не имеет седловой точки a = 4, b = 5, a ¹ b, имеем игру в смешанных стратегиях.
А1
А2

 

 
 

Решим задачу графически и аналитически. Для игрока А: получаем игру 2 х 2, используя стратегии В2 и В3 игрока В:

 

Для игрока В:

– Конец работы –

Эта тема принадлежит разделу:

методы ОПТИМАлЬНЫХ РЕШЕНИЙ

С В Амелин... методы оПТИМАлЬНЫХ РЕШЕНИЙ...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Игра в смешанных стратегиях

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Понятие пути
Путь – это любая непрерывная последовательность (цепь) работ, приводящая от одного события к другому, в которой последующее событие каждой работы является предшествующим для следующей за ней

Построение графика Ганта
Сетевой график дает чёткое представление о порядке следования работ, а для того, чтобы определить, какие работы должны выполняться в каждый конкретный момент времени, строят масштабный сетевой граф

Расчет временных параметров событий
Введем обозначения (рис. 11): i, j – номер события; I - исходное событие; J - завершающее событие; tPi, tPj - ранний срок свершения события; tП

Поздний срок свершения завершающего события
tПJ = tPJ = tКР. (1.5) Резерв времени события показывает, на какой допустимый период времени можно задержать наступление данног

Сетевое планирование в условиях неопределённости
  В случаях, когда время выполнения работ точно не известно, то есть продолжительность работы является случайной (стохастической) величиной, характеризующейся законом β-распредел

Расчёт показателей качества функционирования систем массового обслуживания
Чтобы улучшить работу СМО путем изменения ее организации, необходимо рассчитать показатели качества её функционирования при существующем варианте организации и при других возможных вариантах и на о

Межотраслевого баланса
При составлении межотраслевого баланса заполняется специальная таблица, которая имеет четыре раздела и отражает движение продукта из одной отрасли в другую в процессе его производства и распреде

Основные балансовые соотношения
Первое балансовое соотношение выражает связь между первым и вторым разделами балансовой модели + yi = Xi, i =

Баланса. Модель Леонтьева
Запишем первую систему балансовых соотношений, характеризующих распределение продукции отраслей материального производства: + y

Методы отыскания вектора валовых выпусков
Для решения первой задачи существует два метода: точный и приближенный. а) Точный метод отыскания вектора валовых выпусков Х. Запишем модель Леонтьева в матричном виде &n

Коэффициенты косвенных затрат
Косвенные затраты относятся к предшествующим стадиям производства и входят в продукт не непосредственно, а через затраты сопряженных отраслей (рис. 55).

Тема 4. МОДЕЛИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
  Раздел математических методов, в котором рассматриваются способы решения задач на нахождение экстремума функции цели при ограничении области допустимых значений в форме уравнений ил

Фирма выпускает четыре вида персональных компьютеров
Таблица 4.1 Цех Затраты времени на единицу продукции, ч Общий фонд времени, ч/мес a b

Выражения (4.1), (4.2) и (4.3) составляют экономико-математическую модель задачи линейного программирования.
Для представления задачи в символьном виде введем обозначения: Хj – количество выпускаемых изделий j-го типа, j = ;

Условия неотрицательности получаемого решения
xj ³ 0, (j = ).     3. Задача оптимального распределения заданий по

Условие неотрицательности решения
xj ³ 0, (j = ).   4. Задача составления оптимальной смеси (задача диеты) Для производ

Условие неотрицательности решения
xj ³ 0, (j = ).     5. Распределительная задача: о размещении парка оборудования по

Представление задачи линейного программирования в канонической форме
Пусть требуется найти неотрицательные значения переменных Х1, Х2, …, Хn, для которых функция цели принимает максимальное значение f(x) = C1 Х

Программирования. Прямая и двойственная задачи
Для каждой задачи линейного программирования можно составить двойственную задачу линейного программирования. Допустим, прямая задача состоит в нахождении максимального значения функции:

Экономическая интерпретация двойственных задач
Пример. Для производства трех видов изделий А, В и С используются три различных вида сырья, запасы которого составляют соответственно 180, 210 и 244 кг. Нормы затрат сырья на единицу продукц

Симплекс-методом
Если условия задачи линейного программирования не противоречивы, то область ее допустимых решений образует выпуклый многогранник в n-мерном пространстве (многоугольник для двух переменных). При это

Нахождение первоначального опорного плана
Для определения первоначального опорного плана существуют несколько различных методов. Это – метод северо-западного угла, метод минимального элемента, или минимальной стоимости, и другие.

Циклы пересчёта
Переход от одного опорного плана к другому в транспортной задаче сводится к тому, что, как и в симплекс-методе, надо ввести в базис новый вектор вместо выведенного базисного вектора. Это способству

Задач, имеющих дополнительные условия
1. Если по каким-либо причинам перевозки грузов из некоторого пункта отправления Аi в некоторый пункт назначения Вj не могут быть осуществлены, тогда для определения оптимальн

Транспортной задачи
Пусть дан некоторый опорный план. Для каждой свободной клетки таблицы перевозок вычислим алгебраические суммы стоимостей в вершинах цикла Dij. Так, для клетки (4,1) получим D

Матричные игры
Пусть игрок А имеет m чистых стратегий А1, А2, … Аi,…Аm, а игрок В имеет n чистых стратегий B1

Тема 8. ЭЛЕМЕНТЫ ТЕОРИИ СТАТИСТИЧЕСКИХ ИГР.
ИГРЫ С «ПРИРОДОЙ»   В рассмотренных случаях оба игрока действовали наилучшим для себя способом. Однако встречаются конфликтные ситуации, в которых одна из ст

Критерии выбора стратегии
Проведем анализ стратегий производства при неопределенной рыночной конъюнктуре. Для выбора наилучшей стратегии поведения на рынке товаров и услуг существуют различные критерии, среди которых можно

ЗАКЛЮЧЕНИЕ
Современные сложные производственные системы являются крайне чувствительными к ошибкам в принятии управленческих решений. Интуиции, личного опыта руководителей уже не достаточно для успешного функц

Библиографический Список
  1. Амелин С.В. Методы и модели в экономике: конспект лекций. / С.В. Амелин. - Воронеж: Воронежский государственный технический университет, 2001, 90 с. 2. Амелин С.В. Метод

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги