МАТРИЧНЫЕ ИГРЫ. СВЯЗЬ С ЗАДАЧЕЙ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ. МЕТОД БРАУНА-РОБIНСОН

Постановка матричной игры двух лиц с нулевой суммой.

Найти цену игры и оптимальные смешанные стратегии игроков для матричной игры двух лиц с нулевой суммой и заданной платежной матрицей C=||cij||, i=1...,m, j=1...,n (игрока I1 игроку I2).

Основные определения и теоремы.

Смешанные стратегии игроков I1 и I2 — это векторы x=(x1...,xm) и y=(y1...,yn)', компоненты которых удовлетворяют условия:

xi ³ 0, i=1...,m, x1 +...+ xm = 1

yj ³ 0, j=1...,n, y1 +...+ yn = 1.

Можно считать, что числа xi (i=1...,m) и yj (j=1...,n) есть не что другое, как вероятности выбора і-ї и j-ї стратегий, соответственно, игроками I1 и I2 (і-го строки матрицы C первым игроком та j-го столбца этой же матрицы вторым игроком).

Функция F(x,y)=xCy' называется математической ожиданием платежа игрока I1 игроку I2 (средним выигрышем игрока I2).

Точка (x*,y*) (x*ÎX, y*ÎY) называется седловой точкой функции f(x,y), xÎX, вÎВ, если для произвольных xÎX, вÎВ имеет место неравенство

f(x*,y) £ f(x*,y*) £ f(x,y*).

Теорема.Пусть заданная действительная функция f(x,y), xÎX, вÎВ, для которой существуют

min max f(x,y) max min f(x,y).

xÎX вÎВ вÎВ xÎX

Для того, чтобы выполнялось соотношение

min max f(x,y)= max min f(x,y).

xÎX вÎВ вÎВ xÎX

необходимо и достаточно, чтобы функция f(x,y) имела седловую точку.

Теорема.Функция F(x,y) (средний выигрыш игрока I2) всегда имеет седловую точку.

Компоненты x*, y* точки (x*,y*) седла функции F(x,y) определяют оптимальные смешанные стратегии игроков I1 и I2, соответственно, а цена игры v определяется соотношением:

v = min max F(x,y)= max min F(x,y)= F(x*,y*)

xÎX вÎВ вÎВ xÎX

X = { x = (x1...,xm) : xi ³ 0, i=1...,m, x1 +...+ xm = 1}

В = { в = (y1...,yn)' : yj ³ 0, j=1...,n, y1 +...+ yn = 1}.


Теорема.Задача определения оптимальных смешанных стратегий x*и y*игроков I1 и I2 эквивалентная пару двойственных задач линейного программирования:

v ® min

c1j x1 +...+ cmj xm £ v, j=1...,n

x1 +...+ xm = 1, xi ³ 0, i=1...,m;

v ® max

ci1 y1 +...+ сіn yn ³ v, i=1...,m

y1 +...+ yn = 1, yj ³ 0, j=1...,n.

Метод Брауна-Робинсона.

Метод Брауна-Робинсона представляет собой итеративный метод решения матричной игры, с каждым шагом которого связывается некоторая фиктивная игра, что разыгрывается в чистых стратегиях.

Пусть на s-у шаге полученные векторы

M(s)= (m1(s),...,mm(s)), N(s)= (n1(s),...,nn(s))

компоненты которых mi(s) и nj(s) соответственно уровни количествам выбора і-ї и j-ї чистых стратегий первым и вторым игроками на предыдущих шагах. Указанные векторы определяют очевидно частоты выбора соответствующих чистых стратегий игроков. Рассматриваются также векторы относительных частот

x(s)= (x1(s),...,xm(s)) но в(s)= (y1(s),...,yn(s))'

где xi(s)= mi(s)/s, i=1...,m, yj(s)= nj(s)/s, j=1...,n.

На s-у шаге величина

ci1 y1(s) +...+ сіn yn(s), i=1...,m

определяет средний платеж первого игрока второму при условии, что первый игрок выбирает и строку, величина

c1j x1(s) +...+ cmj xm(s), j=1...,n — средний выигрыш второго игрока при условии, что второй игрок выбирает j-й столбец.

На каждом шагу первый игрок выбирает строку, которой отвечает минимальное значение указанного среднего платежа; второй игрок выбирает столбец, который отвечает максимальному значению указанного среднего выигрыша.

Если указанные оптимумы достигаются более чем для одной строки (для первого игрока) или более чем для одного столбца (для второго игрока), то выбирается строка или столбец с минимальным номером. После выполнения игроками указанных действий пересчитываются все упомянутые величины.

Теорема Брауна-Робинсон.

При неограниченном росте s величины x(s)и в(s) следуют к оптимальным смешанным стратегиям x* и y* первого и второго игроков соответственно.

Программное обеспечение.

Обучающий модуль, с помощью которого матричная игра Решается в диалоге с пользователем за алгоритмом Брауна-Робинсона, вызывается из раздела «ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ» главного меню пакета ПОМО.


Задание.

Решить методом Брауна-Робинсона матричные игры, условия которых задаются модулем с помощью команды «Данные» главного меню (задачи №1–№9).

Путем сведения двойственных задач линейного программирования и методом Брауна-Робинсона найти оптимальные смешанные стратегии и цену игры матричных игр с такими платежными матрицами:

 

1) -8 2 2) 2 -5 3) -1 5 4) 5 -6 5) -3 1  
  1 -8 , -4 3 , 6 -4 , -3 0 , 2 -1 ,

 

6) -3 3 3 7) 0 1 6 8) 1 0 -1 9) 1 0 -1  
  -5 5 -3   7 1 3   0 2 1   -1 2 3  
  3 -9 2 , 1 2 0 , 1 -1 3 , -2 -3 3 .

 


Лабораторная работа 17.