Метод линейного программирования для нахождения оптимальных стратегий в играх двух лиц с нулевой суммой

 

Пусть игра m×n не имеет оптимального решения непосредст­венно в чистых стратегиях, т. е. отсутствует седловая точка (α ≠ β). Оптимальное решение необходимо искать в области смешанных стратегий. Предположим, что все m стратегий игрока А полезные. Определим вероятности их применения в смешанной оптимальной стратегии. Обозначим эти вероятности через , а цену иг­ры — через М. Оптимальная смешанная стратегия игрока А опреде­ляется из условия (38):

Пусть

(41)

Поскольку при оптимальной стратегии средний выигрыш не меньше М при любой стратегии противника, то справедлива систе­ма n неравенств:

(42)

или

(43)

Тогда задача отыскания оптимальной смешанной стратегии игрока А может быть сформулирована в виде задачи линейного программирования.

Для этого необходимо максимизировать Z=M при ограничениях

 

(44)

 

Введём неизвестные: .

Для исключения возможности деления на ноль, увеличим цену игры на положительное число С. Для этого достаточно ко всем элементам матрицы ||аij|| прибавить одно и тоже положительное число С, при этом все элементы аij сделать положительными. Эта операция не меняет искомых оптимальных стратегий.

Поскольку

Разделим левую и правую части неравенств (43) и (44) на М, получим:

(45)

x1+x2+…+xm= (46)

В силу того что max M=min =min{x1+x2+…+xm },

задача принимает вид

Z= x1+x2+…+xm, (47)

при ограничениях . (48)

Для игрока В оптимальная стратегия определяется из условия:

при ограничениях

q1+q2+…+qn=1. (49)

Эта задача записывается как симметричная двойственная задача линейного программирования к задаче игрока А:

максимизировать

L=Y1+Y2+…+Yn

при ограничениях

,

где L=, Yj=

Задачи игроков А и В решают обычным симплекс-методом.