Матричные игры

Пусть игрок А имеет m чистых стратегий А1, А2, … Аi,…Аm, а игрок В имеет n чистых стратегий B1, B2, … Bj,…Bn. Такая игра называется игрой m ´ n. Если игрок А пользуется стратегией Аi, а игрок В пользуется стратегией Вj, то обозначим через аij выигрыш игрока А, если аij > 0, или проигрыш игрока А, если аij < 0. Очевидно, что – это одновременно проигрыш игрока В, если аij > 0, и выигрыш игрока В, если аij < 0.

Тогда мы можем привести игру к матричной форме, т.е. составить матрицу, которая называется платежной матрицей, или матрицей игры:

 

 

  В1 В2 Вj Вn  
А1 а11 а12 а 1j а 1n  
(7.1)
Аi аi1 а i2 а ij а in  
 
Аm аm1 а m2 а mj а mn  

 

Каждая строка этой матрицы соответствует некоторой стратегии игрока А, а каждый столбец – некоторой стратегии игрока В.

Пример игры. Два игрока выкидывают на пальцах числа, причем четное число пальцев – это выигрыш игрока А, нечетное – проигрыш игрока А. Для простоты введем ограничение – игроки выкидывают от 1 до 3 пальцев.

Составим платежную таблицу:

 

В1 В2 В3
А1 -3 -3
А2 -3 -5 -5
А3 -5 -5
   

 

Проанализируем матрицу игры: для каждой чистой стратегии игрока А определим минимальный выигрыш, т.е. определим

ai = аij.

В нашем примере a1 = -3; a2 = -5; a3 = -5. Далее, среди полученных значений li-х определим максимальное

 

a =ai = аij.

В нашем примере a = -3, т.е. игрок А проигрывает 3 очка. Это число a называется нижней ценой игры, а соответствующая ему стратегия называется максиминной. В нашем примере стратегия А1 максиминная, т.е. из всех наихудших ситуаций выбирают наилучшую. Эта величина (a) – гарантированный «выигрыш» игрока А, какую бы стратегию ни выбрал игрок В. Меньше нижней цены игры игрок А никогда не «выиграет», если будет придерживаться правил игры.

Игрок В старается максимально уменьшить свой проигрыш. Для этого определяется верхняя цена игры

 

b =bj = аij.

Соответствующая стратегия называется минимаксной. В нашем примере будет две минимаксных стратегии В1 и В2. При этом игрок В проигрывает 4 очка.

 

Теорема 1. В любой матричной игре справедливо неравенство a £ b, т.е. нижняя цена игры никогда не превосходит верхнюю.

 

Игра с седловой точкой

 

Если в матричной игре нижняя и верхняя цены игры совпадают, то такая игра имеет «седловую точку» в чистых стратегиях, а число u = a = b называют ценой игры. В этом случае решением игры, т.е. оптимальным поведением для обоих игроков являются их максиминная для игрока А и минимаксная для игрока В стратегии игры. Любое отклонение игроков от своих оптимальных стратегий не может оказаться им выгодным. Элемент платежной матрицы, отвечающий оптимальным стратегиям, называется седловой точкой.

 

Пример. Пусть игра задана следующей платежной матрицей:

В1 В2 В3 В4 ai
- лучшая стратегия для игрока А – (А3)
А1

А2
А3
А4
bj  
цена игры u = a = b = 4
min max - лучшая стратегия для игрока В – (В2)