Критерии, основанные на известных вероятностях стратегий природы

Иногда неопределенность ситуации удается в некоторой степени ослабить с помощью нахождения вероятностей состояний на базе данных статистических наблюдений.

Пусть вероятности состояний природы известны

 

 

Если - среднее значение (математическое ожидание) выигрыша, которое игрок I стремится максимизировать, то:

 

 

В качестве оптимальной стратегии выбирается та из стратегий , которая соответствует максимальному среднему значению выигрыша:

. (4.9)

 

Оптимальную стратегию при известных вероятностях состояний природы можно найти, используя показатель риска. Для этого необходимо определить среднее значение риска:

 

 

В качестве оптимальной стратегии в данном случае выбирается та, которая обеспечивает минимальное среднее значение риска

 

.

 

Легко показать, что применение критериев среднего выигрыша и среднего риска для одних и тех же исходных данных приводит к одному и тому же результату, т.е. оптимальная стратегия, полученная при применении критерия оптимизации среднего выигрыша, совпадает с оптимальной стратегией, полученной по критерию минимизации среднего риска.

Чрезвычайно существенно то обстоятельство, что в случае известных вероятностей состояний природы , игроку I нет смысла пользоваться смешанными стратегиями.

Предыдущее рассмотрение относилось к случаю, когда вероятности состояний природы известны. Если объективные оценки вероятностей состояний получить невозможно, то они могут быть оценены субъективно на основе:

· принципа недостаточного основания Лапласа

 

 

который применяется тогда, когда ни одно состояние природы нельзя предпочесть другому;

· убывающей арифметической прогрессии - в том случае, если можно расположить состояния природы в порядке убывания их правдоподобности (вероятности свершения):

 

,

где:

 

· использования оценки группы экспертов (например, в случае, когда необходимо оценить вероятности различных погодных условий, можно использовать данные метеорологических наблюдений за длительный период времени).

Рассмотрим использование информационных технологий поиска оптимальных стратегий в играх с природой для случая известных вероятностей ее состояний.

 

Пример 2

Имеется три участка земли, отличающихся по степени влажности. Возможные стратегии сельскохозяйственного предприятия

 

состоят в том, что оно может высаживать некоторую культуру на участках 1, 2 или 3. Урожайность на любом из трех участков, естественно, зависит от количества осадков, выпавших в период вегетации. Обозначим возможные варианты погодных условий (стратегии природы) через П1, П2 и П3, где П1 – соответствует выпадению осадков ниже нормы, П2 – нормальному количеству осадков, и П3 – количеству осадков ниже нормы.

Выигрыш сельскохозяйственного предприятия естественно ассоциировать с урожайностью культуры с 1 гектара. Платежная матрица, т.е. совокупность значений урожайности для каждой стратегии предприятия и природы, приведена ниже.

 

Платежная матрица примера 2

  П1 П2 П3
A1
A2
A3

 

Пусть на основе обработки многолетних статистических данных о погодных условиях в данном регионе получены следующие значения вероятностей засушливого, нормального по количеству осадков и дождливого сезонов

 

 

Требуется выбрать стратегию, обеспечивающую максимальный средний выигрыш (максимальный средний урожай).

Решение

 

Введем данные на рабочий лист в соответствии с Рис. 4.3.

 

Рис. 4.3. Данные для решения примера 2.

 

В ячейку E3 введем формулу для определения среднего выигрыша

 

=СУММПРОИЗВ(B3:D3;$B$13:$D$13)


и скопируем ее в ячейки E4, E5. В ячейку E6 введем формулу для определения максимального среднего выигрыша =МАКС(E3:E5); наконец, в ячейку E7 введем логическую функцию, с помощью которой будет автоматически определяться оптимальная стратегия поведения предприятия:

 

=ЕСЛИ(И(E3>E4;E3>E5);A3;ЕСЛИ(И(E4>E3;E4>E5);A4;A5))

 

В результате получим следующее решение задачи

 

Стратегия сельскохозяйственного предприятия П1 П2 П3 Средний выигрыш (средняя урожайность)
A1 175,3
A2 196,1
A3 219,1
  Максимальный средний выигрыш 219,1
  Оптимальная стратегия A3

 

В условиях полной неопределенности, в отличие от только что рассмотренного случая, используется ряд критериев, не требующих знания вероятностей состояний природы. Наиболее широко используемыми являются при этом критерии Вальда, Сэвиджа и Гурвица.

Критерий Вальда

 

Данный критерий базируется на принципе наибольшей осторожности и использует выбор наилучшей из наихудших стратегий (в связи с чем его относят к группе критериев крайнего пессимизма).

Если в исходной матрице (по условию задачи) результат представляет собой потери ЛПР, то при выборе оптимальной стратегии используется минимаксный критерий. В этом случае для определения оптимальной стратегии необходимо в каждой строке матрицы результатов найти наибольший элемент, а затем выбирается действие (строка), которому будет соответствовать наименьший элемент из этих наибольших элементов.

Наоборот, если в исходной матрице по условию задачи результат представляет выигрыш, то при выборе оптимальной стратегии используется максиминный критерий. Иначе говоря, в качестве оптимальной рекомендуется выбирать ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш,

 

 

Следует отметить, что критерий Вальда иногда приводит к нелогичным выводам вследствие своей чрезмерной “пессимистичности”, в связи с чем, часто при решении аналогичных задач используется близкий по смыслу критерий Сэвиджа.

Критерий Сэвиджа (минимаксного риска)

 

Данный критерий использует матрицу рисков. При использовании критерия Сэвиджа рекомендуется выбирать ту стратегию, при которой в наихудших условиях величина риска принимает наименьшее значение:

 

(4.10)

 

Иначе говоря, данный критерий рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален).

Критерий Гурвица

 

Критерий Гурвица устанавливает баланс между случаями крайнего пессимизма и крайнего оптимизма путем введения некоторых весовых коэффициентов и , где При этом предполагается, что природа может находиться в самом невыгодном для ЛПР состоянии с вероятностью и в самом выгодном – с вероятностью .

Этот критерий называют еще принципом пессимизма - оптимизма. Он может быть выражен в виде соотношения:

 

(4.11)

 

Очевидно, что при критерий Гурвица превращается в пессимистический критерий Вальда, а при - в критерий крайнего оптимизма. Значение выбирается в зависимости от склонности ЛПР к пессимизму или оптимизму, а также на основании опыта, здравого смысла и т.д.

Следует отметить, что выбор критерия принятия решений в условиях неопределенности является наиболее сложным и ответственным этапом в процессе принятия решения. При этом не существует каких-либо общих советов или рекомендаций. Выбор критерия должен производиться ЛПР, с учетом конкретной специфики решаемой задачи и в соответствии с его целями, на основе прошлого опыта и интуиции.

В частности, в случае, когда даже минимальный риск недопустим, следует применять критерий Вальда. Если, наоборот, определенный риск вполне приемлем и ЛПР намерено вложить в некоторое предприятие столько средств, чтобы впоследствии не сожалеть о слишком малой величине вложений, то выбирают критерий Сэвиджа.

Оценка необходимости эксперимента в условиях неопределенности

 

Для любой экономической задачи, решаемой с помощью теории статистических игр (игр с природой), может быть определено абсолютно минимальное значение выигрыша, который ЛПР получит в наихудшей для себя ситуации. Эта величина может быть равна, например, сумме затрат на производство продукции при нулевой выручке от ее реализации, максимально возможным потерям, возникшим вследствие принятого решения и т.д. В процессе принятия решения для определения наиболее выгодной стратегии ЛПР необходима информация о вероятностях состояния природы (окружающей среды). В частности, повышение уровня информированности может быть достигнуто при обращении ЛПР к услугам консультационной службы, способной составить хорошо обоснованный прогноз развития ситуации. Можно рассматривать данное действие как своего рода “эксперимент”, проведение которого, несомненно, требует затраты определенных средств.

С экономической точки зрения эксперимент целесообразно проводить в том случае, если затраты на его проведение не превышают выигрыша, который можно получить при более точном знании стратегии природы. Рассмотрим решение проблемы, основанное на известных вероятностях состояний природы, которое гарантирует при многократном повторении игры в сходных условиях получение максимального в среднем выигрыша.

Пусть известны матрица выигрышей

 

 

игры с природой и вероятности различных состояний природы . Известны также затраты на проведение эксперимента, которые составляют руб.

Если эксперимент не проводится, то средний выигрыш игрока I определяется выражением

 

 

Пусть эксперимент проведен, и выяснено действительное состояние природы. Если этим состоянием оказалось , то выигрыш первого игрока

 

 

если , то выигрыш

 

и т.д.

 

Наконец, при действительном состоянии природы выигрыш игрока I

 

 

Если истинное состояние природы неизвестно, то гипотетический средний выигрыш игрока I находится из выражения

 

 

Таким образом, условие целесообразности проведения эксперимента можно записать в виде

 

 

Если данное условие не выполняется, то эксперимент проводить нецелесообразно и в качестве оптимальной стратегии следует выбирать ту, для которой средний риск минимален.

 

Пример 3

Матрица выигрышей игры с природой приведена ниже. Вероятности состояний природы

известны и равны соответственно

 

Затраты на проведение эксперимента для выяснения условий, в которых будет осуществляться операция, составляют 0,8 млрд. руб. Необходимо определить целесообразность проведения эксперимента в предположении, что он позволяет точно определить состояние природы , при котором будет осуществляться операция.

Матрица выигрышей для примера 3.

II I
А1
А2
А3

 

Решение

Введем данные на рабочий лист в соответствии с Рис. 4.4

 

Рис. 4.4 Данные для решения примера 3

 

Введем необходимые формулы для расчета введенных выше параметров . В ячейку F2 введем формулу

=СУММПРОИЗВ(B2:E2;$B$8:$E$8)

 

и скопируем ее в ячейки F3, F4. В ячейку F5 введем формулу для расчета максимального из чисел в столбце F: =МАКС(F2:F4), а в ячейки B5:E5 – формулы для определения максимальных значений чисел в соответствующих столбцах.

В ячейку E11 введем формулу для расчета параметра (=СУММПРОИЗВ(B5:E5;B8:E8)), а в ячейку F11 формулу, осуществляющую связь с ячейкой F5 (=F5). В ячейке G11 рассчитаем разность

В ячейку E14 (под надписью Рекомендация), введем формулу

=ЕСЛИ(G11>A11;A15;A16)

для того, чтобы автоматизировать процесс получения рекомендации о целесообразности эксперимента.

В результате получим ответ

Стратегия П1 П2 П3 П4 Выигрыш  
A1 3,55  
A2 2,65  
A3 2,85  
  3,55  
  q1 q2 q3 q4    
  0,25 0,15 0,2 0,4    
Затраты на проведение эксперимента (С)         разность
0,8       3,85 3,55 0,3
        Рекомендация    
        Эксперимент производить нецелесообразно    
           

 

Так как затраты на проведение эксперимента превосходят величину выигрыша, то в данном случае эксперимент проводить нецелесообразно.

 

Пример 4

Торговое предприятие планирует продажу сезонных товаров с учетом возможных вариантов поведения покупательского спроса

()

 

Предприятием разработано три хозяйственных стратегии продажи товаров

().

Требуется найти оптимальное поведение торгового предприятия, пользуясь критериями Вальда, Гурвица (при ) и Сэвиджа, если товарооборот, зависящий от стратегий предприятия и покупательского спроса представлен в виде следующей платежной матрицы.

 

Платежная матрица примера 4

А1
А2
А3

 

Решение

Введем данные на рабочий лист в соответствии с Рис. 4.5 (а,б).

Рассмотрим вначале поиск оптимальных стратегий по критериям Вальда и Гурвица.

Критерий Вальда. Введем в ячейку F5 формулу для нахождения минимального значения строки 5 (=МИН(B5:E5)) и скопируем данную функцию в ячейки F6, F7. В ячейку F8 введем формулу для нахождения максимального из значений ячеек F5:F7 (=МАКС(F5:F7)). В ячейку F9 введем логическую функцию, позволяющую автоматизировать процесс поиска оптимальной стратегии по методу Вальда:

 

=ЕСЛИ(И(F5>F6;F5>F7);A5;ЕСЛИ(И(F6>F5;F6>F7);A6;A7))

 

Критерий Гурвица. Введем в ячейку F15 формулу для нахождения произведения минимального из значений строки 15 на параметр (=МИН(B15:E15)*$A$22) и скопируем ее в ячейки F16, F17. В ячейку G15 введем формулу для расчета произведения максимального из значений ячеек строки 15 на (=МАКС(B15:E15)*$B$22) и скопируем эту формулу в ячейки G16:G17.

Рис. 4.5 (а). Данные для решения примера 3
(критерии Вальда и Гурвица)

 

В ячейке H15 разместим формулу для суммы значений, находящихся в ячейках F15, G15 и скопируем ее в ячейки H16:H17. В ячейку H18 введем формулу для нахождения наибольшего из значений в ячейках H15:H17 (=МАКС(H15:H17)). В ячейку H19 введем логическую функцию

=ЕСЛИ(И(H15>H16;H15>H17);A15;ЕСЛИ(И(H16>H15;H16>H17);A16;A17))

 

Критерий Сэвиджа. Введем данные в соответствии с Рис. 3.5(б).

Вначале рассчитаем и разместим в ячейках B38:E40 матрицу рисков. В ячейку B32 введем формулу =МАКС(B29:B31) и скопируем ее в ячейки C32:E32. Введем в ячейку B38 формулу =B$32-B29 и скопируем эту формулу в диапазон ячеек B38:E40. В ячейку F38 введем формулу =МАКС(B38:E38) и скопируем ее в ячейки F39:F40.

 

Рис. 4.5(б). Данные для решения примера 3 (критерий Сэвиджа)

 

В ячейку 41 введем формулу для расчета минимального риска =МИН(F38:F40), а в ячейку F42 – логическую функцию, имеющую следующий вид:

 

=ЕСЛИ(И(F38<F39;F38<F40);A38;ЕСЛИ(И(F39<F38;F39<F40);A39;A40)

Очевидно, данная логическая функция позволяет автоматизировать процесс выбора оптимальной стратегии при применении рассматриваемого критерия.

Характерной особенностью игровых методов теории принятия решений является относительная простота нахождения оптимальных стратегий выбора. Применительно к информационным технологиям на базе Excel это выражается в отсутствии необходимости использования пакета Поиск решения.

Результат решения:

Критерий Вальда        
Стратегии Покупательский спрос      
  П1 П2 П3 П4    
A1    
A2    
A3    
    Выигрыш    
    Оптимальная стратегия A3    
               
Критерий Гурвица        
Стратегии Покупательский спрос      
  П1 П2 П3 П4
A1
A2
A3
            Выигрыш
          Оптимальная стратегия A3
= =            
0,4 0,6            
               
Критерий Сэвиджа        
       
Стратегии Покупательский спрос      
  П1 П2 П3 П4      
A1      
A2      
A3      
j      
               
Стратегии Покупательский спрос      
  П1 П2 П3 П4      
A1    
A2    
A3    
    Риск предприятия r =    
    Оптимальная стратегия A2    

Размещено на Allbest.ru