Критерий Байеса (максимизации среднего выигрыша)

· Показатель оптимальности стратегии - величина среднего выигрыша.

За оптимальную стратегию принимается чистая стратегия , при которой максимизируется средний выигрыш статистика

. (4)

 

· Показатель оптимальности стратегии - величина среднего риска.

За оптимальную стратегию принимается чистая стратегия , при которой минимизируется средний риск

. (5)

 

Байесовское решение является оптимальным не в каждом отдельном случае, а в среднем. Такого рода оптимальность реально может проявить себя лишь при многократном проведении операции, когда среднее значение постепенно стабилизируется.

Применение критерия Байеса оправданно, если ситуация, в которой принимается решение, характеризуется признаками:

§ вероятности состояний природы известны и не зависят от времени;

§ решение реализуется большое (теоретически бесконечное) число раз.

 

Пример 2. Фирма купила станок за 100 ден. ед. Для его ремонта можно купить специальное оборудование за 50 ед. или обойтись старым оборудованием. Если станок выходит из строя, его ремонт с помощью спецоборудования обходится в 10 ед., без спецоборудования - в 40 ед.

Известно, что в течение срока эксплуатации станок выходит из строя не более трех раз: вероятность того, что станок не сломается - 0,3; сломается 1 раз - 0,4; сломается 2 раза - 0,2; сломается 3 раза - 0,1.

Требуется определить целесообразность приобретения специализированного ремонтного оборудования.

Формализация. Первый игрок имеет две чистые стратегии: покупать и не покупать специализированное ремонтное оборудование. У природы - второго игрока - четыре состояния: станок не выйдет из строя, выйдет один раз, сломается два раза и три раза. Функция выигрыша - затраты фирмы на покупку и ремонт станка, задается платежной матрицей:

 

  Выход станка из строя
Ремонтное оборудование ни разу   1 раз 2 раза 3 раза
не купить -100 -140 -180 -220
купить -150 -160 -170 -180
           

 

Решение.

Рассмотрим сначала эту задачу как антагонистическую игру.

В матрице методом минимакса находим седловую точку: (2,4), таким образом, x* = ( 0, 1 ), y* = ( 0, 0, 0, 1 ), цена игры v* = - 180 ден. ед.

Ответ: нужно купить специализированное оборудование.

Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: у = (0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа. Запишем эти вероятности внизу платежной матрицы.

  Выход станка из строя
Ремонтное оборудование ни разу   1 раз 2 раза 3 раза
не купить -100 -140 -180 -220
купить -150 -160 -170 -180
           

Вероятности 0,3 0,4 0,2 0,1

 

Если же человек - первый игрок - будет продолжать играть оптимально (применит вторую стратегию «купить»), то его выигрыш составит

v(x*) = - 150 0,3 - 160 0,4 - 170 0,2 - 180 0,1 = - 161;

а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит

v(x') = - 100 0,3 - 140 0,4 - 180 0,2 - 220 0,1 = - 144 .

Таким образом, первому игроку выгодно играть неоптимально!

Ответ: не покупать специализированное оборудование.

 

Существенное различие между значениями v(x*) и v(x') объясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии, «недополучает» 36 ден. единиц выигрыша.

 

3.2. Критерий Лапласа недостаточного основания – «ориентируйся на среднее»

 

Если состояния природы в равной мере правдоподобны, то их полагают равновероятными, т.е. .

· Показатель оптимальности стратегии - величина среднего выигрыша.

Оптимальной считается чистая стратегия , обеспечивающая максимум среднего выигрыша при одинаковых априорных вероятностях:

. (6)

Применение критерия Лапласа оправданно, если ситуация, в которой принимается решение, характеризуется признаками:

§ вероятности состояний природы неизвестны, не зависят от времени и равны;

§ решение реализуется большое (теоретически бесконечное) число раз;

§ для небольшого числа реализаций допускается некоторый неоцениваемый риск.

Пример 3. Найти оптимальное решение статистической игры, заданной платежной матрицей , применяя критерий Лапласа, считая, что состояния природы равновозможны, т.е. .

Решение

Найдем средние выигрыши статистика :

Найдем наибольший средний выигрыш: .

Значит, по критерию Лапласа оптимальной стратегией статистика, который считает состояния природы равновозможными, будет чистая стратегия .

Гипотеза о равновероятности состояний природы является довольно искусственной, поэтому принципом Лапласа можно пользоваться лишь в ограниченных случаях. В более общем случае следует считать, что состояния природы не равновероятны и использовать для решения критерий Байеса-Лапласа.

 

Контрольные вопросы

1. Перечислите источники неопределенности и риска.

2. Дайте классификацию решений, принимаемых в различных условиях.

3. Назовите несколько определений риска.

4. По каким признакам классифицируются риски?

5. Что значит «управлять риском»?

6. Перечислите правила, с помощью которых проводится выбор способа управления риском и варианта решения.

7. Что понимается под качественной и количественной оценками риска?

8. Что понимается под играми с природой?

9. Какие критерии применяются для выбора оптимальной стратегии в условиях риска?

10. Как найти средний выигрыш игрока при известных вероятностях стратегий и при неизвестных вероятностях?

11. Поясните принципы использования моделей теории игр в экономических задачах в условиях неопределенности (игры с природой).

12. Что понимается под риском игрока?

13. Как найти элементы матрицы рисков? Что показывают эти величины?

14. Когда пользуются критериями Байеса и Лапласа? Опишите правила выбора оптимальной стратегии статистика с применением этих критериев. Что показывают вероятности в этих критериях?

 

 



1
  • 23