Кооперативные игры
Не всегда стороны, участвующие в конфликте преследуют прямо противоположные интересы, тогда конфликт перестает быть антагонистическим, и игрокам может быть выгодно, кооперироваться, т.е. объединив свои усилия, найти согласованное решение, которое приведет к увеличению выигрыша каждого из игроков – участников конфликта.
Кооперативной игрой двух лиц называется игра с непостоянной суммой, в которой игрокам разрешается обсуждать перед игрой свои стратегии и договариваться о совместных действиях, образуя коалиции.
Пример. Два человека находятся в горящей комнате, дверь которой закрыта очень плотно; ни один из них не в состоянии самостоятельно открыть эту дверь. Если они объединят усилия, то смогут сделать это и выйти из горящей комнаты.
Решение. Каждый из игроков имеет две стратегии:
1) «толкать дверь»;
2) « не толкать».
Если оба игрока применят первую стратегию, то они смогут выйти из горящей комнаты и их выигрыш будет равен 100 условных единиц.
Если они выбирают любую другую комбинацию стратегий, то они не смогут выйти из комнаты и их выигрыш будет равен 0.
Игры «с природой»
Пусть лицо, принимающее решение, имеет т стратегий: Т1, Т2, ..., Тт и имеется n возможных состояний природы: П1, П2, ..., Пn. Так как природа не является заинтересованной стороной, исход любого сочетания поведения сторон можно оценить выигрышем Вij первой стороны для каждой пары стратегий Тi и Пj. Все показатели игры заданы платежной матрицей {Вij}mxn. Если вероятности появления того или иного состояния природы не известны, то такие условия принятия решений называются условиями полной неопределенности.
По платежной матрице можно принять ряд решений. Например, оценить возможные исходы: минимальный выигрыш
то есть наименьшая из величин в каждой i-й строке как пессимистическая оценка; максимальный выигрыш – то наилучшее, что дает выбор i-го варианта
.
При анализе «игры с природой» вводится показатель, по которому оценивают, насколько то или иное состояние «природы» влияет на исход ситуации. Этот показатель называют риском.
Риск rij при пользовании стратегией Тi и состоянии «природы» Пj оценивается разностью между максимально возможным выигрышем , который мог бы получить игрок, принимающий решение, достоверно зная, что «природой» будет реализовано именно состояние Пj и выигрышем Вij, который он получит, используя стратегию Тi, не зная, какое из состояний Пj природа реализует:
rij = В - Вij.
Исходя из этого определения, можно оценить максимальный риск каждого состояния природы:
Для принятия решений анализируются следующие критерии:
1. Максиминный критерий Вальда (критерий крайнего пессимизма).Здесь выбирается такое решение, при котором гарантируется максимальный выигрыш в наихудших условиях внешней среды (состояния «природы»):
.
2. Критерий пессимизма-оптимизма Гурвица.
При выборе решения вместо двух крайностей в оценке ситуации (оптимизм-пессимизм) придерживаются некоторого компромисса, учитывающего возможность как наихудшего, так и наилучшего поведения «природы». В соответствии с этим компромиссным критерием для каждого решения будет линейная комбинация минимального и максимального выигрышей. Выбирается тот, для которого эта величина окажется наибольшей:
,
где – показатель пессимизма-оптимизма от 0 до 1 (чаще всего 0,5). Причем, если
, то данный критерий превращается в критерий Вальда – крайнего пессимизма: выбирается решение, приносящее наибольший гарантированный доход. Если
, то данный критерий превращается в критерий крайнего оптимизма
: выбирается решение, приносящее максимальный доход.
3. Критерий минимаксного риска Сэвиджа. Выбирают ту стратегию, при которой величина риска имеет минимальное значение в самой неблагоприятной ситуации:
чтобы избежать слишком большого риска при выборе решения.
4. Критерий, основанный на известных вероятностных состояниях «природы».Если известны вероятности состояний природы (например, спроса по данным анализа за прошлые годы), т.е. мы принимаем решение в условиях частичной неопределенности или в условиях риска:
Р1 = Р(П1); Р2 = Р(П2); ...; Рп = Р (Пn),
полагая, что Р1 + Р2 + ... + Рj + ... + Рп = 1.
Тогда в качестве показателя эффективности (рациональности, обоснованности) стратегии Тi берется среднее (математическое ожидание) – выигрыш применения этой стратегии:
а оптимальной считают стратегию, для которой этот показатель эффективности имеет максимальное значение, то есть
.
Если каждому решению Тi соответствует множество возможных результатов Вij с вероятностями Рij, то математическое ожидание (среднее значение) выигрыша определится
,
а оптимальная стратегия выбирается по условию
В этом случае можно также воспользоваться и стратегией минимального математического ожидания риска для каждого i-го состояния «природы»
.
Комплексный анализ всех этих критериев позволяет в какой-то мере оценить возможные последствия принимаемых решений.
5. Оптимальность по Парето. Решается двухкритериальная задача:
.
пусть имеется множество решений (стратегий), которые характеризуются двумя характеристиками и
. Разные решения отличаются хотя бы одной характеристикой. Есть два способа решения этой задачи:
а) графический: стоится график зависимости математического ожидания доходности от математического ожидания риска
. За оптимальное решение выбирается точка, расположенная на графике как можно выше и левее, т.е. имеющая наибольшие математическое ожидание доходности и наименьшее математическое ожидание риска. В нашем случае за наилучшее решение можно выбрать А8.
б) аналитический: задается формула, связывающая математические ожидания риска и доходности: ,
и
– коэффициенты, определяемые субъективно, например
. Оптимальным решением является решение соответствующее максимуму данной функции:
.
Контрольные вопросы:
1. Что изучает теория игр?
2. Приведите классификацию теории игр.
3. Опишите решение матричной игры в чистых стратегиях.
4. Опишите решение матричной игры в смешанных стратегиях.
5. Как задачу теории игр можно свести к задаче линейного программирования?
6. Что называется кооперативной игрой? Приведите примеры.
7. В чем заключается игра «с природой»?
Литература:
1. Высшая математика для экономистов: Учебник для вузов / Н.Ш. Кремер, Б.А. Путко, И.М. Тришин, М.Н.Фридман. Под ред. Н.Ш. Кремера. – М.: ЮНИТИ, 2005. – 471 с.
2. Общий курс высшей математики для экономистов: Учебник. / Под ред. В.И. Ермакова. –М.: ИНФРА-М, 2006. – 655 с.
3. Сборник задач по высшей математике для экономистов: Учебное пособие / Под ред.В.И. Ермакова. М.: ИНФРА-М, 2006. – 574 с.
4. Данко П.Е., Попов А.Г., Кожевникова Т.Я. Высшая математика в упражнениях и задачах. Ч. 1, 2. – М.: Оникс 21 век: Мир и образование, 2005. – 304 с. Ч. 1; – 416 с. Ч. 2.
5. Математика в экономике: Учебник: В 2-х ч. / А.С. Солодовников, В.А. Бабайцев, А.В. Браилов, И.Г. Шандара. – М.: Финансы и статистика, 2006.
6. Шипачев В.С. Высшая математика: Учебник для студ. вузов – М.: Высшая школа, 2007. – 479 с.