Задача о биматричных играх
Биматричные игры являются общим случаем стратегических игр двух игроков с дискретным набором (конечных или бесконечных) стратегий каждого игрока, действия одного (первого) из которых направлены на максимизацию своей прибыли, а другого (второго) – на минимизацию своих потерь. Интересы игроков не обязательно противоположны, т.е. биматричная игра – это игра с ненулевой суммой и описывается в соответствии со своим названием двумя платежными матрицами
,
одинаковой размерности , где aij – прибыль (при aij > 0), а bij – потери (при bij > 0) соответственно игроков А и В в ситуации (i, j), [37].
Биматричная игра, заданная матрицами А и В, сводится к двум задачам линейного программирования. Нахождение оптимальной смешанной стратегии игрока А сводится в точности к задаче (6.1), (6.2). Нахождение оптимальной смешанной стратегии игрока В сводится к задаче вида (6.3), (6.4), в которой матрица коэффициентов А в системе ограничений (6.4) заменяется на матрицу В. Поэтому зависит лишь от коэффициентов матрицы А, а – от коэффициентов матрицы В. Следовательно, если в какой-либо прикладной задаче допускаются лишь чистые стратегии игрока А, то, определяя по матрице В значения , игру для игрока А с платежной матрицей А можно трактовать как игру с «природой» (см. приложение 5).
Пример 3. Пусть биматричная игра описывается платежными матрицами
Предполагая, что игрок А имеет возможность выбрать лишь свою чистую стратегию, найти его оптимальную стратегию.
Решение. Для игрока В получаем следующую задачу линейного программирования:
Þ Заполним рабочий лист согласно рис. 6.6. Ячейкам A3, B3, C3 присвоим имена Q_1, Q_2, Q_3 соответственно.
Рис. 6.6. Исходные данные и формулы для решения задачи
Þ Выполним команду Данные Поиск решения и заполним окно Поиск решения согласно рис. 6.7.
Рис. 6.7. Окно Поиск решения
Þ Щелкнем по кнопке Параметры и в открывшемся окне Параметры поиска решения установим флажок Неотрицательные значения.
Þ Выделим диапазон ячеек А12:С12 и выполним последовательность команд Формат Ячеек Число Дробный Дробями до двух цифр.
В результате расчетов получаем, что Q1 = 0; Q2 = 0,1; Q3 = 0,225 и = 0,325. Таким образом, – оптимальная смешанная стратегия игрока В. Поскольку игрок А имеет возможность выбрать лишь свою чистую стратегию, то его игру можно трактовать как игру с «природой». Применим критерий Бейеса-Лапласа
Критерий Бейеса-Лапласа
Статистические игры – это игры, в которых один (для определенности - второй) из игроков оказывается нейтральным, т.е. таким, который не стремится извлечь для себя максимальной выгоды и, следовательно, не стремится обратить в свою пользу ошибки, совершаемые его противником.
Таким «вторым игроком» может являться природа.
В статистических играх игрок (первый), играющий «против природы», называется статистиком.
Принципом выбора в статистических играх называется правило, позволяющее определить наилучшую стратегию статистика.
Если известны вероятности q1, …, qn состояний природы, то принцип выбора состоит в максимизации математического ожидания выигрыша статистика – это так называемый критерий Бейеса-Лапласа. Математически данный критерий формулируется следующим образом:
,
где i* – искомая оптимальная стратегия статистика, aij – элементы платежной матрицы, а q1, …, qn – вероятности состояний «природы».
Для этого найдем средние значения выигрыша Si для каждой чистой стратегии Ai:
Так как следовательно первая стратегия является оптимальной.