Задача о биматричных играх

Биматричные игры являются общим случаем стратегических игр двух игроков с дискретным набором (конечных или бесконечных) стратегий каждого игрока, действия одного (первого) из которых направлены на максимизацию своей прибыли, а другого (второго) – на минимизацию своих потерь. Интересы игроков не обязательно противоположны, т.е. биматричная игра – это игра с ненулевой суммой и описывается в соответствии со своим названием двумя платежными матрицами

одинаковой размерности , где a_ij – прибыль (при a_ij > 0), а b_ij – потери (при b_ij > 0) соответственно игроков А и В в ситуации (i, j), [37].

Биматричная игра, заданная матрицами А и В, сводится к двум задачам линейного программирования. Нахождение оптимальной смешанной стратегии игрока А сводится в точности к задаче (6.1), (6.2). Нахождение оптимальной смешанной стратегии игрока В сводится к задаче вида (6.3), (6.4), в которой матрица коэффициентов А в системе ограничений (6.4) заменяется на матрицу В. Поэтому зависит лишь от коэффициентов матрицы А, а – от коэффициентов матрицы В. Следовательно, если в какой-либо прикладной задаче допускаются лишь чистые стратегии игрока А, то, определяя по матрице В значения , игру для игрока А с платежной матрицей А можно трактовать как игру с «природой» (см. приложение 5).

Пример 3. Пусть биматричная игра описывается платежными матрицами

Предполагая, что игрок А имеет возможность выбрать лишь свою чистую стратегию, найти его оптимальную стратегию.

Решение. Для игрока В получаем следующую задачу линейного программирования:

Þ Заполним рабочий лист согласно рис. 6.6. Ячейкам A3, B3, C3 присвоим имена Q_1, Q_2, Q_3 соответственно.

Рис. 6.6. Исходные данные и формулы для решения задачи

Þ Выполним команду Данные Поиск решения и заполним окно Поиск решения согласно рис. 6.7.

Рис. 6.7. Окно Поиск решения

Þ Щелкнем по кнопке Параметры и в открывшемся окне Параметры поиска решения установим флажок Неотрицательные значения.

Þ Выделим диапазон ячеек А12:С12 и выполним последовательность команд Формат Ячеек Число Дробный Дробями до двух цифр.

В результате расчетов получаем, что Q₁ = 0; Q₂ = 0,1; Q₃ = 0,225 и = 0,325. Таким образом, – оптимальная смешанная стратегия игрока В. Поскольку игрок А имеет возможность выбрать лишь свою чистую стратегию, то его игру можно трактовать как игру с «природой». Применим критерий Бейеса-Лапласа

Критерий Бейеса-Лапласа

Статистические игры – это игры, в которых один (для определенности - второй) из игроков оказывается нейтральным, т.е. таким, который не стремится извлечь для себя максимальной выгоды и, следовательно, не стремится обратить в свою пользу ошибки, совершаемые его противником.

Таким «вторым игроком» может являться природа.

В статистических играх игрок (первый), играющий «против природы», называется статистиком.

Принципом выбора в статистических играх называется правило, позволяющее определить наилучшую стратегию статистика.

Если известны вероятности q₁, …, q_n состояний природы, то принцип выбора состоит в максимизации математического ожидания выигрыша статистика – это так называемый критерий Бейеса-Лапласа. Математически данный критерий формулируется следующим образом:

где i* – искомая оптимальная стратегия статистика, a_ij – элементы платежной матрицы, а q₁, …, q_n – вероятности состояний «природы».

Для этого найдем средние значения выигрыша S_i для каждой чистой стратегии A_i:

Так как следовательно первая стратегия является оптимальной.