Парные матричные игры с нулевой суммой
Теория игр занимается разработкой различного рода рекомендаций по принятию решений в условиях конфликтной ситуации.
Игрой называют упрощенную модель конфликтной ситуации. Игра ведется по определенным правилам. Суть игры в том, что каждый из ее участников принимает такие решения, которые, как он полагает, могут обеспечить ему наилучший результат (исход). Исход игры — это значение некоторой функции, называемой функцией выигрыша (платежной функцией). Если сумма выигрышей игроков равна нулю, то игру называют игрой с нулевой суммой. Если в игре участвуют два игрока, то ее называют парной.
Пусть игроки А и В располагают конечным числом возможных действий — чистых стратегий. Обозначим их соответственно
и
. Игрок А может выбрать любую чистую стратегию
, в ответ на которую игрок В может выбрать любую свою чистую стратегию
. Если игра состоит только из личных ходов, то выбор пары стратегий
однозначно определяет результат
— выигрыш игрока А или проигрыш игрока В. Если известны значения
выигрыша для каждой пары
чистых стратегий, то можно составить матрицу выигрышей игрока А (проигрышей игрока В) (табл. 4.1). Эту матрицу называют также платежной.
В табл. 4.1 приведены числа
— минимально возможный выигрыш игрока А, применяющего стратегию
и
— максимально возможный проигрыш игрока В, если он пользуется стратегией
.
Таблица 4.1
…
|
| |
…
| …
… … …
…
|
…
|
| …
|
Число
называют нижней чистой ценой игры (максимином), а соответствующую ему чистую стратегию — максиминной. Число
называют верхней чистой ценой игры (минимаксом), а соответствующую чистую стратегию — минимаксной. Ясно, что максимин не превосходит минимакса, т. е.
.
Если
, то говорят, что игра имеет седловую точку в чистых стратегиях и чистую цену игры
. Пару чистых стратегий
, соответствующих
и
, называют седловой точкой матричной игры, а элемент
, платежной матрицы, стоящий на пересечении
-ой строки и
-го столбца, — седловым элементом платежной матрицы. Он одновременно является минимальным в своей строке и максимальным в своем столбце, т. е.
. Стратегии
и
, образующие седловую точку, являются оптимальными. Тройку
называют решением игры.
Пример. Каждый из игроков А и В записывает одно из чисел 1, 4, 6 или 9, затем они одновременно показывают написанное. Если оба числа оказались одинаковой четности, то игрок А выигрывает столько очков, какова сумма этих чисел, если разной четности — выигрывает игрок В. Составить платежную матрицу, найти нижнюю и верхнюю чистые цены игры, максиминную и минимаксную стратегии игроков.
Решение. Чистыми стратегиями игрока А будут:
— записать число 1,
— число 4,
— число 6,
— число 9. У игрока В чистыми будут аналогичные стратегии (табл. 4.2).
Таблица 4.2
(1)
| (4)
| (6)
| (9)
|
| |
(1)
(4)
(6)
(9)
| –5 | –7 | –7 | ||
| –5 | –13 | –13 | |||
| –7 | –15 | –15 | |||
| –13 | –15 | –15 | |||
|
Элемент
=2, так как в ситуации
оба игрока записывают нечетное число 1 и выигрыш игрока А равен 1+1=2. Элемент
= –5, так как в ситуации
игрок А записывает число 1, а игрок В — число 4, т. е. числа разной четности, поэтому выигрыш игрока В равен 5, тогда как выигрыш игрока А составит –5. Аналогичным образом вычисляются остальные элементы платежной матрицы. После определения
и
замечаем, что нижняя чистая цена игры
не равна верхней чистой цене игры
, поэтому данная игра не имеет седловой точки. Максиминной для игрока А будет чистая стратегия
. Пользуясь ею, игрок А «выиграет» не менее –7 (проиграет не более 7). Минимаксными для игрока В будут чистые стратегии
и
, при которых он проиграет не более 10.
Статистические игры.
… … …
…
…
…
(6)
(9)