Решение игр размерности 2´2 и 2´n в смешанных стратегиях

5.1. Игра размерности 2´2.Рассмотрим произвольную матричную игру со следующей платёжной матрицей размерности 2´2 общего вида:

Q = . (18)

Для поиска решений в смешанных стратегиях в данной игре рассматриваются два взаимоиск-лючающих случая.

Случай 1. У игры есть решение в чистых стратегиях. Тогда в силу утверждения 7 это же самое решение (представленное в виде пары смешанных стратегий, как в примере 6) является решением игры в смешанных стратегиях. На этом поиск решений в смешанных стратегиях за-кончен.

Прежде чем перейти к случаю 2 - отсутствию решения в чистых стратегиях - сформули-руем некоторые простые, но нужные для дальнейшего утверждения.

Утверждение 8.Пусть в матрице (18) есть доминируемые или дублирующие строки или столбцы. Тогда в матричной игре с этой платёжной матрицей есть решение в чистых стратегиях ■

Заметим, что условие утверждения 8 является достаточным, но не необходимым. В игре с матрицей Q = есть решение в чистых стратегиях, а доминируемых или дублирующих строк и столбцов нет.

Утверждение 9.Пусть в матрице (18) совпадают элементы одного столбца или одной строки. Тогда в матричной игре с этой платёжной матрицей есть решение в чистых стратегиях ■

Напомним определение функции sgn(x):

sgn(x) =

Утверждение 10.Пусть в матрице (18)

sgn(q₁₁-q₂₁) = -sgn(q₂₂-q₁₂) (19a)

или

sgn(q₁₁-q₁₂) = -sgn(q₂₂-q₂₁). (19b)

Тогда в матричной игре с этой платёжной матрицей есть решение в чистых стратегиях ■

Случай 2. У игры нет решения в чистых стратегиях. Рассмотрим выражение (9) для выиг-рыша игрока А в игре размерности 2´2:

g(x,y) = x₁·y₁·q₁₁+ x₁·y₂·q₁₂+ x₂·y₁·q₂₁+ x₂·y₂·q₂₂. (20)

Учитывая, что x₁+ x₂ = 1, y₁+ y₂ = 1, положим x = x₁, y = y₁ и отождествим стратегии игроков с однозначно определяющими их вероятностями x и y. Представим (20) (после простых преобра-зований) в следующем виде:

g(x, y) = mx + n, (21a)

где

m = (q₁₁–q₁₂–q₂₁+q₂₂)·y+(q₁₂– q₂₂), (22a)

n = (q₂₁–q₂₂)·y+q₂₂. (23a)

Выражение (20) является, в соответствии с определениями, проигрышем игрока В в той же са-мой игре. Представим (20) в виде, аналогичном (21a):

g(x, y) = sy+ t, (21b)

где

s = (q₁₁–q₁₂–q₂₁+q₂₂)·x+(q₂₁– q₂₂), (22b)

t= (q₁₂–q₂₂)·x+q₂₂. (23b)

Положим

q₁ = q₁₁ – q₁₂ – q₂₁ + q₂₂, (24)

q₂ = q₂₂–q₁₂, (25)

q₃ = q₂₂–q₂₁. (26)

Имеетместо

Утверждение 11. Пусть в игре с платёжной матрицей (18) нет решений в чистых страте-гиях. Тогда

1) q₁ ≠ 0, q₂ ≠ 0, q₃ ≠ 0; (27)

2) sgn(q₂) = sgn(q₃); (28)

3) 0 <q₂¤q₁< 1, 0 <q₃¤q₁< 1 ■ (29)

Все три части утверждения 11 являются следствиями утверждений 8 – 10. В частности, вторые неравенства в формулах (29) следуют из того, что q₁ = q₁₁ – q₂₁+ q₂ = q₁₁ – q₁₂+ q₃ и утверждения 10.

Перейдём к явному построению решения игры в смешанных стратегиях. Начнём с игрока А. Для любой стратегии yигрока В положим

j_А(y) = {x| ( ) (g_A(x', y) ≤ g_A(x, y))}. (30a)

Другими сдовами, j_A(y) – это множество всех стратегий x игрока А, которые максимизирует его выигрыш g_A(x, y) при данном y.

Положим

Φ_A = {(x, y) | yÎ[0, 1], xÎj_A(y)}. (31a)

Множество Φ_A назовём графиком игрока А (см. общее определение графика в гл. 1.3)

Поскольку при любом фиксированном yфункция (21а) линейна по x, и при этом 0 ≤ x ≤ 1, то максимум достигается при m≠ 0 на концах отрезка [0, 1] (т.е. при одной из двух чистых страте-гий), а при m = 0 – при всех стратегиях, поскольку в этом случае g(x, y) просто не зависит от x. Представим эти рассуждения геометрически, нарисовав график Φ_A игрока А. Из (22а) и (23а) следует, что

g(x, 0) = –x·q₂ + q₂₂.

Поэтому

j(0) = . (32a)

Далее, представим (22а) с учётом обозначений (24) – (26) как

m = q₁·y– q₂.

Будем увеличивать y от 0 до 1. В силу 3-ей части утверждения 11 q₁ иq₂ имеют одинаковые знаки. Поэтому при y= y* = q₂¤q₁ число m = 0, g(x, y*) от x не зависит и, следовательно, мно-жеством j_А(y*) является отрезок [0, 1]. Далее, при y>y* число mменяет знак на противопо-ложный. Поэтому, если j(0) = {0}, то j(1) = {1}; если же j(0) = {1}, то j(1) = {0}. Оба случая (при и при ) представлены на рис.1.

Рис.1

Теперь перейдём к игроку В. Для любой стратегии x игрока А положим

y_B(x) = {y| ( ) (g_B(x, y) ≤ g_B(x, y ))}. (30b)

Другими сдовами, y_B(x) – это множество всех стратегий y игрока B, которые минимизируют его выигрыш g_B(x, y) при данном x.

Определим график игрока В формулой, аналогичной формуле (31а):

Y_В = {(x, y) | xÎ[0, 1], yÎy_B(x)}. (31b)

Далее практически повторим все рассуждения относительно графика Φ_A применительно к гра-фику Y_В (учитывая минимизацию, а не максимизацию). В частности, получим

y(0) = (32b)

(различие (32a) и (32b) определяется минимизацией вместо максимизации).

Как и выше, положим x* = q₃¤q₁. При x = x* коэффициент sпри y в (21b) обращается в 0, так что минимум достигается при любом y от 0 до 1; в этой точке знак sменяется и, соответствен-но, y(x) меняет значение с {0} на {1} или наоборот. Оба случая представлены на рис.2 в тех же координатах, что и на рис.1.

В силу формулы (28), q₂< 0 тогда и только тогда, когда q₃< 0. Поэтому при изображении обоих графиков в одних и тех же координатах имеется два случая: q₂< 0, q₃< 0 и q₂> 0, q₃> 0. Других вариантов не может быть. Эти графики показаны на рис. 3. Из формулы (29) следует, что q₁ имеет тот же знак, что q₂ иq₃. Поэтому левой и правой части рис.3 соответствуют q₁< 0 и q₁> 0.

Суть дела состоит в том, что найденные смешанные стратегии x* и y* образуют решение исходной матричной игры с платёжной матрицей (18), не имеющей решений в чистых стратеги-ях. Действительно, по построению j_А(y) (см. формулу (30a)) для любого yи для любого x' j_А(y) выполняется условие

( x)g(x, y) ≤ g(x', y). (33a)

В частности, (33a) верно при y = y* и x' = x*, так как при y = y* x' можно выбрать произвольно. Поэтому из (33a) следует, что для любого x

g(x, y*) ≤ g(x*, y*). (34a)

Аналогично, по построению y_B(x) для любого xи для любого y' = y(x) выполняется условие

( )g(x, y') ≤ g(x, y). (33b)

В частности, (33b) верно при y' = y* и x = x*, так как при x = x* y' можно выбрать произвольно.

Рис.2

Рис.3

Поэтому из (33b) следует, что для любого y

g(x*, y*) ≤ g(x*, y). (34b)

Неравенства (34a) и (34b) вместе совпадают с двойным неравенством (12), т.е. пара стратегий áx*, y*ñ по определению является решением игры в смешанных стратегиях.

Если «принять на веру» утверждения 8 - 11 (доказательства которых достаточно просты), то вместе с предыдущими рассуждениями они доказывают существование решения в смешан-ных стратегиях любой игры размерности 2´2 для произвольной платёжной матрицы (18). Ко-нечно, этот факт сам по себе непосредственно следует из общего утверждения 6. Однако оно является типичной «теоремой существования», не объясняющей, как находить само решение.

Для игр размерности 2´2 ситуация другая. Числа x* и y* определены в явном виде:

x* = q₃¤q₁, y* = q₂¤q₁,

где числа q₁, q₂и q₃выражаются через элементы исходной платёжной матрицы (18) по форму-лам (24) - (26). Переходя обратно от задания смешанной стратегии одним числом (вероятнос-

тью выбора 1-ой стратегии) к её заданию парами чисел (см. текст послеформулы (20)), оконча-

тельно получаем

= , = 1- , x* = ( , ); (35a)

= , = 1- , y* = ( , ). (35b)

При взгляде на формулы (35) возникает вопрос – что делать, если входящий в них делитель (24) окажется равным 0? Ведь на 0 делить нельзя! При этом число q₁, определяемое формулой (24), действительно может быть равным 0 – например, в платёжной матрице . Однако для платёжных матриц без седловой точки (а только такие матрицы здесь и рассматри-ваются) выражение (24) не равно 0 (см. 1-ую часть утверждения 11). Так что на 0 делить не придётся.

Таким образом, полностью решена задача нахождения решения матричной игры размер-ности 2´2 для произвольной платёжной матрицы (18). Если у игры есть решение в чистых стра-тегиях, то оно и является искомым решением. В том и только том случае, если такого решения нет, можно найти решение в смешанных стратегиях по формулам (35).

Пример 7.Рассмотрим матричную игру двух лиц со следующей платёжной матрицей: Q= . Найдём её решение. Поскольку у данной игры нет решения в чистых стратегиях, то воспользуемся формулами (35), положив q₁₁ = 6, q₁₂ = 2, q₂₁ = 5, q₂₂ = 8. Получим

= = = ; = = = ;

= 1- = 1 - = ; = 1- = 1 - = ; x* = ( , ); y* = ( , ) ■

Задание 3.Найти решения в следующих матричных играх (см. пример 7)

■

5.2. Игра размерности 2´n.Рассмотрим произвольную матричную игру со следующей платёжной матрицей размерности 2´n общего вида:

Q = . (36)

Оказывается, что для игр с платёжной матрицей вида (36) решение может быть найдено графо-аналитическим методом. Для простоты решение излагается для n = 4 в следующих двух примерах.

Пример 8. Найдём решение и цену игры с платёжной матрицей Q = . Преж-де всего проверим наличие (или отсутствие) решения в чистых стратегиях. В данном случае

max_imin_jq_ij=max{2, 4} = 4; min_jmax_iq_ij = min{4, 8, 6, 6} = 4.

Так как max_imin_jq_ij= min_jmax_iq_ij =q₂₁, то пара чистых стратегий á2, 1ñ является решением дан-ной игры. Как и в примере 6, представим эти чистые стратегии как смешанные:x = (0, 1); y = (1, 0, 0, 0). Ценой игры является общее значение максимина и минимакса, равное q₂₁ = 4 ■

Пример 9. Найти решение и цену игры с платёжной матрицей Q = . В этом случаета же самаяпроверка даёт

max_imin_jq_ij= max{3, 4} = 4; min_jmax_iq_ij = min{6, 8, 6, 6} = 6.

Поскольку в данном случае max_imin_jq_ij<min_jmax_iq_ij, то решений в чистых стратегиях нет.

Поэтому можно и нужно искать решение игры в смешанных стратегиях описанным ниже гра-фо-аналитическим методом.

Игрок A имеет только 2 чистых стратегии. Его задача состоит в максимизации своего выигрыша в зависимости от своей смешанной стратегии (x₁, x₂)

v(x₁, x₂) = (q_1j x₁ + q_2j x₂), (37)

где минимум берётся по 4-ём чистым стратегиям игрока B.

Так как x₂ = 1 -x₁, то, обозначая x₁ через x, из (40) получаем выражение

v(x) = {(q₁_j-q₂_j) x + q₂_j}. (38)

Таким образом, v(x) является минимумом четырёх линейных функций одной переменной x; можно начертить графики этих функций и затем максимизировать их минимум v(x) графичес-ким методом.

Нетрудно построить графики функций (q₁_j-q₂_j) x + q₂_j, если заметить, что они должны проходить через точки (0, q₂_j) и (1, q₁_j). Эти графики изображены на рис.4. В данном случае имеем четыре прямых линии, нижняя огибающая которых v(x) выделена жирным. Высшая точ-ка функции v(x) находится на пересечении прямых y = 2x + 4 и y = -3x + 6, соответствующих 3-му и 4-му столбцам матрицы Q (напомним, что j-ая прямая по построению проходит через точ-ки (0, q₂_j) и (1, q₁_j)). Поскольку в данном случае ломаная v(x) состоит только из двух звеньев, со-единённых в точке D, то указанные два столбца находятся сразу. Если же точек, где соединяют-ся звенья ломаной, несколько, то надо взять ту из них, у которой ордината максимальна. Имен-но нахождение такой точки и делается графически. Большой точности в построениях не требу-ется, поскольку всё, что нужно – это найти те два столбца, которые соответствуют двум лини-ям, определяющим эту точку.

Далее для вычисления оптимальных смешанных стратегии надо рассмотреть 2×2 матрицу P, образованную найденными выше двумя столбцами. В данном случае это 3-ий и 4-ый столб-цы, а сама матрица имеет вид:

P =

(см. исходную матрицу Q). Для этой матрицы найдём решение в смешанных стратегиях спосо-бом, подробно описанном в примере 7. Имеем в данном случае q₁₁= 6, q₁₂= 3,q₂₁= 4, q₂₂= 6. Поэтому в силу формул (35)

Рис.4

= = =0,4; = = =0,6;

= 1- = 1 - 0,4 =0,6; = 1- = 1 -0,6 = 0,4.

Теперь вспоминаем, что в исходной матрице размера 2×4 у игрока A есть две чистых стратегии: выбор 1-й или 2-й строки. В данном случае имеем

x* = (0,4; 0,6).

У игрока B есть четыре чистых стратегии, соответствующие выбору одного из 4-ёх столбцов за-данной матрицы. Однако активными (т.е. отличными от 0) являются только те две стратегии, которые соответствуют выбранным (с помощью рисунка) столбцам. В нашем случае это столб-цы 3 и 4. Вероятность выбора 3-его и 4-го столбца была найдена выше: 0,6 и 0,4. Сама опти-мальная стратегия игрока B имеет вид

y* = (0; 0; 0,6; 0,4).

Цена игры V с исходной матрицей Q совпадает с ценой игры с матрицей P. В силу 3-ьей части утверждения 5 и формулы (9) получаем

V = ·6 + ·3 + ·4 + ·6 = 0,4·0,6·6 + 0,4·0,4·3 + 0,6·0,6·4 + 0,6·0,4·6 = 1,44 + 0,48 + 1,44 + 1,44 = 4,8 ■

Задание 4.Найти решение и цену в игре со следующей платёжной матрицей (см. примеры 8 и 9).

01	02	03	04	05
06	07	08	09	10
11	12	13	14	15
16	17	18	19	20
21	22	23	24	25
26	27	28	29	30
31	32	33	34	35
36	37	38	39	40
41	42	43	44	45
46	47	48	49	50

■

Во многих случаях удаётся упростить описанный выше поиск решения матричных игр с платёжной матрицей размерности 2´n за счёт предварительного упрощения платёжной матри-цы способами, описанными в разделе 3. Проиллюстрируем это в следующем примере.

Пример 10. Рассмотрим матричную игру двух лиц со следующей платёжной матрицей размера 2´6: Q = . В данной матрице 1-ый, 3-ий и 4-ый столбцы домини-руемы 2-ым, 5-ым и снова 2-ым столбцами соответственно. После их удаления остаётся матри-ца P = , которая больше не упрощается. Номера её столбцов в исходной матрице та-ковы: (2, 5, 6). Далее применим описанный в примере 9 графо-аналитический метод поиска решения к матрице P. Входящие в формулу (38) три линейные функции должны проходить через точки (0, q₂_j) и (1, q₁_j) (j = 1, 2, 3). С учётом матрицы Pэти точки таковы:

(0, 2) и (1, 5); (0, 4) и (1, 1); (0, 3) и (1, 3).

Изобразим соответствующие отрезки на рис.5. Функция v(x), определённая формулой (38), пока-зана жирной линией. Эта линия состоит из двух отрезков, пересекающихся в точке D. Сами от-резки соответствуют 1-му и 2-му столбцам матрицы P. Матрица R, образованная этими столбца-ми, такова:R = . Аналогично тому, как это делалось в примере 9, находим

= = =0,33; = = =0,5;

= 1- = 1 - 0,33 =0,67; = 1- = 1 -0,5 = 0,5.

Поскольку рассмотренные два столбца были 2-ым и 5-ым в исходной матрице Q, получаем

x* = (0,33; 0,67) и y* = (0; 0,5; 0; 0; 0,5; 0) ■

Рис.5

Задание 5.Упростить платёжную матрицу и найти решение и цену игры в играх с матри-цами из задания 4 (см. пример 10) ■

Предметный указатель

график

игрока А

игрока В

игр матричных, смешанное расширение

игра

матричная

размерности

2´2

2´n

с нулевой суммой

платёжная матрица

решение игры

в смешанных стратегиях

в чистых стратегиях

решения игры, нахождение

стратегий, удаление

стратегия

доминируемая

дублирующая

смешанная

оптимальная

игрока A

игрока В

оптимальная

игрока A

игрока В

цена игры

верхняя

нижняя

в смешанных стратегиях

⇐ Назад

Далее ⇒