Acute; 2 - биматричные игры. Ситуация равновесия

В 2´2 - биматричной игре платежные матрицы игроков имеют следующий вид:

А= , В= .

Вероятности выбора стратегий игрока А р1, р2=1 – р, игрока В q1=q, q2=1–q, а средние выигрыши вычисляются по формулам

HA(р, q) = a11pq + a12p(l - q) + a21(l - p)q + a22(1 - p)(l - q),

HB(р, q) = b11pq + b12p(l - q) + b21(l - p)q + b22(1 - p)(l - q),

где

0 £ р£ 1, 0 £ q£ l.

Определение. Будем говорить, что пара чисел

(p*,q*), 0 £ р* £ 1, 0 £ q* £ l,

определяет равновесную ситуацию, если для любых р и q, подчиненных условиям 0 £ р £ 1, 0 £ q £ l, одновременно выполнены следующие неравенства:

HA(р, q*) £ HA(р*, q*), HB(р*, q) £ HB(р*, q*). (2.7.3)

Пояснение. Неравенства (2.7.3)означают следующее: ситуация, определяемая смешанной стратегией (р*, q*), является равновесной, если отклонение от нее одного из игроков при условии, что другой сохраняет свой выбор, приводит к уменьшению выигрыша первого. Тем самым получается, что если равновесная ситуация существует, то отклонение от нее невыгодно самому игроку.

ТЕОРЕМА (Дж. Нэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.

Итак, равновесная ситуация существует. Но как ее найти?

Дляобоснования способа определения равновесной ситуации сошлемся на следующийтеоретический результат.

ТЕОРЕМА. Выполнение неравенств (2.7.3) равносильно выполнению неравенств

HA(0, q*) £ HA(р*, q*), HB(р*, 0) £ HB(р*, q*), (2.7.4)

HA(1, q*) £ HA(р*, q*), HB(р*, 1) £ HB(р*, q*).

Иными словами, для того чтобы убедиться, что пара (p*, q*)определяет равновесную ситуацию, достаточно проверить справед­ливость неравенств (2.7.2) только для двух чистых стратегий игрока А (р = 0 и р = 1) и для двух чистых стратегий игрока В (q = 0 и q = 1).

Пропуская промежуточные алгебраические выкладки, приходим к следующему результату:

Для того чтобы в биматричной игре пара (p*, q*)определяла равновесную ситуацию, необходимо и доста­точно одновременное выполнение следующих неравенств:

(p-1)(Cq-a) ³ 0,

p(Cq-a) ³ 0,

(q-1)(Dp-b)³0, (2.7.5)

q(Dp - b) ³ 0,

0 £ р £ 1, 0 £ q £ l,

где

С = a11a12a21 + a22, a = a22 a12,

D = b11b12b21 + b22, b = b22 b21,