Критерии оптимальности в играх с природой

В некоторых играх имеется неопределенность, вызванная отсутствием информации об условиях, в которых осуществляется действие (погода, покупательский спрос и т.д.). Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности. Такие игры называются играми с «природой». Человек в играх с «природой» старается действовать осмотрительно, второй игрок (природа, покупательский спрос) действуют случайно.

Условия игры задаются матрицей .

Пусть игрок А имеет стратегии А1, А2, ¼, Аm, а природа состояния В1, В2, ¼, Вn. Наиболее простой является ситуация, когда известна вероятность рj каждого состояния природы Вj. При этом, если учтены все возможные состояния, то .

Если игрок А выбирает чистую стратегию Аi, то математическое ожидание выигрыша составит p1ai1 + p2ai2 + ¼ + pnain. Наиболее выгодной будет та стратегия, при которой достигается

(p1ai1 + p2ai2 + ¼ + pnain).

Если информация о состояниях природы мала, то можно применить принцип недостаточного основания Лапласа, согласно которому можно считать, что все состояния природы равновероятны

(ai1 + ai2 + ¼ + ain)/n,

т.е. стратегию, для которой среднее арифметическое элементов соответствующей строки максимальное.

Имеется ряд критериев, которые используются при выборе оптимальной стратегии.

1. Критерий Вальде. Рекомендуется применять максиминную стратегию. Она достигается из условия

и совпадает с нижней ценой игры. Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека способом.

2. Критерий максимума. Он выбирается из условия

.

Критерий является оптимистический, считается, что природа будет наиболее благоприятна для человека.

3. Критерий Гурвица. Критерий рекомендует стратегию, определяемую по формуле

,

где a - степень оптимизма и изменяется в диапазоне [0, 1].

Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. При a = 1 критерий превращается в критерий Вальде, при a = 0 – в критерий максимума. На a оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем больше последствия ошибочных решений, больше желания застраховаться, тем a ближе к единице.

4. Критерий Сэвиджа. Суть критерия состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии. Элемент матрицы рисков находится по формуле

,

где max aij – максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия находится из выражения:

.

При принятии решений в условиях неопределенности следует оценивать различные варианты с точки зрения нескольких критериев. Если рекомендации совпадают, можно с большей уверенностью выбрать наилучшее решение, если рекомендации противоречат друг другу, окончательное решение надо принимать с учетом его сильных и слабых сторон.

Пример игры с природой

Фирма «Фармацевт» – производитель медикаментов и биомедицинских изделий в регионе. Известно, что пик спроса на препараты сердечно-сосудистой группы и анальгетики приходится на летний период, а на антиинфекционные и противокашлевые – на осенний и весенний периоды.

Затраты на 1 усл. ед. продукции за сентябрь – октябрь составили: по первой группе – 20 ден. ед., по второй группе – 15 ден. ед.

По данным наблюдений за несколько последних лет установлено, что фирма может реализовать в течение двух месяцев в условиях теплой погоды – 3050 усл. ед. продукции первой группы и 1100 усл. ед. продукции второй группы, а в условиях плохой погоды – 1525 усл. ед. продукции первой группы и 3690 усл. ед. второй группы.

В связи с возможными изменениями погоды ставится задача определить стратегию фирмы в выпуске продукции, обеспечивающую максимальный доход от реализации при цене 1 усл. ед. продукции первой группы 40 ден. ед. и второй группы – 30 ден. ед.

Решение. Фирма располагает двумя стратегиями:

А1 – в этом году будет теплая погода; А2 – погода будет холодная.

Если фирма примет стратегию А1 и в действительности будет теплая погода (стратегия природы В1), то выпущенная продукция (3050 усл. ед. препаратов первой группы и 1100 усл. ед. второй группы) будет полностью реализована и доход составит:

3050 (40 – 20) +1100(30 – 15) = 77500 ден. ед.

В условиях прохладной погоды (стратегия природы В2) препараты второй группы будут проданы полностью, а первой группы только в количестве 1525 усл. ед., и часть препаратов останется нереализованной. Фирма получит доход:

1525 (40 – 20) +1100 (30 – 15) – 20(3050 – 1525) = 16500 ден. ед.

Аналогично, если фирма примет стратегию А2 и в действительности будет холодная погода, то ее доход будет:

1525(40 – 20) + 3690(30 – 15) = 85850 ден. ед.

При теплой погоде доход составит:

1525(40 – 20) + 1100(30 – 15) – 15(3690 – 1100) = 8150 ден. ед.

Рассматривая фирму и погоду (покупательский спрос) в качестве двух игроков, получим платежную матрицу

  В1 В2
А1
А2

a = max(16500, 8150) = 16500;

b = min(77500, 85850) = 77500.

Цена игры лежит в диапазоне 16500 ден. ед. £ v £ 77500 ден. ед.

Из платежной матрицы видно, что при всех условиях доход фирмы будет не меньше 16500 ден. ед., но если погодные условия совпадут с выбранной стратегией, то доход фирмы может составлять до 77500 ден. ед.

Обозначим вероятность применения фирмой стратегии А1х1, А2х2, причем х1 = 1 – х2.

Решая игру, получим: х* =(0,56; 0,44), при этом цена игры v = 47000 ден. ед. Оптимальный план производства лекарственных препаратов составит:

0,56(3050; 1100) + 0,44(1525; 3690) = (2562; 2108).

Ответ. Таким образом, фирме целесообразно производить в течение сентября и октября 2562 усл. ед. препаратов первой группы и 2108 усл. ед. препаратов второй группы, тогда при любой погоде она получит доход не менее 47000 ден. ед.

Если не представляется возможным изменить план производства фирмы, то для определения оптимальной стратегии фирмы используют критерии «природы».

1. Критерий Вальде:

= max(16500; 8150) = 16500 ден. ед., фирме целесообразно использовать стратегию А1.

2. Критерий максимума:

= max(77500; 858500) = 858500 ден. ед., целесообразно использовать стратегию А2.

3. Критерий Гурвица. Для определенности примем a = 0,4, тогда для стратегии фирмы А1

= 0,4×16500 + (1 – 0,4) 77500= 53100 ден. ед.

Для стратегии А2

= 0,4×8150 + (1 – 0,4) 85850 = 54770 ден. ед.

max(53100; 54770) = 54770 ден. ед.

Фирме целесообразно использовать стратегию А2.

4. Критерий Сэвиджа.

Максимальный элемент в первом столбце – 77500, во втором столбце – 85850. Элементы матрицы рисков находят из выражения:

,

Откуда r11 = 77500 – 77500 = 0, r12 = 85850 – 16500 = 69350, r21 = 77500 – 8150 = 69350, r22 = 858500 – 858500 = 0.

Матрица рисков имеет вид:

= min (69350, 69350) = 69350 ден. ед., таким образом, критерий Сэвиджа не дает однозначной рекомендации по использованию какой-либо стратегии.

Следовательно, по совокупности критериев «природы» фирме целесообразно использовать стратегию А2.

Следует отметить, что каждый из рассмотренных критериев не может быть признан вполне удовлетворительным для окончательного выбора решений, однако их совместный анализ позволяет более наглядно представить последствия принятия тех или иных управленческих решений.

При известном распределении вероятностей различных состояний природы критерием принятия решения является максимум математического ожидания выигрыша.

Пусть известно для рассматриваемой задачи, что вероятности теплой и холодной погоды равновероятны и равны 0,5. В этом случае оптимальная стратегия фирмы определяется:

max{(0,5×77500 + 0,5×5875), (0,5×8150 + 0,5×85850)} = (41687,5; 47000) = 47000 ден. ед.

Фирме целесообразно использовать стратегию А2, т.е. рассчитывать свое поведение, ориентируясь на холодную погоду.

Таким образом, прогнозирование динамики экономической конъюнктуры с помощью экономико-математических методов позволяет найти оптимальную стратегию фирмы на рынке в переходные периоды, что способствует повышению эффективности деятельности в условиях неопределенности и риска.