Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Решение игры в смешанных стратегиях геометрическим методом




Пусть игра задана платежной матрицей . По оси абсцисс отложим единичный отрезок А1 А2, где точка А1 (0, 0) изображает стратегию А1, А2 (1, 0) – стратегию А2, а каждая промежуточная точка SA этого отрезка изображает смешанную стратегию первого игрока PA = (p1, p2), где p1– расстояние от точки SA до A2, p2–расстояние от точки SA до A1. Выигрыш игрока A будем откладывать на вертикальных отрезках.


Случай 1. Если игрок B применит стратегию В1, то выигрыш игрока A при стратегии А1 равен а11, поэтому на оси ординат отложим отрезок А1В1 = а11. При применении игроком A стратегии А2 выигрыш равен а21, отложим этот отрезок на перпендикуляре из точки А2, обозначим полученную точку В1'. Ордината любой точки М1 отрезка В1В1 равна среднему выигрышу игрока A при применении смешанной стратегии SA (действительно, этот выигрыш равен математическому ожиданию случайной величины, т.е. a11p1 + a21p2). Запишем уравнение прямой В1В1:
, т. е. ,
тогда при x = p2 получим
y = a11 + p2a21 – p2a11 = a11(1-p2) + p2a21 = a11p1 + a21p2
Случай 2. Если игрок B применяет стратегию В2, то аналогично откладываем отрезки а12 и а22 и получаем отрезок В2В2. Ордината любой точки М2 отрезка В2В2 – выигрыш игрока A, если A применяет смешанную стратегию SA, а B – стратегию В2.
Построим нижнюю границу выигрыша игрока А – ломаную В12. Ординаты точек этой ломаной показывают минимальные выигрыши игрока А при использовании им любой смешанной стратегии. Оптимальное решение игры определяет точка N, в которой выигрыш игрока А принимает наибольшее значение. Ордината точки N равна цене игры. Проекция этой точки на ось ОХ показывает оптимальную стратегию (р1, р2).
Аналогично находится оптимальная стратегия Q = (q1, q2) игрока B, только в соответствии с принципом минимакса надо находить верхнюю границу выигрыша, т. е. строить ломаную А21 и брать точку N с наименьшей ординатой.
Абсцисса точки N определяет оптимальную стратегию игрока B, т. е. Q = (q1, q2).


Пример. Решить игру, заданную платежной матрицей , графоаналитическим способом.
Решение. Нижняя цена игры a = 1,5, верхняя цена игры b = 2. Так как , седловой точки нет. Так как a1 = 1,5, a21 = 2 строим точки B1(0;1,5) и B2(1;2), соединяем их отрезком. Так как a21 = 3, a22 = 1 строим точки B2(0;3) и B2’(1;1), соединяем их отрезком.


Уравнение прямой В1В1 :
, т. е. y = 0,5x + 1,5;
уравнение В2В2 : , т. е. y = 3-2x.
Найдем точку N пересечения прямых В1В1 и В2В2 , для чего решим систему уравнений:

т. е. N (0,6; 1,8), откуда p2= 0,6; p1= 0,4; γ = 1,8 – цена игры.
Аналогично строим точки А1 (0; 1,5) и А1 (1;3), А2 (0; 2) и А2 (1; 1) и находим точку M пересечения прямых А1А1 и А2А2 .


Ответ: смешанная стратегия игрока А: PA= (0,4; 0,6), игрока В: QB = (0,8; 0,2); цена игры 1,8.






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных