Лекция: Решение игр в смешанных стратегиях.

Если игра не имеет седловой точки, т.е. (β ≠ a), то применение чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.

Смешанной стратегией SAигрока Аназывается применение чистых стратегий А1, А2, …, Аmс вероятностью р1, р2, …, рi, …, рm причем сумма вероятностей равна единице: =1.

Смешанные стратегии игрока Азаписываются в виде матрицы:

А1 А2 … Ai … Am

SA = p1 p2 … pi … pm

или в виде строки SA = (p1, p2, …, pi, …, pm).

Аналогично смешанные стратегии игрока Вобозначают:

В1 В2 … Вj … Вn

= q1 q2 … qj … qn

 

или в виде строки = (q1, q2, …, qi, …, qn), где сумма вероятностей появления стратегий равна единице: = 1.

Чистые стратегии можно считать частным случаем смешанных и задавать строкой, в которой 1 соответствует чистой стратегии. На основании принципа минимакса определяется оптимальное решение (или решение) игры: это пара оптимальных стратегий S*A, S*Bв общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры υ. Цена игры удовлетворяет неравенству:

аυ β

где аиβ – нижняя и верхняя цены игры.

Пример:определить нижнюю и верхнюю цены игры, заданной

0,5 0,6 0,8 платежной матрицей Р = 0,9 0,7 0,8. Имеет ли игра седловую точку?. 0,7 0,6 0,6

Решение: все расчеты удобно проводить в таблице, к которой кроме матрицы Рвведены столбец ai, и строка βj.

Bi Aj B1 B2 B3 ai
A1 0,5 0,6 0,8 0,5
A2 0,9 0,7 0,8 0,7
A3 0,7 0,6 0,6 0,6
βj 0,9 0,7 0,8 а=β = 0,7

 

Анализируя строки матрицы (стратегии игрока А), заполняем столбец ai: a1 = 0,5,a2 = 0,7, a3 = 0,6 — минимальные числа в строках 1, 2, 3.

Аналогично βj = 0,9, βj = 0,7, βj = 0,8– максимальные числа в столбцах 1, 2, 3 соответственно.

Нижняя цена игры a = = max{0,5;0,7;0,6} = 0,7, i =1, 2, 3 (наибольшее число в столбце) и верхняя цена игры β = = min{0,9;0,7;0,8} = 0,7, j = 1,2,3 (наименьшее число в строке). Эти значения равны, т.е. a = β, и достигаются на одной и той же паре стратегий (A2; B2) и цена игры υ = 0,7

еще рефераты
Еще работы по информатике