Реферат: Биматричные игры. Поиск равновесных ситуаций
Московскийгородской университет управления правительства Москвы
Факультетуправления
Кафедраприкладной математики
Рефератпо учебнойдисциплине
«Математическиеметоды исследования систем управления»
На тему: «Биматричные игры. Поиск равновесныхситуаций»
2010
1. Биматричные игры
Абсолютно любаяуправленческая деятельность не может существовать без конфликтных ситуаций. Этоситуации, где сталкиваются двое или больше сторон с разными интересами.Совершенно естественно, что каждая из сторон хочет решить конфликт в своюпользу и получить максимальную выгоду. Решение такой задачи может бытьосложнено тем, что конфликтующая сторона не имеет полной информации о конфликтев целом. Иначе можно сказать, что в конфликтной ситуации необходимо принятьоптимальное решение в условиях неопределённости.
Для решения такого родазадач используется математическое моделирование. Введём несколько основныхпонятий. Математическая модель конфликтной игрой называется игрой. Стороныконфликта – игроки, действие игрока – ход, совокупность ходов – стратегия,результат игры – выигрыш.
Обязательным моментомперед решением задачи является выявление определённых правил. Как правило, этиправила представляют собой совокупность требований и ограничений на действияигроков, обмен информацией игроков о действиях противников, функций выигрышейпротивников и т.п. Правила должны быть чёткими, иначе игра не состоится.
К настоящему временисуществует несколько способов классификации игр. Основным является деление набескоалиционные конечные парные игры с выигрышами (матричные, позиционные,биматричные) и коалиционные. В данном реферате мы рассмотрим биматричные игры.
Игры с фиксированнойсуммы – игры, в которых интересы игроков хоть и не совпадают, но не являютсяполностью противоположными. Частным случаем являются биматричные игры.
Биматричная игра – этоконечная игра двух игроков с ненулевой суммой, в которой выигрыши каждогоигрока задаются матрицами отдельно для соответствующего игрока (в каждойматрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2,на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, вовторой матрице – выигрыш игрока 2.)
Рассмотрим парную игру, вкоторой каждый из участников имеет следующие возможности для выбора своей линииповедения:
игрок А – может выбратьлюбую из стратегий А1, …, Аm;
игрок В – любую изстратегий В1, …, Вn;
Если игрок А выбралстратегию Аi, игрок В –Вj, то в итоге выигрыш игрока Асоставит аij, игрока В– bij. Выигрыши игроков А и В можнозаписать в виде двух таблиц.
А=/>
В=/>
Таким образом, еслиинтересы игроков различны, но не обязательно противоположны, для описания игрыиспользуются две платёжные матрицы. Данный факт и дал название подобным играм –биматричным.
2. Состояние равновесия вбиматричных матрицах
Решением биматричной игрыесть такое решение, которое в том или ином смысле устраивает обоих игроков.Данная формулировка очень расплывчата, что обуславливается тем, что вбиматричных играх довольно трудно чётко сформулировать цели для игроков. Какодин из возможных вариантов – желание игрока навредить своему сопернику в ущербсобственному выигрышу, или цель будет противоположна.
Обычно рассматриваютсядва подхода к решению биматричной игры. Первый – поиск равновесных ситуаций:ищутся условия, когда игра находится в некотором равновесии, которое невыгоднонарушать ни одному из игроков в отдельности. Второй – поиск ситуаций,оптимальных по Парето: нахождение условий, при которых игроки совместнымиусилиями не могут увеличить выигрыш одного игрока, не уменьшив при этом выигрышдругого.
Остановим своё вниманиена первом подходе.
В данном подходеиспользуются смешанные стратегии, т.е. случай, когда игроки чередуют своичистые стратегии с определёнными вероятностями.
Пусть игрок А выбираетстратегию А1, с вероятностью р1, А2 – р2,…, Аm – pm, причём
/>
Игрок В используетстратегию В1 с вероятностью q1, B2 – q2, …, Bn – qn, причём
/>
В качестве критерия «удачности»игры возьмём математические ожидания выигрыша игроков, которые вычисляются поформулам:
/>
/>
Таким образом, можносформулировать основное определение:
Распределениевероятностей Р* (/>) и Q (/>)определяют равновесную ситуацию, если для любых других распределений P и Q одновременно выполнены следующие неравенства:
/> />
Если равновесная ситуациясуществует, то отклонение от неё невыгодно самому игроку.
Также справедлива теоремаДж. Нэша. Всякая биматричная игра имеет хотя бы одну равновесную ситуацию всмешанных стратегиях.
3. Общий принцип решениябиматричных игр
В первое неравенствосистемы последовательно подставляются все чистые стратегии игрока А, припредположении, что В придерживается своей оптимальной стратегии. Во второенеравенство подставляются все чистые стратегии игрока В, при предположении, чтоА придерживается своей оптимальной стратегии.
Полученная система m+n неравенств,решение которой дает значение элементов оптимальных смешанных стратегий (P*,Q*) и платежи, получаемые игроками в точке равновесия.
Пример: борьба за рынок.
А=/>
В=/>
Решение задачи
vA=-10×1q1+2×1*(1-q1)+(1-p1)q1-(1-p1)(1-q1)=-14×1q1+3×1+2q1-1
vB=5×1q1-2×1*(1-q1)-(1-p1)q1 +(1-p1)(1-q1)=9×1q1-3×1-2q1+1
Пусть
p1=1 тогда vA=2-12q1/> -14×1q1+3×1+2q1-1
p1=0 тогда vA=-1+2q1/> -14×1q1+3×1+2q1-1
q1=1тогда vB=-1+6×1 /> 9×1q1-3×1-2q1+1
q1=0 тогда vB=1–3×1/> 9×1q1-3×1-2q1+1
Cоставляем 4 системы, преобразовываем,получаем:
(p1-1)(-14q1+3)/> 0
p1 (-14q1+3)/> 0
(q1-1)(9×1–2)/> 0
q1 (9×1–2)/> 0
p1=0 следовательно -(-14q1+3) /> 0 q1/> 3/14
p1=1 следовательно (-14q1+3)>=0 q1/> 3/14
0<p1<1 следовательно -(-14q1+3) /> 0 и (-14q1+3) /> 0->q1=3/14
q1=0 следовательно p1 /> 2/9
q1=1 следовательно p1/> 2/9
0<q1< 0-p1=2/9
Строим график по всем p ивсем q, получается на пересечении точка p1=2/9, q1=3/14 — решение системы неравенств.
P(2/9;7/9), Q(3/14;11/14)
vA=4/7, vB=1/3
Вывод: 2/9 товарапредлагать на первом рынке и 7/9 на втором рынке и тогда минимальный проигрыш —4/7. 3/14 -защищать 1-й рынок, 11/14-защищать второй рынок.