Лекция: Биматричные игры. Равновесие Нэша. Оптимальность Парето.

Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)

Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.

Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. В теории математики доказано, что игры этого класса имеют решения, однако пока не разработано практически приемлемых методов их нахождения.

Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей ли­нии поведения –

игрок А может выбрать любую из стратегий A1,…,Am,

игрок В может выбрать любую из стратегий B1,…,Bn.

При этом всякий раз их совместный выбор оценивается вполне оп­ределенно: если игрок A выбрал i-ю стратегию А1, а игрок В — k-ю стра­тегию Bk, то выигрыш игрока А равен некоторому числу aik, а выигрыш игрока В некоторому, вообще говоря, другому числу bik.

Иными словами, всякий раз каждый из игроков получает свой приз.

Последовательно перебирая все стратегии игрока А и все стратегии игрока B мы сможем заполнить их выигрышами две таблицы

 

  B1 Bk Bn     B1 Bk Bn
A1 a11 a1k a1n   A1 b11 b1k b1n
….   ….
Ai ai1 aik ain   Ai bi1 bik bin
 
Am am1 amk amn   Am bm1 bmk bmn

 

Первая из таблиц описывает выигрыши игрока А, вторая — выигрыши игрока B. Обычно эти таблицы записывают в виде матриц

,

 

Здесь А — платежная матрица игрока А, а В — платежная матрица игрока В.

При выборе игроком А i-й стратегии, а игроком В — k-й стратегии их выигрыши находятся в матрицах выплат на пересечении i-x строк и k-х столбцов: в матрице А это элемент aik, а в матрице В — элемент bik.

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна — матрица выплат игроку А, другая — матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре, — биматричная.

Замечание, Рассматриваемые ранее матричные игры можно рассмат­ривать, разумеется, и как биматричные, где матрица выплат игроку В противоположна матрице выплат игроку А:

или

.

Однако в общем случае биматричная игра — это игра с ненулевой суммой.

еще рефераты
Еще работы по информатике