Лекция: Биматричные игры. Равновесие Нэша. Оптимальность Парето.

Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)

Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.

Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. В теории математики доказано, что игры этого класса имеют решения, однако пока не разработано практически приемлемых методов их нахождения.

Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения –

игрок А может выбрать любую из стратегий A1,…,Am,

игрок В может выбрать любую из стратегий B1,…,Bn.

При этом всякий раз их совместный выбор оценивается вполне определенно: если игрок A выбрал i-ю стратегию А1, а игрок В — k-ю стратегию Bk, то выигрыш игрока А равен некоторому числу aik, а выигрыш игрока В некоторому, вообще говоря, другому числу bik.

Иными словами, всякий раз каждый из игроков получает свой приз.

Последовательно перебирая все стратегии игрока А и все стратегии игрока B мы сможем заполнить их выигрышами две таблицы

…

a11

…

a1k

…

a1n

b11

…

b1k

…

b1n

…

….

…

….

…

ai1

…

aik

…

ain

bi1

…

bik

…

bin

…

am1

…

amk

…

amn

bm1

…

bmk

…

bmn

Первая из таблиц описывает выигрыши игрока А, вторая — выигрыши игрока B. Обычно эти таблицы записывают в виде матриц

Здесь А — платежная матрица игрока А, а В — платежная матрица игрока В.

При выборе игроком А i-й стратегии, а игроком В — k-й стратегии их выигрыши находятся в матрицах выплат на пересечении i-x строк и k-х столбцов: в матрице А это элемент aik, а в матрице В — элемент bik.

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна — матрица выплат игроку А, другая — матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре, — биматричная.

Замечание, Рассматриваемые ранее матричные игры можно рассматривать, разумеется, и как биматричные, где матрица выплат игроку В противоположна матрице выплат игроку А:

или

Однако в общем случае биматричная игра — это игра с ненулевой суммой.

еще рефераты

Еще работы по информатике

Реферат по информатике

Билет№17

1 Января 2016

Реферат по информатике

Билет№ 16

1 Января 2016

Реферат по информатике

Билет2 вопрос1

1 Января 2016

Реферат по информатике

БИЛЕТ №8

1 Января 2016