Лекция: Биматричные игры. Равновесие Нэша. Оптимальность Парето.
Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)
Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.
Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. В теории математики доказано, что игры этого класса имеют решения, однако пока не разработано практически приемлемых методов их нахождения.
Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения –
игрок А может выбрать любую из стратегий A1,…,Am,
игрок В может выбрать любую из стратегий B1,…,Bn.
При этом всякий раз их совместный выбор оценивается вполне определенно: если игрок A выбрал i-ю стратегию А1, а игрок В — k-ю стратегию Bk, то выигрыш игрока А равен некоторому числу aik, а выигрыш игрока В некоторому, вообще говоря, другому числу bik.
Иными словами, всякий раз каждый из игроков получает свой приз.
Последовательно перебирая все стратегии игрока А и все стратегии игрока B мы сможем заполнить их выигрышами две таблицы
B1 | … | Bk | … | Bn | B1 | … | Bk | … | Bn | |||
A1 | a11 | … | a1k | … | a1n | A1 | b11 | … | b1k | … | b1n | |
… | … | …. | … | … | … | … | … | …. | … | … | … | |
Ai | ai1 | … | aik | … | ain | Ai | bi1 | … | bik | … | bin | |
… | … | … | … | … | … | … | … | … | … | … | … | |
Am | am1 | … | amk | … | amn | Am | bm1 | … | bmk | … | bmn |
Первая из таблиц описывает выигрыши игрока А, вторая — выигрыши игрока B. Обычно эти таблицы записывают в виде матриц
,
Здесь А — платежная матрица игрока А, а В — платежная матрица игрока В.
При выборе игроком А i-й стратегии, а игроком В — k-й стратегии их выигрыши находятся в матрицах выплат на пересечении i-x строк и k-х столбцов: в матрице А это элемент aik, а в матрице В — элемент bik.
Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна — матрица выплат игроку А, другая — матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре, — биматричная.
Замечание, Рассматриваемые ранее матричные игры можно рассматривать, разумеется, и как биматричные, где матрица выплат игроку В противоположна матрице выплат игроку А:
или
.
Однако в общем случае биматричная игра — это игра с ненулевой суммой.