Реферат: Экономическая кибернетика
Эк. Кибернетика.
Игра– матем. Модель конфликтной ситуации.
Стратегияигрока – это правила выбора действий всложившейся ситуации.
Решениеигры – это нахождение оптимальнойстратегии для каждого игрока, т.е. нахождение цены игры.
Оптимальнаястратегия игрока – это стратегия,которая в среднем (настрив. на длительную игру) дает игроку возможныйнаибольший выигрыш.
Неонтогонистическая– если выигрыш одной из сторон склад.из проигрыша др. стороны, иначе антогонистическая – выигрыш одного равенпроигрышу др.
Матричные игры.
— самые простые игры. Играют 2 чел. Укаж конечное число стратегий. Список стратегий известен каж играющему, т.е.игра с полной инф. Игра одноходовая.
Величинавыигрыша известна заранее, опис. В числовых единицах. Оба дейст. Сознательны,никто не поддается. Игра яв-ся антогонистической. Правила определяютпобедителя.
Игрыс седловой точкой обладают св-м устойчивости – если один игрок примен оптим стратегию, то др. игрокуне выгодно отклон-ся от своей оптим стратегии.
Первонач сведен по т. вероятности.
Случайныесобытие – это событие, которое можетпроизойти или не произойти в данной ситуации.
Вероятность– это количественная характеристика,мера появ-я событий.
P(А)=(числоблагопр. событий)/(общее число событий).
М(х)=åi хipi<sub/>– матем. ожидание.
D(x)=åi х2ipi – (M(x))2 – дисперсия.
s(x)=ÖD(x) – среднеквадратичное отклонение – показываетстепень разбросанности значений случайной величины относительно матем.ожидания.
Правило 3 сигм (s):
PíM(x)-3s(x)<x<M(x)+3s(x)ý= 0,997
÷Вероятностьтого, что сличайная величина х попадает в интервал с концами матем. ожидания -3s(х)и +3s(х) равняется 0,997.
Многоуголь.распределение – ломанная линия соед-япоследовательно точки с коор-ми (хi;pi).
Смешанные стратегии.
— распределение вероятностейна множестве его чистых стратегий, обобщение обычной стратегии.
Чистаястратегия – это стратегия, котораяприменяется с вероятностью 1.
Теорема Неймана:Любая матричная игра имеет оптимальное решение возможносреди смешанных стратегий.
СтратегияАiактивнаяпервого игрока – если вероятностьисполь-я в оптим стратегии больше нуля (Аi-акт,если р*i>0); S*A — оптим стратегия.
СтратегияВjактивная второго игрока –есливероятность исполь-я ее в опти стратегии больше нуля (Bi-акт, если q*i>0); S*B — оптим стратегия.
Неактивнаястратегия – вероятность применения,которой в оптим стратегии равна нулю.
Теорема устойчивости: Если один игрок применяет свою оптим стратегию, то 2игроку не выгодно выходить за рамки своих активных стратегий.
Теорема:Вматр. игре количество активных стратегий у каж игрока одинаковое.
Применение решений в усл. неопределенности.
Рассмотримигру человек и природа. Человек – лицо принимающее решение. Природа– экон-я среда в состоянии рынка.
Отличияот матричной игры: Активныерешения принимает только чел, он хочет найти наиболее оптим решение. У природыстихийное поведение и она не стремится к выигрышу. Считается, что чел знаетсписок сост природы, но не знает какое из них будет фактическим. В игре сприродой чел труднее сделать свой выбор, поэтому сущ несколько подходовнахождения оптимального решения.
Подходопределяется склонностью чел к риску.
Риск– это может быть упущенная выгода илинеобход понести дополнит произв-е затраты.
Элементыматрицы – это ожидание резуль.Деятельности в завис от сост природы.
1)Подход махмах “оптимистический”:В каж точке мы находим макс элемент ипосле этого находим макс из полученных чисел. gi=maxj aijÞg=maxigi=gi0Þ выб Аi0.
Выбираеммакс значение. Чел ориентир на самый лучший возмож результат, не обращ вниманиена возмож неудачи.
2)Критерий Вальда – критерий пессимизма:Находим в каж строчке миним элемент ивыбираем ту стратегию, которая дает макс гарантируемый доход.
ai=minj aijÞa=maxi ai=ai Þ выб Аi0.
3)КритерийГурвица (l) – ур пессимизма:Человек выбирает 0£l£1. Находимчисло ai=lai+(1-l)gi Þamaxiai=ai0 Þвыб Аi0.Если l=1 – кр Вальда (пессимизма), если l=0– кр оптимизма. Конкретная величина l опред-ся эк-ойситуацией.
4)Критерий Сэвиджа – кр минимального риска:Состав март риска по формуле rij=bj-аij. bij=max aij Þ rij=bj-aij.
R=(rij) –матрриска; ri=maxjrijÞ mini ri=ri0Þ выб Аi0.
Еслибы мы знали, то мы бы выбрали наиболее эф-е решение. Для самого эф-го решения: rij=0 (если Пj) Þ Аi. Риск = величине упущенной возможности.
Укаж критерия есть свои особенности применения. Если мы оценив ситуацию поразным критериям, то мы можем принять более обоснован решение. Трудностьобоснования яв-ся, что природа не стремится к выигрышу.
Принятие решения в усл риска.
Рассотрим вариант игры чел и природы в случаи, когда намизвестно сост природы. Природа к выигрышу не стремится. Находим стратегию,которая приносит макс средний доход. Средний доход расчитывается по правилутеории вероятности.
Величинасреднего дохода равна матем ожиданию при этой стратегии.
1)М(Ai)=nåj=1aijpj<sub/> Находим макс maxi M(Ai)
2) Правиломинималь среднего риска. R=(Ai)=nåj=1rijpj. Находим наимень mini R(Ai).
Лемма: Указ выше 2 критерия в результате всегда приводят квыбору одной и той же оптим стратегии.
Док-во:Найдем миним сред риска miniR(Ai)= mini<sup/>åjrijpj=mini<sup/>(åj(bj-аij)pj)= mini<sup/>(åjbjpj-åjаijpj)={åjbj pj – независит от переменной i, значит это const С}= mini<sup/>(С-åjаijpj)Þ минимумразности соот-ет максимуму вычитаемого.
maxi åjаijpj=M(Ai).
Номерастратегий, на которых достиг миним среднего риска, равны номерам стратегийобеспеч наиболь средний выигрыш.
Бейссовский подход нахождения оптимального решения.
Бейсовскийподход: Если первонач распределвероятности мы получ доход `Q`. Если мы можем провести эксперемент дающий новоераспред вероятности в завис от первонач `Q`и нового `Q’, мыделаем свой выбор стратегии. p'Þ`Q’`.
Некоторые св-ва матричной игры.
Замеч№1 Омасштабе игр: Пусть даны 2 игры одинаковой размерности с платежнойматрицей р(1) и р(2). При чем при любых i и j выпол(а(2)ij=aa(1)ij+b), некоторые числа a и b.Тогда: 1) опт стратегии 1 игрока в 1 и 2 игре одинаковые. Оптстратегии 2 игрока одинаковы в обеих играх.
2)Цена второй игры V2=aV1+b.
Длянекот методов решений все элементы матр должны быть не отрицательными.
Заме№2О доминировании стратегий: Этотприем применяется для умень размерности игры.
А: Аiдоминирует над Ак (Аi>Ак), если для любого j выполнерав-во аij>akj и хотя бы одно из этих нерав-в строгое.
Ак– заведомо невыгодна; сред размер выигрыша меньше; р*к=0,стратегия пассивная.
В: Вjдоминирует над Вt (Вj>Вt), если для любого i выполнерав-во аij>ait и хотя бы одно из этих нерав-в строгое.
Bt – невыгодна Þ q*t=0– актив стратегия.
Доминирстратегии вычеркиваются и получ матр меньшей размерностью.
Замеч№3Сравнение операций по методу Парето:Допустиместь операции Q1, Q2,…Qn. Для каж опер-и расчит 2параметра: 1) E(Q)– эффективность (доход);
2) r(Q) –степень риска (s-сред квадратич отклон).
Самаялучшая операция – это опер с наилуч эф-ю и с наимень риском. F(Q)=kE(Q)-r(Q), где k — это склонность к риску (не матпроблема). Находим макс из этих критериев maxi F(Qi). Операция Qi>Q, если эф-ть не менее E(Qi)³E(Qj),а риск опер r(Qi)£r(Qj) и хотя бы одно из нерав-в строгое.
Доминирстрат отбрас, как заведомо невыгодные.
МножПарето – это все недоминир-е операции.Наиболее эф-е среди них.
Понятие о позиционных игр.
У каж игрока своя платежная матрица. Выигрыш одного неознач проигр др. Таким способом можно высчитывать взаимные интересы игроков, атакже возможность образования коалиции. Можно расчит динамические игры учитываяфактор времени и т.д.
Позиционныеигры –возникает в случаи, когда надо принимать последо-нонесколько решений, при чем выбор решения опираются на предыдущ-е решения.
Рассотримпростейш случ позиц-й игры с природой. Решение изобр в виде дерева решений.
Дереворешений – граф-е изобр-е всехвозможных альтернатив игрока и сост природы с указ вероятности соответ-хсостояний и размеров выигрыша в каж ситуации.
Альтернативаигрока изобр квадратом – списоквозможных стратегий в соот-й ситуации. Сост-е природы кружочком, чел на нихвлиять не может. Делается оценка каж вершины и наход макс оценка ситуацийсоот-х каж ветви дерева решений.
EMV– денежноерешение; EMV=åi(отдача в i-омсост-и)pi
maxвершина (EMV)=?