Лекция: Критерии принятия решений в играх с природой (полная неопределенность).

При втором подходе -ситуации полной неопределенности, то естьв случае, когда Q(Пj) неизвестны и не предполагается их вычисление по указанным выше правилам для принятия решений применяют следующие критерии:

Максиминный критерий Вальда (критерий пессимизма – всегда рассчитывай на худшее, MM — критерий) – худший результат объявляется минимальным выигрышем, то есть:

Критерий Сэвиджа (любыми путями избежать большого риска) – худшим объявляется не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, чего можно было бы добиться в данных условиях:

Критерий Гурвица (критерий пессимизма-оптимизма) – степень пессимизма оценивается экспертами критерием α

где 0≤ α ≤ 1. При α = 1 получаем критерий Вальда.

Критеий Ходжа-Лемана (HL –критерий) опирается одновременно на MM – критерий и B-L – критерий.

По этому критерию выбор определяется выражением:

n

Z = max[α Σ aij Qj + (1-α)min aij]

jj=1 i

а правило выбора по этому критерию формируется следующим образом.

1. Платежная матрица с элементами aijдополняется столбцом, составленным из суммы средних взвешенных (с весом α=const) математических ожиданий и наименьшего результата каждой строки.

2. Отбираются те варианты решений, в строках которого стоит наибольшее значение этого столбца.

Критеий Гермейера ориентирован на величину потерь, то есть на отрицательные значения всех aij.При этом, он определяется выражением:

Z =maxi minj [aij Qj ]

Правило выбора согласно критерию Гермейера формируется следующим образом: матрица решений с элементами aij дополняется еще одним столбцом, содержащим в каждой строке наименьщее произведение имеющегося в ней результата на вероятность соответствующего состояния природы Пj, а затем среди полученных значений этого столбца выбирается вариант с наибольшим значением.

Критерий Гермейера обобщает MM – критерий Вальда: в случае равномерного распределения Qj=1/n они становятся идентичными.

Критеий произведений имеет вид

n

Z = max Пaij

ij=1

Здесь правило выбора формируется так: матрица решений с элементами aij дополняется новым столбцом, содержащим произведения всех результатов каждой строки, и в затем выбирается вариант с наибольшим значением. Критерий имеет смысл когда все элементы aijявляются положительными.

41. Марковские процессы с дискретным временем: основные понятия и определения.

Марковские случайные процессы названы по фамилии русского математика Маркова. Теория Марковских случайных процессов имеет наглядный и простой математический аппарат.

Дискретная цепь Маркова задастся ориентированным графом (пример которого дан ив рис), в котором вершины ость состояния описываемой системы, а дуги графа для дискретного времени есть вероятности перехода из состояния в состояние. Для непрерывного времени интенсивности перехода, которое обычно задано, искомыми являются вероятности пребывания системы в некотором состоянии.

Стрелками обозначается переход системы из одного состояние в другое. Рij — вероятность перехода системы из i-го состояния в j-е.

Одной из основных моделей случайных процессов, используемой я прогнозировании является модель марковских цепей. Такими моделями, которые могут быть включены в системы поддержки принятия решений, описывается большое количество физических, биологических, экономических, технических и других явлений. Применительно к нефтяной и газовой промышленности — это процессы технического обслуживания и ремонта нефтяных и газовых скважин, объектов транспорта нефти и газа, оборудования нефте-(газо)перерабатывающих заводов; процессы планирования и организации проведения геолого-технических мероприятий и геофизических исследования скважин, управления запасами и др.

Марковский процесс (для дискретного времени) описывается соотношением:

Pij (k) = P{S(k) = Sj,S(k -1) = Si},

где S(k) — состояние системы на k-оы шаге, a Sj — j-oe состояние системы.

Условия Марковости:

Случайный процесс «блуждания» в системе по своим состояниям является процессом с пуассоновским законом распределения. Он бывает:

• стационарный;

• ординарный (одновременно система не может находиться в двух состояниях);

• без последствий (отсутствие функциональной связи между состояниями).

Марковские цепи применяемые для прогнозирования поведения подобного рода систем можно разделить на две группы. Цепи Маркова с дискретным временем и цепи Маркова с непрерывным временем.

Марковских случайных процессы с дискретным временем нашли применение для прогноза множества показателей, которые меняются щ года в год одновременно, но непосредственно связи между ними не установлены ввиду отсутствия информации или крайней сложности этих связей. Примером может служить прогноз потребностей народного хозяйства в ресурсах. При этом, однако, при реализации данного прогноза устанавливается на перспективу сама структура потребления ресурсов различными отраслями.

Марковский случайный процесс с дискретным временем задается графом состояний элементов системы и матрицей вероятностей Кодов элементов системы из состояния в состояние. Обычно при исследовании такого процесса интересуются вероятностями пребывания системы в j-м состоянии.

Для вычисления вероятности перехода в j-oe состояние Pj — на к-м шаге существует соотношение Колмогорова — Чепмена:

,

Где – вероятность пребывания элементов системы в j-ом состоянии на k-ом шаге (в k-й дискретный интервал времени), — вероятности перехода системы из состояния i в состояние j на k-м шаге, образующих матрицу вероятностей перехода, задаваемую соответствующим графом переходов системы из состояния в состояние.

Переход из состояния в состояние зависит от того, в каком состоянии находилась система на предыдущем шаге и от Рij(K) — матрицы вероятности переходов на k-ом шаге, и эти вероятности могут меняться. Если матрица вероятности переходов не зависит от номера шага, то цепь Маркова называется однородной.

В основе же прогноза лежит вычисление матрицы переходов, элементами которой являются вероятности перехода прогнозируемых параметров из одного состояния в другое, от одного значения к другому.

 


42. Игры с природой: оценка риска

Наиболее просто задача о выборе решения решается в услови­ях, когда нам известны вероятности реализации состояний Пj и их вероятности Q(Пj).

П- пассивный игрок(природа)В этом случае за несколько партий мы получим среднее значение выигрыша (математическое ожидание):, где — взвешенное среднее.

Оптимальной стратегией = Аiбудет та, которая удовлетворяет этому условию.

В результате задача сводится к поиску решения в среднем.

Средний риск:

Можно показать, что стратегия максимизации и минимизации одна и та же. В случае, когда известны вероятности Q1, Q2… Qn, при решении игры с природой всегда можно обойтись чистыми стра­тегиями, то есть: средний выигрыш это среднее взвешенное среднего выигрыша, соответствующее чистым стратегиям и:

Поэтому принятие смешанной стратегии игроком А не может быть выгоднее с любыми вероятностями Пi ,чем применение чистой стратегии = Аi.

еще рефераты
Еще работы по информатике