Лекция: Общая характеристика задач подготовки и принятия решений в СОТС.
В случае неизвестной среды нет достаточных оснований для предположений о том, какие значения будут принимать параметры, характеризующие состояние среды на рассматриваемом временном интервале. При этом возможно два направления создания информационной базы для принятия решения.
П е р в о е направление связано с наблюдением за изменением состояний среды, и затем на основе собранной информации (статистики) строится вероятностное распределение состояний среды. После этого возникает возможность использования методов выбора в условиях стохастической среды. Здесь можно различать две ситуации: а) имеются достаточные объективные предпосылки для априорного задания вида закона вероятностного распределения состояний среды и необходимо только определить (на основе сбора и статистической обработки информации) параметры этого закона (параметрические статистики); б) в ходе наблюдения за изменением состояний среды необходимо выявить сам закон вероятностного распределения состояний среды (непараметрические статистики).
При анализе возможностей принятия решения в рамках данного направления следует учитывать следующее:
1) для сбора и обработки статистики необходим ресурс времени, который на практике довольно часто отсутствует;
2) изменение состояний среды должно обладать свойством статистической устойчивости, т.е. состояния повторяются с определенной частотой в массовых явлениях. Вместе с тем в сложных системах, особенно, когда в контуре управления присутствуют люди, такое свойство довольно часто не выполняется.
В т о р о е направление связано с получением экспертной информации о целесообразном поведении в сложившейся ситуации или об оценках возможных состояний среды, которая учитывается в том или ином виде.
Рассмотрим здесь второе направление, связанное с анализом способов учета экспертной информации в моделях принятия решений.
5.4.1. Модели типа «игра с природой».
Специфическим видом игр, имеющих важное прикладное значение для анализа ситуаций, возникающих при принятии решений в сложных системах, являются так называемые «игры с природой». В этих играх в качестве второго игрока выступает «природа», которая не заинтересована в результатах игры и, следовательно, действует по своим законам, не противодействуя сознательно другой оперирующей стороне. К прикладным проблемам, использующим модели типа «игра с природой», можно отнести многие экономические задачи разработки систем, задачи планирования хозяйственных действий в различных условиях. Неопределенность воздействия среды может определяться как принципиальной невозможностью ее изучения, так и ограничениями ресурсного характера, связанными с этим изучением. Под такими ограничениями, как правило, понимается время, материальные и финансовые затраты и т.п.
Множество с о с т о я н и й п р и р о д ы R (стратегий) интерпретируется как известное по своему составу множество состояний внешней среды. При этом предполагается, что в каждой конкретной ситуации принятия решения реализуется только один элемент из R, который при решении задачи выбора полагается неизвестным. Будем полагать, что множество состояний природы конечно R = { R1,...,Rs }.
Тогда возможные исходы игры можно характеризовать платежной матрицей F:
| R1 | R2 | ......... | Rs | |
| x1 | f11 | f12 | ......... | f1s |
| x2 | f21 | f22 | ......... | f2s |
| F = | ... | ... | ......... | ... |
| ... | ... | ......... | ... | |
| xm | fm1 | fm2 | ......... | fms |
Рис.5.4
Существенным отличием данной ситуации от ситуаций, рассмотренных в условиях целенаправленной среды, является то, что здесь второй игрок (природа) не стремится действовать максимально во вред первому. Это создает возможность первому игроку повысить свой выигрыш по сравнению с гарантированной стратегией (оптимальной смешанной), в то же время неопределенность состояния природы, в которых она может находиться, требует введения лицом, принимающим решение, некоторых предположений, выраженных в аксиомах, принципах оптимизации и т.п., а также соответствующих этим предположениям критериев выбора поведения. Следует отметить, что такой неформальный ввод, осуществляемый на основе экспертного анализа складывающейся ситуации, некоторого принципа во многом определяет дальнейший поиск оптимального решения. Естественно, насколько полно будет проведен такой анализ, и насколько полно выбранный принцип оптимизации будет соответствовать реальности, настолько будет эффективным принятое решение.
Предположения (принципы, аксиомы), вводимые лицом, принимающим решение, позволяют свести ситуацию принятия решения в условиях неизвестной среды к ситуации принятия решения в условиях стохастической или целенаправленной среды.
Так, в частности, исходная ситуация сводится к стохастической среде, при введении предположения о равновероятном распределении состояний природы.
Принцип равновероятных состояний среды (критерий Лапласа)
Следует отметить, что знание вероятностного распределения состояний среды (ее смешанной стратегии q) делает ситуацию вполне определенной — в этом случае целесообразно выбирать i-ю чистую стратегию из X, на которой достигается максимальный средний выигрыш, найденный в соответствии с
s
x*i = arg max F(xi), где F(xi) = Fi = S fijqj, i=1,...,m.
i j=1
Тогда, если состояния среды равновероятны, то следует выбирать решение
s s
x*i = arg max 1/s Sfij = arg max S fij .
i j=1 i j=1
Существует ряд широко распространенных принципов оптимальности и соответствующих им критериев, позволяющих свести исходную неизвестную ситуацию к целенаправленной среде.
Принцип гарантированного результата
(критерий пессимизма, критерий Вальда)
Это известный принцип максимина, который позволяет получить гарантированный результат для оперирующей стороны (1-ый игрок) независимо от того, в каком состоянии находится среда (даже если она будет преследовать строго антагонистические цели). Правило выбора ЛПР (1 игрока) имеет следующий вид:
x* = arg max min f(x,r),
xÎX rÎR
здесь f(x, r) — функция выигрыша оперирующей стороны.
Данный принцип является выражением крайнего пессимизма, поскольку рекомендует ориентироваться на самые худшие условия.
Принцип максимального оптимизма
Этот принцип оптимальности, противоположный предыдущему, ориентирует оперирующую сторону на то, что среда максимально благоприятствует ее действиям. В указанной ситуации ЛПР осуществляет выбор в соответствии с правилом:
x* = arg max max f(x,r),
xÎX rÎR
Принцип пессимизма-оптимизма (критерий Гурвица)
На основе введения числа g, характеризующего степень оптимизма оперирующей стороны, и изменяющегося от 0 до 1, осуществляется линейная свертка первых двух правил выбора:
x* = arg max (g max f(x,r) + (1-g) min f(x,r)).
xÎX rÎR rÎR
Поскольку g характеризует степень оптимизма оперирующей стороны, то, если g = 0 — получаем критерий пессимизма Вальда; если g = 1 — получаем критерий оптимизма.
Принцип минимума максимальных потерь
(критерий минимизации риска, критерий Сэвиджа)
Критерий гарантирует наименьшую величину максимально возможной потери выигрыша по сравнению с тем, который мог бы быть достигнут, если бы было известно состояние среды rÎR. Этот критерий аналогичен критерию Вальда, но сам пессимизм ЛПР здесь понимается по другому. Вводится функция риска
z(x,r) = max f(x,r) — f(x,r),
xÎX
которая характеризует отклонение выигрыша при некоторой стратегии x и состоянии среды r от максимального при данном состоянии природы выигрыша. Тогда критерий Сэвиджа имеет вид:
x* = arg max min z(x,r),
xÎX rÎR
В некоторых случаях решения, выбранные по разным критериям, совпадают друг с другом, и тогда, естественно, целесообразно принять такое решение в качестве окончательного. Однако довольно часто этого не происходит, и эффективность решения определяется тем, насколько правильно будет произведена неформальная оценка неизвестных состояний среды. Тем не менее, всегда целесообразно провести предварительное исследование с использованием различных критериев, проанализировать причины несовпадения решений (если оно имеет место) и после этого принять окончательное решение.
Общая характеристика задач подготовки и принятия решений в СОТС.
Важнейшая особенность современной научно-технической революции состоит в том, что по мере её развития всё большее значение приобретает учёт факторов сложности технико-экономических систем и комплексов: многоаспектность, высокая размерность, неопределённость в её разнообразных проявлениях и др. Учёные считают, что быстрое возрастание сложности – одна из наиболее характерных черт современности. Несомненно, значение проблемы преодоления сложности сохранится и в будущем. Это обусловлено быстрым возрастанием сложности технологии производства, сложности конструкций систем различного назначения, возрастанием объёмов и разнообразия информационных потоков, созданием автоматизированных систем управления глобального характера. Особенно остро вопрос о факторах сложности ставится в связи с необходимостью учёта всевозможных аспектов взаимодействия системы с окружающей средой в таких областях, как экология, экономика, военное дело и пр.
Среди системных направлений науки ведущее место занимают системный анализ, системотехника, теория управления, инженерия знаний, исследование операций. Системный анализ может рассматриваться как развитие, конкретизация системного подхода применительно к задачам экономики, политики, военного дела, техники. Системотехника ориентирована на решение сложных задач создания, внедрения и эксплуатации техники с использованием методологии системного подхода и методов системного анализа.
Исследование операций, как научная дисциплина, получила свое существенное развитие в период с конца 30-х – до начала 70-х годов XX века. Основными исследуемыми классами задач в рамках данной дисциплины являются неклассические экстремальные задачи (задачи математического программирования). С самого своего зарождения проблематика исследования операций была связана с принятием оптимальных решений в производственных, экономических и военных сферах. В годы II Мировой войны последняя сфера научных исследований получила значительное развитие.
Выдающемуся советскому ученому, академику, лауреату Ленинской и Нобелевской премий Л.В.Канторовичу принадлежит признанный приоритет в области постановки прикладных задач математического программирования, описываемых линейными соотношениями (линейное программирование), и разработки алгоритмов их решения.
В США линейное программирование начало развиваться в конце 40-х годов. Американским математиком Дж. Данцигом был предложен эффективный алгоритм решения задач линейного программирования, получивший название «симплекс-метода».
Специалистами по исследованию операций было показано, что многочисленные классы прикладных задач, среди которых особо важное место занимает класс распределительных задач (задач управления ресурсами), хорошо описываются схемой линейного программирования. К распределительным задачам, в частности, относятся транспортные задачи и задачи о назначениях. Последние задачи могут также рассматриваться как разновидности задач целочисленного программирования.
Начиная с середины 70-х годов XX века исследование операций стали рассматривать в качестве одного из разделов теории экстремальных задач, в рамках которой разрабатываются обобщенные подходы к формальному описанию и исследованию проблем принятия решений или по-другому проблем выбора.
Данную проблему каждодневно и ежеминутно приходится решать как отдельному индивидууму при поиске и выборе вариантов своего поведения, так и в масштабах отдельных государств и всего мирового сообщества при управлении соответствующими социально–экономическими и организационно-техническими комплексами и системами. При этом в связи со сложностью указанной проблемы, многообразием факторов, подлежащих учёту, существенным повышением цены возможных ошибок в современных условиях резко возросло значение разработки научно обоснованного подхода к исследованию процессов подготовки и принятия решений в перечисленных выше комплексах и системах. На рис. 1.1.1 показано какое место задач принятия решений занимают в общей структуре технологии управления СОТС.
Рис. 1.1.1. Структура взаимосвязи технологии управления СОТС с технологией подготовки и принятия решений