Лекция: Метод динамического программирования.

В задаче динамического программирования состояние динамической системы характеризуется n переменными состояния (фазовыми переменными) x1(t),..., хn(t), удовлетворяющими следующей системе дифференциальных уравнений первого порядка, называемых уравнениями состояния:

(1)

 

Здесь u1,…,um — управляющие воздействия. Тогда задача состоит в определении управлений

переводящих систему из состояния в

 

и минимизирующих критерий-функционал (критерий качества)

(2)

 

 

Предположим, что управляющие переменные удовлетворяют ограничению

(3)

 

определяющим замкнутую область допустимых управлений.

Критерием качества (83) может являться, например, цена объекта, среднеквадратичная ошибка в обработке результатов эксперимента, время достижения цели и т.п.

Для решения задачи управления требуется задать подходящие граничные условия:

(4)

 

При этом начальное t0и конечное tF времена могут быть неизвестными.

Предположим, что наложенные на управляющие переменные ограничения (3) имеют

вид (5)

Введем также вспомогательные переменные, i=0,1,…,n и функцию Гамильтона (гамильтониан):

(6)

 

С помощью гамильтониана Н исходная система дифференциальных уравнений (1) и уравнения, необходимые для определения вспомогательных функций, представляются в виде:

(7)

 

 

Уравнения (7), являющиеся необходимым условием экстремума функционала (2), называются уравнениями Гамильтона-Эйлера. Таким образом, оптимальное управление

uopt(t)=(u1opt(t),…,umopt(t)) определяет оптимальную траекторию xopt(t) в n- мерном фазовом пространстве и вдоль нее гамильтониан H удовлетворяет условиям (7).

 

 


еще рефераты
Еще работы по информатике