Реферат: Оптимальність у системах керування
оптимальність у системах керування
1. Умови оптимальності у неавтономних системах керування
У загальному випадку неавтономної системи права частина закону руху й підінтегральна функція цільового функціонала залежать явно від часу />, тобто закон руху має вигляд:
/>, (1)
а цільовий функціонал дорівнює
/>. (2)
Тут функції />і />– неперервні по сукупності змінних і неперервно диференційовані по змінних />, />, />.
Також вважатимемо, що момент часу />, який відповідає початковому стану />, відомий, а момент часу />проходження через кінцеву точку />не заданий і повинен бути знайдений, тобто сформульована задача – це задача з вільним часом.
Поставлена задача може бути зведена до автономної задачі введенням додаткової змінної />. До закону руху при цьому додається рівняння
/>,
а до початкових умов – співвідношення />.
Тепер систему (2) можна переписати у вигляді:
/>(3)
а функціонал />дорівнюватиме
/>, (4)
де />(відповідно до доданого у початкову систему рівняння).
Отже, неавтономну />-вимірну задачу було зведено до автономної задачі з розширеним фазовим простором. У новій задачі потрібно знайти оптимальну траєкторію, що поєднує точку />розширеного фазового простору з деякою точкою />на прямій, яка проходить через точку />паралельно осі />. Оскільки кінцеве значення />змінної />невідоме, то нова задача – це задача з фіксованим лівим і рухомим правим кінцями.
Якщо в задачі оптимального керування (3) – (4) відомі і початковий момент часу />й кінцевий момент часу />, то задача називається задачею з фіксованим часом. Перетворення цієї задачі введенням додаткового змінного приводить до задачі з фіксованими кінцями в такому формулюванні. Потрібно знайти керування />, що переводить фазову точку системи (2) зі стану />в момент часу />у стан />в момент часу />, причому функціонал (4) набуває найменшого значення. Зауважимо, що момент часу />попадання в точку />можна не вважати фіксованим, оскільки в силу тотожності />попадання в точку />може відбутися тільки в цей момент часу. Таким чином, до даної задачі можна застосувати теорему, відповідно до якої для одержання необхідних умов екстремуму функціонала необхідно максимізувати функцію Понтрягіна
/>, (5)
де />– загальний вигляд функції Понтрягіна з теореми 1, у якій не врахована додаткова, (/>)-ша змінна. Спряжена система для цієї задачі за умов />набуває вигляду:
/>(6)
Має місце така теорема.
Припустимо, />, />– оптимальний процес для задачі з фіксованим часом. Тоді існує ненульова вектор-функція />, що відповідає цьому процесу, така що:
1. Для будь-якого />функція />змінної />набуває максимального значення в точці />, тобто:
/>: />.
2. />, />.
Оскільки, як і раніше, />, то умову 2 цієї теореми достатньо перевірити в якій-небудь одній точці відрізка />.
Розглянемо випадок, коли при фіксованому />правий кінець вільний. Ця задача полягає в тому, щоб із заданого стану />за заданий час />пройти по траєкторії з довільним кінцевим станом за умови мінімізації цільового функціонала. Умови трансверсальності для цієї задачі набувають вигляду:
/>, />. (7)
Для цього випадку необхідна умова оптимальності полягає в тому, щоб функція />досягала максимального значення для кожного />на оптимальному керуванні />і мала місце умова (7).
2 Поняття особливого керування
На практиці часто зустрічаються задачі оптимального керування, у яких функція Понтрягіна лінійно залежить від всіх керувань або від частини з них (наприклад, в лінійних задачах оптимальної швидкодії). Однак у нелінійних задачах оптимального керування (якщо функція Понтрягіна є нелінійною по одній або декількох фазових змінних) можлива ситуація, коли на оптимальній траєкторії коефіцієнт при одній з компонент вектора керування />обертається на нуль всюди на деякому інтервалі часу, і тоді умова максимуму функції />за />не дозволяє однозначно визначити оптимальне керування. Ця ситуація називається особливим режимом керування. Дослідимо її детальніше.
Розглянемо автономну задачу оптимального керування
/>,
Де />; />, />, />, />,
/>– довільна множина з />;
/>– лінійний простір кусково-неперервних на />функцій.
Крайові умови задачі мають вигляд:
/>, />.
Потрібно знайти таке припустиме керування />, що переводить систему зі стану />у стан />, причому відповідний припустимий процес />доставляє мінімальне значення функціоналу
/>,
де функції />, />неперервні по сукупності всіх змінних і неперервно-диференційовані по змінних />.
Вважатимемо, що функція Понтрягіна />для цієї задачі є лінійною за частиною компонент вектора />. Виділимо із цих компонент групу з />керувань (з тих, за якими функція />лінійна) і позначимо їх через />, а інші />керувань зберемо у вектор />(він також може включати компоненти, за якими функція />лінійна). За таких умов закон руху набуває вигляду:
--PAGE_BREAK--/>,
де />.
Складемо функцію Понтрягіна для даної задачі:
/>.
Очевидно, що
/>, />. (8)
Припустимо, що процес />разом з розв’язком />спряженої системи
/>, />, (9)
задовольняє принципу максимуму і, крім того, припустимо, що у всіх точках деякого інтервалу />має місце рівність
/>, (10)
або, враховуючи (10),
/>, />, />. (11)
Ця ситуація означає, що коефіцієнти при />на деякому часовому відрізку дорівнюють 0, і оптимальне керування визначити неможливо. У цьому випадку вектор керувань />називається особливим керуванням на відрізку />, процес />– особливим режимом, траєкторія />– траєкторією особливого режиму, а відрізок часу />– ділянкою особливого керування.
З формули (11) випливає, що на ділянці особливого режиму функція Понтрягіна не залежить від />. Дійсно, />:
/>.
Тому в даній ситуації умова максимуму по />не дає жодної інформації про конкретні значення керувань />.
Оскільки на ділянці особливого режиму має місце співвідношення (11), то очевидно, що
/>, />
і т.д. Останні співвідношення разом з умовою (10) дозволяють визначити всі особливі режими.
3. Лінійна задача оптимальної швидкодії
Розглянемо лінійну задачу оптимальної швидкодії:
/>, />, (12)
де />, />,
/>, />– числові матриці розмірності />та />відповідно.
Область керування задачі />– замкнутий обмежений багатогранник в />:
/>, />, (13)
Якщо для будь-якого вектора />, паралельного будь-якому ребру багатогранника />, система векторів />, />, …, />(14) є лінійно незалежною, то багатогранник />задовольняє умові спільності положення відносно системи (14).
Для перевірки лінійної незалежності векторів (13) достатньо перевірити, чи матриця, стовпцями якої є стовпці (12), є невиродженою, тобто
/>.
Перепишемо формулу (10):
/>, />,
де />, />– />-і рядки матриць />і />.
Функція Понтрягіна лінійної задачі оптимальної швидкодії має вигляд:
/>(15)
Оскільки перший доданок у формулі (15) не залежить від />, то функція />досягає максимуму за змінною />одночасно з функцією
/>.
Спряжена система у цьому випадку може бути записана у вигляді:
/>, />,
або у векторній формі
/>. (16)
Позначимо через />. З теореми 2 випливає, що якщо />– оптимальне керування, то існує такий ненульовий розв’язок />системи (16), для якого в кожний момент часу функція />набуватиме максимального значення за змінною />:
/>. (17)
Оскільки система (17) з постійними коефіцієнтами не містить невідомих функцій />і />, то всі її розв’язки можна легко знайти, після чого, використовуючи їх для розв’язання задачі максимізації функції />на множині />, знаходимо оптимальні керування />.
Для будь-якого нетривіального розв’язання />системи (11) співвідношення (14) однозначно визначає керування />, причому це керування кусково стале, а значеннями керування в точках неперервності є вершини багатогранника />.
Точки розриву оптимальної функції керування />відповідають зміні значення керування і називаються точками перемикання. Якщо />– точка перемикання, то ліворуч від неї керування має одне значення, наприклад, />, а праворуч інше – />.
Позначимо через />підмножину у />виду
/>. (18)
Якщо всі корені характеристичного рівняння матриці />з (14) є дійсними, то для будь-якого розв’язання />рівняння (18) кожна з функцій />є кусково сталою і має не більше ніж />перемикань (/>– порядок системи (16)).
Керування />називається екстремальним керуванням, якщо воно задовольняє принципу максимуму.
Для лінійної задачі оптимальної швидкодії з областю керування – багатогранником />керування />є екстремальним, якщо існує таке нетривіальне розв’язання />системи (17), для якого матиме місце співвідношення (18).
Зрозуміло, що будь-яке оптимальне керування є екстремальним. Тому, щоб знайти оптимальне керування, що переводить фазову точку зі стану />у стан />, треба відшукати всі екстремальні керування з цими крайовими умовами, а потім серед них вибрати те, що здійснює перехід за найменший час.
продолжение--PAGE_BREAK--
У загальному випадку можуть існувати кілька оптимальних керувань, що переводять фазову точку зі стану />у стан />, але якщо початок координат у просторі керувань є внутрішньою точкою багатогранника />, то екстремальне керування єдине. Отже, у лінійних задачах оптимальної швидкодії принцип максимуму дозволяє не тільки визначити вид оптимальних керувань, але й одержати умови єдиності оптимального керування.
Припустимо, що початок координат є внутрішньою точкою багатогранника />припустимих керувань. Якщо />і />– два екстремальних керування, що переводять фазову точку зі стану />у стан />за час />і />відповідно, то />і />, />.
У теоремі має місце умова />.
Теорема. Якщо існує хоча б одне керування, що переводить систему (17) зі стану />у стан />, то існує й оптимальне по швидкодії керування, що також переводить систему з />у />.
4. Умови оптимальності у задачі з рухомими кінцями
У задачі з рухомими кінцями або початковий стан />, або кінцевий стан />, або обидва ці стани невідомі. Задані тільки множини />і />, що містять точки />та />.
Гіперповерхня – це множина всіх точок />, які задовольняють співвідношенню
/>,
де />– скалярна диференційована функція. Якщо />– лінійна функція, то гіперповерхня називається гіперплощиною і описується рівнянням
/>. (19)
Якщо />, то гіперплощина (19) є (/>)-вимірним лінійним підпростором в />.
Будь-який (/>)-вимірний підпростір />може бути заданий як множина розв’язань лінійної однорідної системи з />рівнянь із />невідомими, матриця якої має ранг />:
/>/>.
Такий лінійний підпростір називається />-вимірною площиною. Множина розв’язань системи нелінійних рівнянь
/>
де функції />, …, />диференційовані і ранг матриці Якобі цієї системи функцій дорівнює />, є />-вимірним гладким різноманіттям.
Задача оптимального керування з рухомими кінцями полягає в тому, щоб знайти таке припустиме керування />для системи із законом руху
/>, />, />,
яке переводить фазову точку з деякого, заздалегідь невідомого, стану />на />-вимірному різноманітті />(/>) у деякий стан />на />-вимірному різноманітті />(/>) і надає найменшого значення функціоналу
/>.
Задача оптимального керування з фіксованими кінцями є окремим випадком цієї задачі при />, тобто коли різноманіття />і />вироджуються в точку.
Відсутність рівнянь, що задають початковий і кінцевий стани, приводить до того, що система необхідних умов перестає бути повною. У цьому разі для одержання відсутніх рівнянь використовують умови, що називаються умовами трансверсальності.
Умови трансверсальності. Вектор спряжених змінних />із принципу максимуму задовольняє умові трансверсальності на лівому кінці траєкторії />, якщо вектор />ортогональний дотичній площини до різноманіття />в точці />, тобто
/>, (20)
де />– довільний вектор, що лежить у дотичній площини. Аналогічно формулюється умова на правому кінці.
Якщо />, />– оптимальний процес у задачі з рухомими кінцями />, />, то ненульова вектор-функція />, що існує відповідно до теореми 3, задовольняє на кожному з кінців траєкторії умовам трансверсальності.
Розглянемо окремий випадок задачі з рухомими кінцями, коли, наприклад, правий кінець траєкторії вільний (тобто />). Тоді умови трансверсальності зводяться до співвідношення />. Повний вектор спряжених змінних
/>
визначається з точністю до довільної сталої, зокрема, вважають, що />(відповідно до принципу максимуму />, />) і тоді
/>.