Короткі теоретичні відомості. 1956 року в роботах академіка Л.С

1956 року в роботах академіка Л.С. Понтрягіна та його учнів було обґрунтовано принцип максимуму як необхідну і достатню ознаку оптимального процесу для лінійних систем і необхідну ознаку для нелінійних систем.

Між принципом максимуму і принципом оптимальності Беллмана існує прямий зв’язок. Скористаємось рівнянням (3.2).

Позначимо: , тоді вектор запишемо:

Оскільки max(-y) = -min(y) (рис. 5.1), то можна записати:

або

Отже, умову мінімуму інтегралу (3.1) запишемо у вигляді:

(5.1)

де - скалярний добуток двох векторів.

Отриманий вираз (5.1) є математичним записом принципу максимуму Понтрягіна.

Використання принципу максимуму потребує знання вектора , що розглядають на оптимальній траєкторії. Цей вектор можна знайти, розв’язавши так звані спряжені рівняння:

(5.2)

Часто рівняння (5.1) і (5.2) записують у більш компактній формі, позначивши скалярний добуток векторів через H. Тоді отримуємо:

(5.3)

(5.4)

де (з урахуванням того, що ).

Узявши частинну похідну H за yі, отримаємо рівняння руху об’єкта:

(5.5)

Із виразу (5.3) можна зробити такі висновки:

- якщо процес є оптимальним, то у будь-який момент часу t оптимальне керування u(t) – це таке керування, що максимізує величину Н;

- у будь-якій точці оптимальної траєкторії максимальне значення величини Н одне й те саме: воно дорівнює нулю.

Функцію Н називають функцією Гамільтона. Вона має визначений фізичний смисл. Зокрема для консервативних механічних систем функція Н є повною енергією системи, яка повинна залишатися постійною й максимальною у процесі керування. Функції yі є імпульсами і задають напрямок руху.

Для неконсервативних систем, наприклад електричних, функція Н – потужність, а yі – також імпульси.

Звідси випливає фізичний смисл оптимального керування: необхідно надавати об’єкту таку кількість енергії, яка забезпечувала б його рух, при якому функціонал, вибраний як критерій оптимальності, досягав би екстремального значення за обмежень, що накладені на фазові координати та керування. Ця енергія надається за допомогою керування u, тому Н є функцією також і від u.

Таким чином, принцип максимуму в загальному випадку можна сформулювати так:

Для отримання оптимальної системи, у смислі мінімуму функціоналу І, необхідне існування таких ненульових безперервних функцій y0(t), …, yn(t), які є розв’язком системи що при будь-якому t з інтервалу 0 £ t £ T, величина Н як функція змінних u1, … , ur у заданій зоні їх припустимих значень, досягає максимуму відповідно до умови:

Принцип максимуму є найдоцільнішим з усіх методів знаходження оптимальних керувань при розв’язуванні задач про швидкодію.

Розв’язування задачі виконують у такій послідовності:

1. Складають функцію Гамільтона Н, що дорівнює скалярному добутку векторів , тобто причому .

2. Беруть частинні похідні Н за керуванням ui, які визначають екстремум функції Н. У разі лінійної залежності Н від ui частинна похідна є функцією однієї або декількох складових вектора . При цьому для досягнення додатного максимуму Н необхідно, аби ui = +umax при yі(t) > 0 і ui = -umax при yі(t) < 0, тобто

ui = umax ×sign yі(t). (5.6)

Таким чином, у даному випадку керуючий вплив стрибком набуває значення +umax або -umax. Момент зміни знаку називається моментом перемикання.

У разі нелінійної залежності Н від ui частинну похідну дорівнюють нулю і з отриманого рівняння визначають ui, при якому максимізується Н.

3. Для знаходження допоміжної функції yі(t), яка визначає керування, складають і розв’язують систему спряжених рівнянь (5.4).

4. У разі замкнутої системи визначають залежність керування від вихідних координат системи, що визначають оптимальну траєкторію: При цьому моменти перемикання визначаються автоматично при відхиленні фактичної траєкторії від оптимальної.

У разі розімкнутої системи визначають кількість змін знаку yі(t), тобто визначають, скільки разів yі(t) переходить через нуль або інакше, скільки коренів має функція yі(t). Моменти перемикання можна визначити за методом стикування розв’язків диференціальних рівнянь зі знакозмінною правою частиною.

Принцип максимуму дає тільки якісну сторону зміни керуючої дії, тобто визначає кількість інтервалів керування, і не дає кількісної оцінки закону керування, оскільки сталі інтегрування не можна визначити через невідомі початкові умови для функції y(t). Це є його суттєвим недоліком.

Кількість перемикань визначається відповідно до теореми про n-інтервалів, яку 1953 року довів у своїх роботах О.А.Фельдбаум:

Якщо характеристичне рівняння системи n-го порядку має тільки дійсні недодатні корені (від’ємні та нульові), процес керування матиме не більше (n-1) перемикань. Якщо є комплексні корені (включаючи чисто уявні), то перемикань може бути більше, залежно від початкових умов.

Можна зробити висновок, що оптимальна за швидкодією система має релейний перемикаючий елемент, що керується за допомогою спеціального обчислювального пристрою. При цьому необхідно безперервно вимірювати всі n фазових координат, тобто регульовану величину і (n-1) її похідних і подавати інформацію на вхід обчислювального пристрою.

Оскільки ідеальні диференціальні ланки фізично не реалізуються, то для систем високого порядку можна здійснити лише близькі до оптимальних системи. Крім того, для систем високого порядку знаходження поверхонь перемикання є досить складною задачею, яка розв’язана лише для окремих випадків.

 

Завдання до задачі

Задача 5.1Об’єкт описується диференціальним рівнянням:

, (5.7)

де y(t) - вихідна координата об’єкта;

k - коефіцієнт передачі;

u(t) - керуючий вплив.

Знайти алгоритм керування, що переводить об’єкт з положення y(0)=y0, y¢(0)=0 до рівноважного положення (y=0, y¢=0) за мінімальний час. На керування накладається обмеження:

Вихідні дані наведені в таблиці 5.1.

Таблиця 5.1

№ вар. y0 k
-3.1 0.0026

Об’єкт описується диференціальним рівнянням:

, (5.8)

де y(t) – вихідна координата об’єкта;

u(t) – керуючий вплив;

Знайти алгоритм керування, що переводить об’єкт з положення y(0)=-1,5 y¢(0)=0 до рівноважного положення (y=0, y¢=0) за мінімальний час. На керування накладається обмеження:

Алгоритм розв’язування задачі містить такі етапи:

- визначити передавальну функцію об’єкта управління;

- побудувати структурну схему об’єкта;

- скласти математичний опис об’єкта у вигляді системи рівнянь, що приведені до нормального вигляду;

- визначити складові вектора j=(j1, j2, … jn), ji = yi¢, i=1,2,…n;

- визначити складові вектора Y=(Y1,Y2, …Yn);

- записати гамільтоніан H=Y×j;

- визначити умови максимуму H;

- виконати аналіз можливих алгоритмів управління.

Уводимо нові змінні: y = y1; dy/dt = y2.

Тоді рівняння (5.8) в операційній формі, тобто у зображеннях за Лапласом, має вигляд:

(5.9)

Після перетворень отримуємо передавальну функцію за Лапласом:

. (5.10)

Структурну схему об’єкта (рис. 5.2) можна подати у вигляді двох динамічних ланок, що з’єднані послідовно:

 
 

 

 

 

 


Рівняння ланок:

(5.11)

Запишемо рівняння у нормальному вигляді:

(5.12)

Тоді функція Гамільтона буде:

(5.13)

Спряжені рівняння мають вигляд:

(5.14)

Звідси знаходимо:

y 1 = с1; y2 = - с1t +c2, (5.15)

де с1, с2 – сталі інтегрування.

Функція Гамильтона лінійна відносно u(t), тому для досягнення максимуму необхідно, щоб y2 і u(t) були одного знака, тобто

u = umax×signy2. (5.16)

Оскільки функція y2 має один корінь t1=c2/c1, керування u(t) має одну зміну знака (два інтервали керування).

Після закінчення керування (рис.5.3).

Оскільки система розімкнута, момент перемикання знаходимо методом стикування розв’язків диференціальних рівнянь. Отже, необхідно знайти моменти часу:

t1 – момент зміни знака керування;

T = t2 – закінчення керування.

У початковий момент часу (t=t0=0) об’єкт знаходиться у точці В (рис. 5.3), тобто S(0) = -S0 = y1(0) = -1,5;

Кінцеве значення координат: S(t2) = y1(t2)=0;

При цьому з рис. 5.3 видно, що перший інтервал керування є додатним (u = +umax), а другий – від’ємним (u = -umax).

Розв’язуємо диференціальне рівняння: тобто рівняння зі знакозмінною правою частиною. Характеристичне рівняння: s2 = 0, тобто маємо два нульових кратних кореня s1=s2=0. Тоді розв’язок має вигляд:

(5.16)

де с1 і с2 – сталі інтегрування.

Після диференціювання отримуємо:

(5.17)

Запишемо рівняння (5.16) і (5.17) для різних моментів часу:

- для t = t0 = 0 (початок першого інтервалу):

(5.18)

Звідси с10 = 0, с20 = y1(0) = -1,5;

- для t = t1 (кінець першого, початок другого інтервалу); оскільки функції безперервні, то можна виконати стикування розв’язків на межі першого і другого інтервалів:

(5.19)

Звідси отримуємо:

- для t = t2 = T (кінець другого інтервалу):

(5.20)

Звідси

Дорівнюємо вирази для с11 , а також для с21. Тоді отримуємо відповідно:

або t2 = T = 2t1;

Після підстановки першого рівняння до другого отримаємо:

, або

Звідси знаходимо:

- момент перемикання керування:

- момент закінчення руху:

Задача 5.2Визначити закон змінювання струму якоря двигуна постійного струму з незалежним збудженням, що забезпечує відпрацювання кутового переміщення q0 протягом мінімального часу Т при статичному моменті Мс=0 і обмеженні струму якоря |i| £ іmax.

Вихідні дані наведено у таблиці 5.2.

Таблиця 5.2

№ вар. q0, рад с, Н×м/А J, кг×м2 imax, А T, с
9,42 15,76 0,8 7,2 0,4

Розв’язати задачу 5.2.

Рівняння, що описують динаміку двигуна, мають вигляд:

де w - кутова швидкість двигуна; с – струмова стала двигуна; J – момент інерції електропривода.

Позначимо: w = y1, q = y2, i = u. Тоді рівняння двигуна матимуть вигляд:

(5.21)

за початкових умов y1(0)=0, y2(0)=0 і при кінцевих значеннях змінних y1(Т)=0, y2(Т)=q0.

Складаємо функцію Гамільтона:

Функція Н лінійна відносно u. Запишемо систему спряжених рівнянь:

(5.22)

Звідси отримуємо: y2 = с2; y1 = - с2t + c1,

де c1 і c2 – сталі інтегрування.

Для досягнення максимуму Н необхідно, щоб y1 і u були одного знака, тобто

u = umax×signy1 = іmax×signy1= іmax×sign(c1 - c2t).

Функція має один корінь t1=c1/c2, тому керування u має одну зміну знака:

(5.23)

Визначимо момент перемикання t1. Для цього використаємо перше рівняння системи (5.21). На першій ділянці при t < t1 керування u = imax, тому dy1/dt = cimax/J.

За початкових умов y1(0) = 0 отримуємо розв’язок цього рівняння:

При t = t1 швидкість у кінці першої ділянки обчислюємо за формулою:

(5.24)

На другій ділянці при t ³ t1 керування u = - іmax, тому dy1/dt = -cimax/J.

Розв’язок цього рівняння знаходимо за формулою:

Сталу інтегрування c3 визначимо з умови, що функція y1(t) при t=t1 безперервна і на другій ділянці слушна формула (5.24). Тоді отримуємо:

При t = T маємо y1(T) = 0, тобто звідки t1= T/2.

Час Т визначимо з умови, що за цей час кутове переміщення дорівнює q0. Тоді з другого рівняння системи (5.21) маємо:

або

звідки знаходимо:

З урахуванням позначень струму якоря і кутової швидкості запишемо закони їх змінювання під час відпрацювання двигуном заданого переміщення:

Закон змінювання напруги на якорі можна визначити з рівняння: uя=іR+cw.

Цей закон має вигляд:

 

Висновок

Принцип максимуму Понтрягіна є найдоцільнішим з усіх методів знаходження оптимальних керувань при розв’язуванні задач про швидкодію. Але цей метод дає тільки якісну сторону зміни керуючої дії, тобто визначає кількість інтервалів керування, і не дає кількісної оцінки закону керування. Це є його суттєвим недоліком.