Необхідні умови існування сідлової точки

Для розроблення методів розв’язування окремих типів задач нелінійного програмування важливе значення має поняття сідлової точки, а також визначення необхідних і достатніх умов існування сідлових точок функції Лагранжа у (n+m)-вимірному просторі змінних за довільних умов, які можуть накладатися на їх знаки (необхідні і достатні умови існування сідлової точки функції Лагранжа за відсутності обмежень на знаки змінних розглянуто в п.7.4).

Розглянемо нелінійну задачу:

Причому на компоненти векторів накладено обмеження на знаки. Позначимо множину точок, що задовольняють такі обмеження, через .

Функція Лагранжа для цієї задачі має вигляд:

= . (7.12)

Точка називається сідловою точкою функції Лагранжа (7.12), якщо для всіх виконується співвідношення:

. (7.13)

Для диференційовних функцій та знайдемо необхідні умови існування сідлової точки.

Сідлова точка функції виду (7.12) за означенням задовольняє умову:

Нерівність виконується для всіх точок Х, тобто також і для тих, у яких лише одна координата відрізняється від Х^*. Допустимо, що це х_k, а всі інші збігаються з координатами сідлової точки .

Оскільки права частина нерівності є фіксованою, а в лівій частині змінюється лише одна координата х_k, то приходимо до функції однієї змінної , яку можна зобразити графічно на координатній площині.

Розглянемо спочатку випадок, коли , тобто лише частину координатної площини, для якої .

Можливі такі випадки:

1) коли всі , то максимальне значення функції L(x_k) досягатиметься в точці, для якої (рис.7.5).

Рисунок 7.5

2) коли максимум функції L(x_k) досягатиметься в точці і розглядувана частинна похідна також дорівнюватиме нулю: (рис.7.6).

Рисунок 7.6

3) коли точка максимуму функції L(x_k) досягатиметься також у точці
, а частинна похідна (рис.7.7).

Рисунок 7.7

Узагальнюючи всі три ситуації, маємо:

для

та

Розглядаючи другу частину нерівності (7.13):

аналогічними міркуваннями, що проілюстровані рис.7.8-7.9, встановлюються необхідні умови для похідних по функції Лагранжа в сідловій точці.

Рисунок 7.8 Рисунок 7.9

Об’єднуючи всі три випадки для невід’ємних координат, маємо необхідні умови сідлової точки:

для тих індексів j, де . (7.14)

Зауважимо, що для маємо ті самі випадки, які зображено на рис.7.5-7.9, причому графіки будуть симетрично відображені відносно осі Оy, тобто для недодатних координат необхідна умова має вигляд:

для тих індексів j, де . (7.15)

І нарешті, як відомо з попереднього параграфа, якщо на знак х_j умови не накладаються, то необхідною умовою є:

, – довільного знака. (7.16)

Узагальнення всіх випадків приводить до рівняння:

. (7.17)

Розглядаючи другу частину нерівності (7.13), за допомогою аналогічних міркувань встановлюємо необхідні умови для похідних по функції Лагранжа в сідловій точці:

для тих індексів і, де , (7.18)

для тих індексів і, де , (7.19)

для тих індексів і, де має довільний знак. (7.20)

Отже, справджується рівняння:

. (7.21)

Сукупність співвідношень (7.14)-(7.21) становить необхідні умови, які має задовольняти сідлова точка функції Лагранжа для точок, що належать множині . При цьому повинна мати частинні похідні по всіх компонентах векторів .

Теорема Куна-Таккера

Розглянутий метод множників Лагранжа уможливлює знаходження лише локальних сідлових точок функції Лагранжа.

Теорема Куна-Таккера дає змогу встановити типи задач, для яких на множині допустимих розв’язків існує лише один глобальний екстремум зумовленого типу. Вона тісно пов’язана з необхідними та достатніми умовами існування сідлової точки.

Розглянемо задачу нелінійного програмування, яку, не зменшуючи загальності, подамо у вигляді:

, (7.22)

, (7.23)

. (7.24)

(Очевидно, що знак нерівності можна змінити на протилежний множенням лівої і правої частин обмеження на (– 1)).

Теорема 7.1. (Теорема Куна-Таккера). Вектор Х^* є оптимальним розв’язком задачі (7.22)-(7.24) тоді і тільки тоді, коли існує такий вектор , що при для всіх точка є сідловою точкою функції Лагранжа

і функція мети для всіх угнута, а функції – опуклі.

Умови теореми Куна — Таккера виконуються лише для задач, що містять опуклі функції.

Опуклі й вогнуті функції

Наведемо основні означення та теореми. Нехай задано n-вимірний лінійний простір Rⁿ. Функція , що задана на опуклій множині , називається опуклою, якщо для будь-яких двох точок та з множини X і будь-яких значень виконується співвідношення:

. (7.25)

Якщо нерівність строга і виконується для , то функція називається строго опуклою.

Функція , яка задана на опуклій множині , називається вогнутою, якщо для будь-яких двох точок та з множини X і будь-якого справджується співвідношення:

. (7.26)

Якщо нерівність строга і виконується для , то функція називається строго угнутою.

Слід зазначити, що опуклість та угнутість функції визначаються лише відносно опуклих множин у , оскільки за наведеними означеннями разом з двома будь-якими точками та множині X належать також точки їх лінійної комбінації: для всіх значень , що можливо лише у разі, коли множина X є опуклою.

Теорема 7.2. Нехай – опукла функція, що задана на замкненій опуклій множині X, тоді будь-який локальний мінімум на цій множині є і глобальним.

Теорема 7.3. Нехай – опукла функція, що визначена на опуклій множині Х, і крім того, вона неперервна разом з частинними похідними першого порядку в усіх внутрішніх точках Х. Нехай – точка, в якій . Тоді в точці досягається локальний мінімум, що збігається з глобальним.

Як наслідок теореми можна показати, що коли Х замкнена, обмежена знизу, опукла множина, то глобального максимуму опукла функція f(X) досягає на ній у одній чи кількох точках (при цьому допускається, що в точці Х значення функції скінченне). Застосовуючи за розв’язування таких задач процедуру перебору крайніх точок, можна отримати точку локального максимуму, однак не можна встановити, чи є вона точкою глобального максимуму.

Для угнутих функцій отримані результати формулюють так. Нехай f(X) – угнута функція, що задана на замкненій опуклій множині . Тоді будь-який локальний максимум f(X) на множині Х є глобальним. Якщо глобальний максимум досягається в двох різних точках множини, то він досягається і на нескінченній множині точок, що лежать на відрізку, який сполучає ці точки. Для строго угнутої функції існує єдина точка, в якій вона досягає глобального максимуму.

Градієнт угнутої функції f(X) у точках максимуму дорівнює нулю, якщо f(X) – диференційовна функція. Глобальний мінімум угнутої функції, якщо він скінченний на замкненій обмеженій зверху множині, має досягатися в одній чи кількох її крайніх точках за умови скінченності функції f(X) у кожній точці цієї множини.

Опукле програмування

Опукле програмування розглядає методи розв’язування задач нелінійного програмування, математичні моделі яких містять опуклі або угнуті функції.

Загальний вигляд задачі опуклого програмування такий:

, (7.27)

, ; (7.28)

, (7.29)

де , – угнуті функції.

Аналогічний вигляд має задача для опуклих функцій.

Позначимо: , тоді , і маємо:

, (7.30)

; (7.31)

, (7.32)

де , – опуклі функції.

Оскільки ці задачі еквівалентні, то нижче розглянемо задачу (7.27)-(7.29).

Множина допустимих планів задачі, що визначається системою (7.28), є опуклою.

Як наслідок теорем 7.2 та 7.3 справджується таке твердження: точка локального максимуму (мінімуму) задачі опуклого програмування (7.27)-(7.29) є одночасно її глобальним максимумом (мінімумом).

Отже, якщо визначено точку локального екстремуму задачі опуклого програмування, то це означає, що знайдено точку глобального максимуму (мінімуму).

У разі обмежень-нерівностей задачу опуклого програмування розв’язують, застосовуючи метод множників Лагранжа.

Функція Лагранжа для задачі (7.27)-(7.29) має вид:

(7.33)

де – множники Лагранжа.

Використовуючи теорему Куна-Таккера, маємо необхідні та достатні умови існування оптимального плану задачі опуклого програмування.

Теорема 7.4. Якщо задано задачу нелінійного програмування виду (7.27)-(7.29), де функції диференційовні і вгнуті по Х, то для того, щоб вектор був розв’язком цієї задачі, необхідно і достатньо, щоб існував такий вектор , що пара ( , ) була б сідловою точкою функції Лагранжа, тобто щоб виконувалися умови:

(І) , ; (7.34)

(ІІ) , ; (7.35)

(ІІІ) , ; (7.36)

(IV) , . (7.37)

Для задачі мінімізації (7.30)-(7.32), де всі функції диференційовні і опуклі по Х, маємо умови, аналогічні вищенаведеним, але зі знаком «» в нерівностях (7.35) та (7.37).