Умовний та безумовний екстремуми функції

У теорії дослідження функцій задача на відшукання екстремальних значень не містить ніяких додаткових умов щодо змінних і такі задачі належать до задач відшукання безумовного екстремуму функції. Локальний та глобальний екстремуми тоді визначаються з необхідних та достатніх умов існування екстремуму функції.

Нагадаємо, що необхідна умова існування локального екстремуму функції двох змінних формулюється так: для того, щоб точка була точкою локального екстремуму, необхідно, щоб функція була неперервною і диференційовною в околі цієї точки і перші частинні похідні за змінними та у цій точці дорівнювали нулю:

Точка називається критичною.

Достатня умова існування локального екстремуму функції двох змінних формулюється так: для того, щоб критична точка була точкою локального екстремуму, достатньо, щоб функція була визначена в околі критичної точки та мала в цій точці неперервні частинні похідні другого порядку.

Тоді, якщо

то в точці функція має екстремум, причому, якщо

тоді – точка локального максимуму функції , а якщо

тоді – точка локального мінімуму функції .

У разі, якщо

то в точці функція екстремуму не має.

Якщо

то питання про існування екстремуму залишається відкритим.

Якщо задача полягає у відшуканні локального чи глобального екстремуму деякої функції за умови, що на змінні такої функції накладаються додаткові обмеження, то маємо задачу пошуку умовного екстремуму функції. Термін «умовний» означає, що змінні задачі мають задовольняти деякі умови.

Розглянемо таку задачу для випадку двох змінних:

знайти

(7.4)

за умови, що

. (7.5)

Найпростіший спосіб розв’язання задачі такого виду полягає в тому, що спочатку з обмеження (7.5) знаходять вираз однієї змінної через іншу. Приміром, визначають через . Отриманий вираз виду підставляють у функцію (7.4), що після цього стає функцією однієї змінної , і далі знаходять її безумовний екстремум.

Якщо деяка точка є точкою екстремуму функції , то точка є точкою умовного екстремуму функції (7.4) за умови (7.5).

Однак не завжди вдається відшукати аналітичний вираз однієї змінної через іншу в умові (7.5). Часто це досить важко здійснити або неможливо. Також іноді складно узагальнити даний спосіб для функції n змінних, на які накладено m обмежень. Тому описана досить проста ідея зведення задачі відшукання умовного екстремуму функції кількох змінних до задачі на безумовний екстремум функції однієї змінної не може бути використана як основа універсального методу розв’язування задач на умовний екстремум. Цікавий метод розв’язування задач типу (7.4)-(7.5) запропонував Лагранж.

Метод множників Лагранжа

Ідея методу множників Лагранжа полягає в заміні початкової задачі простішою. Для цього цільову функцію замінюють іншою, з більшою кількістю змінних, тобто такою, яка включає в себе умови, що подані як обмеження. Після такого перетворення подальше розв’язування задачі полягає в знаходженні екстремуму нової функції, на змінні якої не накладено ніяких обмежень. Тобто від початкової задачі пошуку умовного екстремуму переходимо до задачі відшукання безумовного екстремального значення іншої функції. Отже, завдяки такому перетворенню можливе застосування методів класичного знаходження екстремуму функції кількох змінних.

У попередньому пункті наведена необхідна умова існування локального екстремуму неперервної та диференційовної функції двох змінних.

Узагальнення необхідної умови існування локального екстремуму функції n змінних має аналогічний вигляд. Отже, для розв’язування задачі необхідно знайти вирази частинних похідних нової цільової функції за кожною змінною і прирівняти їх до нуля. В результаті отримаємо систему рівнянь. Її розв’язок визначає так звані стаціонарні точки, серед яких є і шукані екстремальні значення функції.

Розглянемо метод множників Лагранжа для розв’язування задачі нелінійного програмування, що має вигляд:

(7.6)

за умов:

, (7.7)

де функції і мають бути диференційовними.

Задача (7.6)-(7.7) полягає в знаходженні екстремуму функції за умов виконання обмежень .

Переходимо до задачі пошуку безумовного екстремуму. Теоретично доведено, що постановки та розв’язання таких задач еквівалентні.

Замінюємо цільову функцію (7.6) на складнішу. Ця функція називається функцією Лагранжа і має такий вигляд:

(7.8)

де – деякі невідомі величини, що називаються множниками Лагранжа.

Знайдемо частинні похідні і прирівняємо їх до нуля:

(7.9)

Друга група рівнянь системи (7.9) забезпечує виконання умов (7.7) початкової задачі нелінійного програмування.

Система (7.9), як правило, нелінійна.

Розв’язками її є і – стаціонарні точки. Оскільки, ці розв’язки отримані з необхідної умови екстремуму, то вони визначають максимум, мінімум задачі (7.6)-(7.7) або можуть бути точками перегину (сідловими точками).

Для діагностування стаціонарних точок і визначення типу екстремуму необхідно перевірити виконання достатніх умов екстремуму, тобто дослідити в околі стаціонарних точок диференціали другого порядку (якщо для функцій існують другі частинні похідні і вони неперервні).

Узагальнення достатньої умови існування локального екстремуму для функції n змінних приводить до такого правила: за функцією Лагранжа виду (7.8) будується матриця Гессе, що має блочну структуру розмірністю :

де О – матриця розмірністю , що складається з нульових елементів,

Р – матриця розмірністю , елементи якої визначаються так:

,

– транспонована матриця до Р розмірністю ,

Q – матриця розмірністю виду:

, де .

Розглянемо ознаки виду екстремуму розв’язку системи (7.9). Нехай стаціонарна точка має координати і .

1. Точка є точкою максимуму, якщо, починаючи з головного мінору порядку (m+1), наступні (n–m) головних мінорів матриці Н утворюють знакозмінний числовий ряд, знак першого члена якого визначається множником .

2. Точка є точкою мінімуму, якщо, починаючи з головного мінору порядку (m+1), знак наступних (n–m) головних мінорів матриці Н визначається множником .

Розглянемо задачу, розв’язок якої знайдемо методом множників Лагранжа.

Приклад 7.3. Акціонерне товариство з обмеженою відповідальністю виділило 1200 га ріллі під основні сільськогосподарські культури – озиму пшеницю і цукрові буряки. У табл.7.1 маємо техніко-економічні показники вирощування цих культур:

Таблиця 7.1

Необхідно знайти оптимальні площі посіву озимої пшениці та цукрових буряків.

Нехай: х₁ – площа ріллі під озимою пшеницею, сотні га;

х₂ – площа ріллі під цукровими буряками, сотні га.

Звернемо увагу на те, що собівартість тонни пшениці та цукрових буряків залежить від відповідної площі посіву.

Запишемо економіко-математичну модель цієї задачі. Критерієм оптимальності візьмемо максимізацію чистого доходу:

за умов:

Запишемо функцію Лагранжа:

Візьмемо частинні похідні і прирівняємо їх до нуля:

З цієї системи рівнянь визначаємо координати сідлових точок. З першого та другого рівняння знаходимо l₁ і, прирівнюючи вирази, маємо:

(7.10)

або, скоротивши на 100 обидві частини і розкривши дужки, отримаємо:

. (7.11)

Із останнього рівняння системи маємо: .

Підставимо вираз для у рівність (7.11). Отримаємо:

або

Отже, ;

(553 га);

(178 га).

Відповідно дістаємо:

га);

га).

Тобто отримали дві сідлові точки:

Перевіримо за допомогою достатньої умови існування екстремуму спочатку сідлову точку .

Матриця Гессе має такий вигляд:

За вищезазначеним правилом визначаємо головні мінори, починаючи з 2-го порядку ( ):

Отже, головні мінори утворюють знакозмінний ряд та, починаючи з головного мінору 2-го порядку, наступний мінор визначається знаком , тобто є точкою максимуму.

Обчислимо значення цільової функції в цій точці:

Аналогічні обчислення для точки показують, що вона не є екстремальною.

Отже, цільова функція набуде максимального значення, якщо озима пшениця вирощуватиметься на площі 647 га, а цукрові буряки – на площі 553 га.

Метод множників Лагранжа може застосовуватися також у разі наявності обмежень на знаки змінних і обмежень-нерівностей.

Розглянемо таку задачу в загальному вигляді:

причому всі функції, що входять у задачу, мають бути диференційовними хоча б один раз.

Очевидно, що введення в ліві частини нерівностей системи обмежень задачі додаткових невід’ємних змінних перетворює початкову задачу в таку, що містить лише обмеження-рівності, тобто яка за формою та методом розв’язування збігатиметься з задачею (7.6)-(7.7).