Система нормальних рівнянь. Дослідження та розв’язок задачі (2.4).

Для розв’язання задачі (2.4) обчислимо частинні похідні по b0, b1 функції S = S(b0, b1). Маємо

S / ¶b0 = - 2 yib0b1 xi),

S / ¶b1 = - 2 (yib0b1 xi).

Прирівнюючи знайдені похідні нулю і виконуючи належні спрощення (рекомендується виконати їх самостійно), приходимо до системи двох рівнянь, в якій, підкреслимо, невідомими є параметри b0, b1:

b0 n + b1 S xi = S yi,

b0 Sxi + b1 S xi2 = S xi yi, (2.5)

де для спрощення запису індекси підсумовування опущено. Ця система носить назву системи нормальних рівнянь або нормальної системи. В одному з наступних розділів буде доведено, що розв’язок нормальної системи і справді є розв’язком задачі (2.4).

Розглянемо спочатку випадок існування та єдиності розв’язку системи (2.5). Тобто ми поки що вважаємо визначник даної системи відмінним від 0. Позначимо шуканий розв’язок (b0, b1); відносно b1 маємо (переконайтесь у цьому):

, (2.6)

де підсумовування ведеться по i від 1 до n. Розв’язок нормальної системи відносно b0 має такий вигляд:

b0 = , (2.7)

де та – відповідні середні арифметичні значення:

= (y1+…+ yn)/n , = (x1+…+ xn)/n.

2.3.1. Зауваження. Оцінка b1 параметра b1 може бути записаною також іншим чином:

. (2.8)

Дійсно, це твердження випливає з наступних рівностей

S(xi )( yi ) = Sxi yi S yi S xi + n = Sxi yin =

= Sxi yi – (S xi)(S yi)/ n.

Зручно ввести позначення:

Sx y = S(xi )( yi ), Sx x = S(xi )2, Sy y = S( yi )2.

Тоді маємо легкий для запам’ятовування вираз оцінки b 1:

b1 = Sx y / Sx x . (2.9)

Вище була введена функція

= = b0 + b1x (2.10)

Величина = є оцінкою функції регресії g(x) з рівності (2.2). Іноді зручніше використовувати дещо інший вираз для :

= + b1(x ). (2.11)

Ця рівність одержується з (2.10) підстановкою замість b0 його виразу (2.7).

З рівності (2.11) одразу бачимо, що пряма лінія, яка зображує у декартовій площині залежність = , проходить через точку декартової площини з координатами ( , ).

Припустимо тепер, що визначник D системи (2.5) дорівнює 0. З’ясуємо, за яких умов це трапляється. Маємо

D = n S xi2 –(S xi)2.

Оскільки (S xi)2 = (S 1×xi)2, то за нерівністю Коші – Буняковського буде (S xi)2 S 12 × S xi2 = n S xi2, отже завжди

D ³ 0 (2.12)

Скористаємось відомою умовою наявності рівності в нерівності Коші – Буняковського. Бачимо, що коли ввести n-вимірні вектори 1= (1,…,1) і x = ( x1,…, xn), то рівність в (2.12) буде мати місце тоді і тільки тоді, коли вектори 1 і x будуть лінійно залежними. Це означає, що знайдуться такі сталі с1, с2, що одночасно не дорівнюють 0 і для яких виконується рівність

с1 ×1 + с2 × x = 0, (2.13)

де права частина – це нульовий вектор (0,…,0). При цьому випадок с2 = 0, очевидно, не може мати місця (бо інакше, оскільки тоді с1 0, буде 1 = 0). Тому з (2.13) випливає, що x = (с,…,с), де с – деяка стала. Це означає, що всі спостереження робляться в одній точці: x1 = … = xn = с. За вказаною умовою система (2.5) зводиться, фактично, до одного-єдиного рівняння

b0 n + b1 = S yi, (2.14)

яке має безліч дійсних розв’язків.

2.3.2. Висновок. З розглянутого вище бачимо, зокрема, що нормальна система рівнянь (2.5) завжди сумісна, незалежно від того, дорівнює її детермінант 0 чи не дорівнює. В останньому випадку маємо єдиний розв’язок, що дається рівностями (2.6) ((2.8)) і (2.7). Перший випадок може трапитись тільки тоді, коли всі спостереження проводяться лише при одному значенні x. У цьому випадку вказана система має безліч розв’язків, кожен з яких може бути знайдений з рівняння (2.14).

РОЗДІЛ 3