Регресійні моделі з однією змінною

Ці моделі встановлюють лінійну функціональну залежність відгуку у лише від однієї незалежної змінної (одного аргументу) х у вигляді:

(3.1)

де а0 - початкове значення у при х = 0; а1 - Dу/Dх- коефіцієнт впливу варіацій х на варіації у, який частіше називається коефіцієнтом парної лінійної регресії.

Відмітимо, що розрахункові значення у за тих же самих значень хі, де хі - експериментально отримані значення незалежної змінної, тобто функція , частіше не співпадають з експериментально отриманими значеннями уі(xі) при тих же значеннях хі. Але можна обрати такі значення а0 та а1, щоб задовольнити умови МНК, що були викладені в попередньому розділі:

(3.2)

Для забезпечення цієї умови, очевидно, необхідно забезпечити виконання наступних двох умов:

та (3.3)

Виконаємо ці умови:

що дає наступні дві умови для визначення а0 та а1:

або у розгорнутій формі:

Вирішення цієї системи рівнянь відносно а0 та а1 дає наступні вирази для розрахунку оптимальних значень коефіцієнтів моделі:

(3.4)

Таким чином, знаючи експериментально отриману множину величин хі (iÎN) та уі (iÎN), можна розрахувати за допомогою (3.4) чисельні значення параметрів лінійної кореляційної моделі о0та а1, що забезпечать мінімальну дисперсію похибки моделі , викликану неврахованими факторами, що також збурюють систему.

Потрібно не забувати, що отримана таким чином модель (3.1) забезпечує мінімум лише в області значень хminххmax. Поза цим інтервалом (тобто при екстраполяції моделі поза даним інтервалом), досить можливо, що мінімум не буде забезпечений в області значень хi, що екстраполюється.

Якщо помножити в першому рівнянні системи (3.4) значення а1 на (-1) і розділити в цьому виразі чисельник і знаменник на N, то можна отримати іншу форму запису системи рівнянь (3.4), більш зручну для практичних розрахунків:

 

(3.5)

де - середні значення по уі (і= ) та хі (і= ).

 

При використанні формули (3.5) експериментальні дані хі, та уі можуть бути зведені до таблиці 3.1 по якій розраховуються проміжні величини, що входять до формули (3.5)

Таблиця 3.1

Данні для розрахунку коефіцієнтів лінійної регресії

  уі хі хі2 хіуі    
  У1 У2 . . . уN   х1 х2 … хN   x12 х22 … хN2 x1у1 х2у2 … хNуN    
Всього Syi Sxi Sxi2 Sxiyi    
Середнє        
                             

 

Після заповнення першої та другої колонок експериментально отриманими даними хі та уі проводять розрахунки значень двох наступних колонок. Потім сумують отримані значення по кожній колонці в рядку «Всього», після чого розраховують середні значення шляхом ділення відповідних сум на число експериментальних значень. Отримані дані використовуємо в (3.5) для розрахунку значень а0 та а1.

Після розрахунку значень а0 та а1 визначають значення з використанням формули (3.1) для значень хі таблиці 3.1. Отримані значення заносяться в таблицю 3.1 (5-й стовпчик). Потім розраховуються значення квадратів відхилень від уі для кожного рядка таблиці 3.1, отримані значення додаються в рядок "Всього". Після ділення отриманої суми на N на перетині 6-го стовпчика і рядка "Всього" отримаємо значення мінімально можливої дисперсії похибки моделі лінійної регресії, що найбільш точно описує взаємозв'язок експериментальних даних уі та хі (і = ).

Ступінь впливу незалежного фактору х, що є застосованим в моделі, на зміну у оцінюється при цьому коефіцієнтом детермінації за формулою (2.18), де:

(3. 6)

є загальною дисперсією фактору у. Значення ж залишкової дисперсій Dе визначається як це було показано в таблиці 3.1.

Величина коефіцієнту кореляції R при цьому може бути визначено за допомогою (2.19). Відмітимо, що для лінійної регресії значення R характеризує, поряд зі ступенем зв'язку у та х, також близькість залежності у(х) до лінійної форми (3.1). Вважається, що при |R|0,7 лінійна форма є досить адекватною для оцінки форми зв'язку.

Разом з коефіцієнтом кореляції R, який характеризує близькість до лінійної залежності, у лінійних моделях, як і в загальному випадку, застосовується також коефіцієнт детермінації kD = R2, який показує, яку частку до варіацій змінної у вносить незалежний аргумент моделі х.

Наприклад, при R =0,8; kD = 0,64, що означає, що 64% змінності у викликано впливом х та інші 36% викликані іншими незалежними факторами, не врахованими в моделі. і

Відмітимо також можливість розрахунку коефіцієнту кореляції R безпосередньо по отриманим експериментальним даним уі та хі (i = ). Це буває необхідним, якщо не ставиться задача визначення саме значень коефіцієнтів моделі а0 та а1, а лише перевіряється гіпотеза про лінійності зв'язку у та х. В цьому випадку величина R розраховується безпосередньо по експериментальним даним уі та хі за допомогою формули:

(3. 7)

 

Серед чисельних комп'ютерних програм ЕОМ, призначених для вивчення парної лінійної регресії, можна рекомендувати програму, що працює у середовищі "MATHCAD-2000, і яку наведено нижче.