Побудова регресійних моделей.

Математична лінійна регресійна модель y(x) має вигляд: y(x) = bo + b1·x,

де bo - вільний член, b1 - коефіцієнт впливу x на y. В завданні, що пропонується студенту, необхідно чисельно визначити значення bo та b1 за формулами:

 

 

Після закінчення розрахунків bо та b1 проводиться перевірка гіпотези про лінійність зв'язку між y та x за допомогою коефіцієнта лінійної кореляції R (як оцінити отриману модель на адекватність статистичним даним покажемо на прикладі двофакторної лінійної регресії):

 

Чим ближче значення /R/ до одиниці, тим вірогідніша лінійність y(x). При цьому знак R визначається знаком коефіцієнта b1 (якщо b1>0, то і R > 0 і навпаки). Вважається, що лінійна модель якнайкраще описує досліджуваний процес, якщо /R/ 0,7.

2. Математична модель, що є лінійною моделлю з двома змінними (факторами) y(x1;x2), має вигляд: y = bo + b1·x1 + b2·x2. Зробивши висновки, аналогічні для моделі y(x), можна отримати систему рівнянь відносно невідомих коефіцієнтів bo, b1, b2 у вигляді:

 

(x'1i)2 b1 + (x'1ix'2i)b2 = (x'1iy'i)

 

(x'2ix'1i)b1 + (x'2i)2 b2 = (x'2iy'i)

де:

x'1iy'i = (x1iyi) – N

(x'1i)2 = (x1i)2 – N( )2

x'2iy'i = (x2iyi) – N

x'1ix'2i = (x1ix2i) –N

(x'2i)2 = (x2i)2 – N ( )2

 

Після того, як величини, що входять в формули (10) - (14) розраховані, розв'язується система рівнянь (9) відносно bo, b1, b2 за допомогою правила Крамера.

Коефіцієнт b1 в моделі y = bo + b1x1 носить назву "повний коефіцієнт регресії", який відображає вплив x1 на y без урахування впливу x2 на y (цей вплив враховується певним чином в значенні b1).

Напроти, коефіцієнт b1 в моделі y = bo + b1·x1 + b2·x2 носить назву "частинний коефіцієнт регресії" (іноді - "чистий коефіцієнт регресії"), який відображає тільки вплив x1 на y, виключаючи повністю вплив x2 на y. Те ж саме стосується коефіцієнта b2. Тому потрібно пам'ятати, що врахування найбільшої (в розумних межах) кількості змінних поліпшує точність оцінки впливу кожної з розглянутих змінних.

2. Аналіз отриманих моделей.

Для оцінки моделей з багатьма змінними, а також з однією змінною, застосовуються наступні показники варіації:

1) Загальна дисперсія:

2) Факторна дисперсія, що відображує вплив тільки тих змінних, які розглядаються:

 

3) Залишкова дисперсія (дисперсія помилок моделі):

або в більш спрощеному вигляді

 

Відношення

називається коефіцієнтом детермінації (у випадку лінійної множинної регресії) або індексом детермінації (у випадку нелінійної множинної регресії). Фізично він характеризує частку впливу вибраних змінних хj в загальній варіації у.

 

 

де R – коефіцієнт множинної кореляції (або індекс кореляції для нелінійної регресії). Значення цього коефіцієнта, розрахованого за даною формулою, співпадає зі значенням R, розрахованим за формулою для лінійної парної регресії. З урахуванням того, що , маємо ще одну розрахункову формулу:

 

тобто коефіцієнт кореляції розраховується по дисперсії помилок моделі і по загальній дисперсії .

 

Рекомендована література.

1. Корн Г., Корн Т. Справ очник по математике. М.,Наука, 1973, - 832с.

2.Кофман А., Анри-Лабердер А. Методы и модели исследования операций. – М., Мир, 1977, - 432с.

3. Четверухін Б.М. Методические разработки по курсу “Основы научных исследо-

ваний». Раздел «Дисперсионный анализ». – К.: КАДИ, 1977. – 31 с.

4. Четверухін Б.М. Методические разработки по курсу “Основы научных исследова-

ний». Раздел «Регрессионный анализ». – К.: КАДИ, 1977. – 29 с.

5.Робоча програма та методичні вказівки з дисципліни „Основи теорії систем і системного аналізу. Методичні вказівки та завдання для самостійних робіт для студентів спеціальностей 7.100.403 "Організація перевезень та управління на транспорті" денної та заочної форм навчання / Укл. С.Д.Радкевич, О.Д.Гульчак, Савченко Л.В. - К: НТУ, 2006. - 28 с.