Приклад виконання завдання. Задача. Маємо вибірку даних, які характеризують роботу підприємства

Задача. Маємо вибірку даних, які характеризують роботу підприємства. Побудувати парну лінійну кореляційну модель залежності об’єму реалізації підприємства (Y), тис. грн. від витрат на впровадження інновацій в попередньому періоді (Х), тис грн. виду

Для аналізу моделі необхідно розрахувати: коефіцієнт детермінації; скоригований коефіцієнт детермінації, множинний коефіцієнт кореляції,парні коефіцієнти кореляції, частинні коефіцієнти кореляції, F-критерій Фішера; стандартні похибки оцінок параметрів моделі порівняти з величиною оцінок; перевірити значущість коефіцієнта детермінації, коефіцієнта кореляції та оцінок параметрів моделі; знайти інтервали надійності для оцінок параметрів моделі. Знайти прогнозне значення залежної змінної Yпр,яке відповідає очікуваному значенню незалежної змінної Xпр. Знайти інтервали надійності для оцінок параметрів моделі, інтервали довіри для прогнозного та середнього значення залежної змінної. Відобразити модель на графіку. Зробити економічний висновок.

Вихідні дані для розрахунку в табл. 2.1.

Таблиця 2.1

Спостереження Об’єм реалізації, тис. грн. Витрати на впровадження інновацій в попередньому періоді, тис. грн.
  Y Х
862,3 27,1
804,9 25,2
804,9 25,0
559,5 14,3
592,3 14,2
583,1 11,5
832,1 24,3
851,7 21,5
Середнє значення 736,35  

Для спрощення розрахунків використаємо статистичну функцію Microsoft Excel ЛИНЕЙН. Ця функція для визначення оцінок параметрівлінійної регресії застосовує метод найменших квадратів.

Результат застосування статистичної функції ЛИНЕЙН – це оцінка параметрів лінійної регресії та регресійна статистика:

 

20,45 319,44
3,033 64,203
0,883 48,935
45,47
108879,7 14367,5

a0 = 319,44; a1 = 20,45

Можна побудувати рівняння регресії:

Yрозр = 319,44 + 20,45 × Х.

Коефіцієнт регресії a1 = 20,45 говорить про те, що збільшення витрат на впровадження інновацій на 1 тис. грн. збільшить об’єм реалізації на 20,45 тис. грн.

Для визначення статистичних коефіцієнтів та подальших розрахунків знаходимо відхилення (табл. 2.2).

Таблиця 2.2

Yфакт Yрозр (Yфакт – Yрозр)2 (Yфакт – Yсер)2 (Yрозр – Yсер)2
862,3 873,62 128,05 18842,0 18841,98
804,9 834,76 891,76 9685,0 9685,00
804,9 830,67 664,22 8896,7 8896,74
559,5 611,86 2742,07 15496,6 15496,58
592,3 609,82 306,94 16009,9 16009,89
583,1 554,61 811,87 33030,7 33030,65
832,1 816,36 247,81 6401,3 6401,28
851,7 759,10 8574,78 517,6 517,56
    14367,5 123247,2 108879,7

Коефіцієнт детермінації

коефіцієнт кореляції

Іноді для спрощення розрахунків тісноту кореляційного зв’язку характеризують коефіцієнтом кореляції, який розраховується за формулою:

F-критерій Фішера

Тестування значимості змінної Х, або адекватності моделі проводиться за критерієм Фішера.

Fрозр = 8,58

F0,05табл визначаємо за допомогою статистичної функції Microsoft Excel FРАСПОБР(0,05;6;7) для рівня надійності a=0,05 і ступенів вільності відповідно f1 = (n–m–1) = 8–1–1=6 та f2 = (n–1)= 8–1=7:

F0,05табл = 3,87

Fрозр > F0,05табл , робимо висновок про адекватність побудованої моделі і з 5%-ним ризиком помилитися припускаємо присутність лінійного зв’язку.

Оцінка точності моделі

Визначаємо стандартні похибки оцінок параметрів моделі з урахуванням дисперсії залишків:

де –дисперсія залишків:

–елемент матриці похибок С (матриця, обернена до матриці коефіцієнтів системи нормальних рівнянь);

т1кількість параметрів моделі.

< 319,44
     
< 20,45

Стійкість оцінок параметрів визначається порівнянням стандартних похибок з абсолютними значеннями оцінок параметрів моделі.

Порівняємо стандартні похибки оцінки параметрів з величиною оцінки:

,

Визначається середньоквадратичне відхилення:

Відносна похибка: