Перевірка значимості коефіцієнта детермінації, коефіцієнта кореляції та оцінок параметрів моделі множинної регресії.

Перевірка значимості коефіцієнта детермінації

Висувається нульова гіпотеза H0: R2=0,

або H0 : b1 = b2 = ... = bn = 0.

Альтернативна до неї є НА: (bj ≠ 0)

За отриманими в моделі значеннями коефіцієнта детермінації R2обчислюємо експериментальне значення F-статистики:

Визначимо табличне значення F-критерію Фішера:

Fтабл = 3,9715  
  =FРАСПОБР(0,05;5;7)  
       

Порівняємо з табличним значенням розподілу Фішера при ступенях вільності f1=n–m–1, f2=n–1 та рівні значущості a= 0,05:

Fексп > Fтабл

Нульова гіпотеза відхиляється.

Відхи­лення нуль-гіпотези свідчить про значимість коефіцієнта детермінації.

Перевірка значимості коефіцієнта кореляції

Коефіцієнт кореляції, як вибіркова характеристика, перевіряється на значущість за допомогою t-критерію Стьюдента при k=n–m1 ступенях вільності тарівні значимості a=0,05.

tтабл =2,57058  
=СТЬЮДРАСПОБР(0,05;5)  
     

Величина експериментального значення t-статистики перевищує табличне:

|tексп| > tтабл

9,049 > 2,57058

Тобто можна зробити висновок, що коефіцієнт кореляції достовірний (зна­чущий), а зв’язок між залежною змінною та всіма незалежними факторами суттєвий.

Перевірка значимості оцінок параметрів моделі

множинної регресії

Для оцінки значимості кожного параметра моделі перевіряємо їх за допомогою t-критерію Стьюдента:

де сjj – діагональний елемент матриці (Х' Х)-1 ;

– стандартна похибка оцінки параметра моделі.

Статистичну значущість кожного параметра моделі можна пере­вірити за допомогою t-критерію. При цьому нульова гіпотеза має вигляд:

Н0 : bj = 0,

альтернативна

НА : bj ≠ 0.

Будемо наслідувати відповідний алгоритм. Задамо рівень значущості a=0,05, визначимо табличне значення t-критерію Стьюдента (tтабл =2,5058) і розрахуємо значення t-критерію для кожного параметра.

Перевірка гіпотези Н0: b0 =0
tспос = 9,4678
Перевірка гіпотези Н0: b1 =0
tспос = 4,1439
Перевірка гіпотези Н0: b2 =0
tспос = 2,4435

 

Якщо | tспос | < tтабл , то приймаємо гіпотезу Н0.
Якщо | tспос | > tтабл , то відхиляємо гіпотезу Н0.

Перевіряємо виконання нерівності | tспос | > tтабл робимо висновки про стійкість впливу відповідного параметру на залежну змінну Y:

для b0: |9,4678| > 2,57058 → Н0 (b0=0) відхиляємо; змінна X0 (вільний член) є значущою;
для b1: |4,1439| > 2,57058 → Н0 (b1=0) відхиляємо; змінна Х1 (вартість основних засобів) є значущою;
для b2: |2,4435| < 2,57058 → Н0, (β2=0) приймаємо; змінна Х2, (чисельність працюючих) є незначущою.

Знайдемо інтервали надійностідля кожного окремого параметра за формулою:

= 23,89 – 2,57 * 2,523 < b0 < 23,89 + 2,57 * 2,523
= 0,97 – 2,57 * 0,235 < b1 < 0,97 + 2,57 * 0,235
= 0,38 – 2,57 * 0,155 < b2 < 0,38 + 2,57 * 0,155

P (17,4 < b0 < 30,37) = 0,95

P (0,37 < b1 < 1,579) = 0,95

P (–0,02 < b2 < 0,779) = 0,95

3. Обчислимо прогнозні значення Yпр:

У рівняння Yрозр = 23,89 +0,97X1 +0,38X2 підставимо прогнозні значення фактору Хпр = (1, 15, 35), що лежить за межами базового періоду (точковий прогноз):

Yпр = 23,89 + 0,97 × 15 + 0,38 × 35 = 51,79

Тоді M(Yпр) можна розглядати як оцінку прогнозного значення математичного сподівання та індивідуального значення обсягу виробленої продукції при відомих параметрах вартості основних засобів (Х1) та чисельності працюючих (Х2).

Визначимо дисперсію прогнозу з урахуванням матриці похибок, яка для прикладу має вигляд:

(Х' × Х)–1 = 3,78969 0,12007 –0,20478
0,12007 0,03291 –0,01593
–0,20478 –0,01593 0,01438

Елементи дисперсійно-коваріаційної матриці, які розраховуються за формулами і мають значення:

 

6,36573 0,20169 –0,343982
var (В) = 0,20169 0,05529 –0,02676
–0,343982 –0,02676 0,02415

 

Хпр =

 

Х'пр =

 

Х'пр * var (В) = –2,6483 0,0944 0,0999

Знайдемо дисперсію прогнозу:

Середньоквадратична похибка прогнозу математичного сподівання M(Ynp):

Довірчий інтервал для математичного сподівання M(Ynp) прогнозного значення розрахуємо за формулою:

де t – табличне значення t-критерію Стьюдента з ступенем вільності k=n–m1 тарівнем значимості a=0,05.

51,79 – 2,57058 × 1,5046 ≤ M(Yпр) ≤ 51,79 + 2,57058 × 1,5046

47,9264 ≤ M(Yпр) ≤ 55,6617

Знайдемо межі інтервального прогнозу індивідуального значення Yпр.

Для цього обчислимо дисперсію та стандартну похибку прогнозу індивідуального значення Yпр:

51,79 – 2,57058 × 1,9858 ≤ Yпр  ≤ 51,79 + 2,57058 × 1,9858;

46,6893 ≤ Yпр ≤ 56,8988

4. Графічне зображення моделі ґрунтується на побудові ліній регресії, в прямокутних координатах Y – x1таY – x2(рис. 6.1).

При цьому масштаб треба обрати таким, щоб мінімальні та максимальні значення x1 та x2співпадали між собою.

Лінія регресії Y=f(X1)при X2=const відображає вплив першого фактора х1на продуктивність праці при постійному значенні другого х2(середнє значення х2).

Лінія регресії Y=f(X2)при X1=const відображає вплив другого фактора х2на продуктивність праці при постійному значенні х1 (середнє значення х1).

  X1 X2 Y=f(X1) при X2=const Y=f(X2) при X1=const Середні значення
min 4,2 30,64 35,64 X1 X2
max 14,2 40,38 41,34 7,0

Рис. 6.1. Графічне зображення моделі

Висновки.

Згідно з обчисленими характеристиками можна сказати, що обсяг виробленої продукції на 94,2% залежить від вартості основних засобів та чисельності працюючих, а на 5,8% від неврахованих в задачі чинників. Кореляційний зв’язок між залежною змінною та незалежними факторами (вартістю основних засобів та чисельністю працюючих) досить високий (множинний коефіцієнт кореляції дорівнює 0,971).

Перевірено значимістьзв’язку між змінними моделі
Fрозр > F0,05табл (17,38>3,97) для рівня надійності a=0,95. З 5%-ним ризиком помилитися припускаємо присутність лінійного зв’язку.

Стандартні помилки параметрів не перевищують абсолютні значення цих параметрів:

Це означає, що оцінки параметрів є незміщеними відносно їх істотних значень.

Висновки стосовно стійкості оцінок параметрів можна зробити, порівнянням стандартних помилок з абсолютними значеннями оцінок параметрів моделі:

,

Велике значення похибок зумовлюється малою кількістю спостережень, а також неточністю специфікації (не всі основні чинники, що впливають на Y, внесено до моделі).

Середньоквадратичне відхилення

свідчить про те, що фактичні значення Y відхиляються від розрахункових його значень на ±0,77 тис. т.

Відносна похибка – це характеризує модель з хорошої сторони.

Проведена перевірка значущості коефіцієнта детермінації за F-критерієм Фішера. Fтабл < Fексп (2,5705<40,95). Коефіцієнт детермінації значущій.

Перевірена значимість коефіцієнта кореляції за t-критерієм Стьюдента. tтабл < |tексп| (2,57 < 9,049). Коефіцієнт кореляції достовірний (зна­чущий) і зв’язок між залежною змінною та всіма незалежними фак­торами суттєвий.

Дана оцінка значимості кожного параметра моделі за допомогою
t-критерію Стьюдента: параметри моделі X0 та Х1 є значущими, змінна Х2, (чисельність працюючих) є незначущою.

Знайдені інтервали надійності для кожного параметра:

P (17,4 < b0 < 30,37) = 0,95

P (0,37 < b1 < 1,579) = 0,95

P (–0,02 < b2 < 0,779) = 0,95

Були обчислені прогнозні значення Yпр для Хпр = (1, 15, 35):

Yпр = 23,89 + 0,97 × 15 + 0,38 × 35 = 51,79 тис. т.

Так, при ймовірності р=0,95 (a=0,05), прогноз математичного сподівання M(Yпр) потрапляє в інтервал [47,9274; 55,6617], а прогноз індивідуального значення Yпр – в інтервал [46,6893; 56,8988].

В економічній інтерпретації це означає, що при прогнозних значеннях вартості основних засобів 15 тис. грн. та чисельності працюючих 35 чол. обсяг виробленої продукції потрапляє в інтервал:

47,9274 ≤ M(Yпр) ≤ 55,6617

Водночас окремі (інтервальні) значення обсягу виробленої продукції містяться в інтервалі:

46,6893 ≤ Yпр ≤ 56,8988

Отже, модель є достовірною та відображає тісний зв’язок між залежною та незалежними показниками і може бути використана для практичного економічного висновку.

На даному підприємстві збільшення виробництва продукції обумовлюється збільшенням вартості основних засобів та збільшенням чисельності працюючих на підприємстві. Так, на кожні 10 тис. грн. збільшення вартості основних засобів, можливе підвищення випуску продукції на 9,7 тис. т за умови незмінної дії інших чинників.

При збільшенні чисельності працюючих на 10 чол. можливе підвищення випуску продукції на 3,8 тис. т, за умови незмінної дії інших чинників.

Лабораторна робота 7
«Виробнича функція Кобба-Дугласа»

Мета роботи:сформувати у студентів практичні навички використання методу найменших квадратів для знаходження параметрів множинних нелінійних залежностей та проведення економічного аналізу отриманихрезультатів.

Завдання роботи: Маємо вибірку даних, яка характеризує роботу підприємства за останні 10 місяців. У цій вибірці кожному значенню Y – вартість випущеної продукції, тис. грн. відповідають показники Х1 – вартість основних виробничих фондів, тис. грн. і Х2 – витрати праці, люд.-год. Потрібно побудувати множинну кореляційну модель у вигляді функції Кобба-Дугласа; оцінити точність і достовірність моделі; визначити тісноту зв’язку між факторами; побудувати ізокванти взаємозамінності факторів моделі і зробити економічний аналіз отриманих результатів за всіма відомими характеристиками виробничих функцій.

Завдання визначається за варіантом з додатку 6.

Порядок виконання роботи:

Задача.Потрібно побудувати виробничу функцію Кобба-Дугласа за статистичними спостереженнями:

Y – вартість випущеної продукції, тис. грн.;

Х1 – вартість основних виробничих фондів, тис. грн.;

Х2 – витрати праці, люд-год.

Дані для розрахунків в табл. 7.1.

Виробнича функція Кобба-Дугласа має вигляд:

Y=A0·X1A1·X2A2

Проведемо логарифмування для отримання лінійної моделі:

Приймемо такі позначення:

Y*=lnY; А0*=lnА0; Х1*=lnХ1; Х2*=lnХ2.

В результаті підстановки отримаємо:

Y* = А0*+A1·Х1*+ A2 ·Х2*.

Таблиця 7.1

Вихідні дані для розрахунків

Y Х1 Х2 lnY lnХ1 lnХ2
2,3026 3,332 1,386
2,7726 3,367 2,079
2,8332 3,401 2,303
3,0445 3,434 2,485
3,1781 3,466 2,773
3,2149 3,526 2,89
3,2958 3,584 2,944
3,5553 3,611 2,944
3,4965 3,664 2,944
3,6109 3,691 3,002
     

За допомогою статистичної функції Microsoft Excel ЛИНЕЙН отримаємо регресійну модель: .

А1>1, тобто збільшення вартості основних виробничих фондів на 1 тис. грн. збільшує вартість випущеної продукції, а 0<А2<1, тобто збільшення витрат праці зменшує вартість випущеної продукції.

Коефіцієнт детермінації R2=0,971 (коефіцієнт кореляції R=0,987) – зв’язок між залежною та незалежними змінними в моделі досить високий. Модель можна використовувати для аналізу виробничого процесу.

Проведемо аналіз отриманих результатів:

1) Середня продуктивність при фіксованих обсягах становить
(у формули підставимо середні значення Х1 і Х2):

С1 – середня фондовіддача; С2 – середня продуктивність праці.

2) Гранична продуктивність при фіксованих обсягах інших ресурсів або середня кількість продукції на одиницю Х1 або Х2:

Г1 показує скільки додаткових одиниць продукції дає 1 тис. грн. витрачених на основні виробничі фонди при незмінних витратах праці; Г2 показує скільки додаткових одиниць продукції дає 1 люд-год. при фіксованих основних виробничих фондах.

3) Відносна зміна результатів виробництва на одиницю:

Е1 = А1 = 1,387;

Е2 = А2 = 0,458.

Е1 показує, що зміна основних виробничих фондів на 1% при незмінних витратах праці, викликає зміну обсягу продукції на 1,387%. Е2 показує, що зміна витрат праці на 1 % при незмінних витратах основних фондів викликає зміну обсягу продукції на 0,458%.

Витрати основних фондів більше впливають на зміни вартості випущеної продукції ніж витрати праці.

4) Потреба у будь-якому ресурсі за умов що відомі величини випуску і обсягів інших ресурсів:

Х1 показує скільки потрібно основних виробничих фондів для того, щоб отримати відомий випуск продукції – Y, якщо відома кількість витрат праці.

Х2 показує скільки потрібно витрат праці для того, щоб отримати відомий випуск продукції – Y, якщо відома кількість витрат основних фондів.

5) Співвідношення заміни та взаємодії ресурсів, а саме фондоозброєність – це взаємодія трудових ресурсів і основних фондів:

Х12 – середня фондоозброєність, це взаємодія основних фондів і витрат праці.

6) Гранична норма заміни ресурсів, а саме гранична норма заміни витрат праці виробничими фондами (знак мінус означає, що при сталому обсязі виробництва збільшення одного ресурсу відповідає зменшенню другого і навпаки:

При сталому обсязі виробництва збільшення основних виробничих фондів відповідає зменшенню трудових ресурсів, чим вище Х12, тобто фондоозброєність, тим вища і норма заміни ручної праці фондами.

7) Ефект одночасного пропорційного збільшення обох видів ресурсів обчислюється сумарним коефіцієнтом еластичності:

А=1,387+0,458=1,845>1, тобто збільшення ресурсів у k разів призведе до збільшення випуску продукції більше ніж у k разів, а саме у k1,845 разів.

8) Темпи приросту показника виражаються лінійно через темпи приросту факторів:

DY = АІІ + А22 = 1,387DХ1 + 0,458DХ2.

9) Для наочного уявлення взаємозамінюваності факторів побудуємо ізокванту (рис. 7.1), для цього спочатку обчислимо значення параметра b.

Графік будуємо за точками, обчисленими в табл.7.2.

Таблиця 7.2

Точки для побудови ізокванти взаємодії ресурсів обладнання і праці

Y
Х1 69,88 55,58 51,63 48,61 44,20 42,52 41,76 43,33 41,76 41,06
X2

 

Рис. 7.1. Ізокванта

Лабораторна робота 8
«Дослідження наявності мультиколінеарності між змінними
(алгоритм Фаррара-Глобера)»

Мета роботи:сформувати у студентів практичні навички оцінки якості параметрів регресійної моделі в залежності від особливостей статистичних даних з використанням алгоритму Фаррара-Глобера.

Завдання роботи: На основі даних про чинники, що впливають на прибуток (додаток 7), дослідити їх на наявність мультиколінеарності за допомогою алгоритму Фаррара-Глобера, що містить три статистичні критерії: c2; F-критерій; t-критерій.