E.3. Значення статистик Дарбіна-Уотсона при 5%-номурівні значущості .

 

Множинна регресія

За підприємствами регіону вивчається залежність вироблення продукції на одного працівника (тис. грн.) від введення в дію нових основних фондів ( від вартості фондів на кінець року) та від питомої ваги працівників високої кваліфікації у загальній чисельності працівників ( ).

Номер підприємства Номер підприємства
7,0 3,9 10,0 9,0 6,0 21,0
7,0 3,9 14,0 11,0 6,4 22,0
7,0 3,7 15,0 9,0 6,8 22,0
7,0 4,0 16,0 11,0 7,2 25,0
7,0 3,8 17,0 12,0 8,0 28,0
7,0 4,8 19,0 12,0 8,2 29,0
8,0 5,4 19,0 12,0 8,1 30,0
8,0 4,4 20,0 12,0 8,5 31,0
8,0 5,3 20,0 14,0 9,6 32,0
10,0 6,8 20,0 14,0 9,0 36,0

Необхідно:

1.Побудувати лінійну модель множинної регресії. Записати стандартизоване рівняння множинної регресії. На основі стандартизованих коефіцієнтів регресії та середніх коефіцієнтів еластичності ранжувати фактори за ступенем їх впливу на результат.

2.Знайти коефіцієнти парної, частинної та множинної кореляції. Проаналізувати їх.

3.Знайти скорегований коефіцієнт множинної детермінації. Порівняти його з не скорегованим (загальним) коефіцієнтом детермінації.

4.За допомогою -критерію Фішера оцінити статистичну надійність рівняння регресії та коефіцієнту детермінації .

5.За допомогою частинних -критеріїв Фішера оцінити доцільність включення до рівняння множинної регресії фактора після та фактора після .

6.Скласти рівняння парної лінійної регресії, залишивши лише один значущий фактор.

Розв’язок

Результати проміжних розрахунків занесемо до таблиці:

7,0 3,9 10,0 27,3 70,0 39,0 15,21 100,0 49,0
7,0 3,9 14,0 27,3 98,0 54,6 15,21 196,0 49,0
7,0 3,7 15,0 25,9 105,0 55,5 13,69 225,0 49,0
7,0 4,0 16,0 28,0 112,0 64,0 16,0 256,0 49,0
7,0 3,8 17,0 26,6 119,0 64,6 14,44 289,0 49,0
7,0 4,8 19,0 33,6 133,0 91,2 23,04 361,0 49,0
8,0 5,4 19,0 43,2 152,0 102,6 29,16 361,0 64,0
8,0 4,4 20,0 35,2 160,0 88,0 19,36 400,0 64,0
8,0 5,3 20,0 42,4 160,0 106,0 28,09 400,0 64,0
10,0 6,8 20,0 68,0 200,0 136,0 46,24 400,0 100,0
9,0 6,0 21,0 54,0 189,0 126,0 36,0 441,0 81,0
11,0 6,4 22,0 70,4 242,0 140,8 40,96 484,0 121,0
9,0 6,8 22,0 61,2 198,0 149,6 46,24 484,0 81,0
11,0 7,2 25,0 79,2 275,0 180,0 51,84 625,0 121,0
12,0 8,0 28,0 96,0 336,0 224,0 64,0 784,0 144,0
12,0 8,2 29,0 98,4 348,0 237,8 67,24 841,0 144,0
12,0 8,1 30,0 97,2 360,0 243,0 65,61 900,0 144,0
12,0 8,5 31,0 102,0 372,0 263,5 72,25 961,0 144,0
14,0 9,6 32,0 134,4 448,0 307,2 92,16 1024,0 196,0
14,0 9,0 36,0 126,0 504,0 324,0 81,0 1296,0 196,0
Сума 123,8 1276,3 2997,4 837,74 10828,0 1958,0
Ср. знач. 9,6 6,19 22,3 63,815 229,05 149,87 41,887 541,4 97,9

Знайдемо середні квадратичні відхилення факторів:

;

;

.

1.Розрахунок параметрів лінійного рівняння множинної регресії.

Для знаходження параметрів лінійного рівняння множинної регресії:

Необхідно розв’язати наступну систему лінійних рівнянь відносно невідомих параметрів , , :

або скористатися готовими формулами:

; ;

.

Розрахуємо спочатку парні коефіцієнти кореляції:

;

;

.

знайдемо

;

;

.

Таким чином, отримали наступне рівняння множинної регресії:

.

Коефіцієнти и стандартизованого рівняння регресії знаходяться за формулами:

;

.

Тобто, рівняння матиме вигляд:

.

Так як стандартизовані коефіцієнти регресії можна порівнювати між собою, то можна зробити висновок про те, що введення в дію нових основних фондів оказує більший вплив на вироблення продукції, ніж питома вага працівників високої кваліфікації.

Порівнювати вплив факторів на результат можна також за допомогою середніх коефіцієнтів еластичності:

.

Розрахуємо:

; .

З розрахунків можна зробити висновок про те, що збільшення тільки основних фондів (від свого середнього значення) або тільки питомої ваги працівників високої кваліфікації на 1% збільшує в середньому виробітку продукції на 0,61% або 0,20% відповідно. Таким чином, підтверджується більший вплив на результат фактора , ніж фактора .

2.Коефіцієнти парної кореляції ми вже знайшли:

; ; .

Вони свідчать про досить сильний зв'язок кожного фактору з результатом, а також про високу міжфакторну залежність (фактори и явно колінеарні, так як ). При такій сильній міжфакторній залежності рекомендується один з факторів вилучити з розгляду.

Частинні коефіцієнти кореляції характеризують тісноту звязку між результатом і відповідним фактором при елімінуванні (усунення впливу) інших факторів, включених до рівняння регресії.

При двох факторах частинні коефіцієнти кореляції розраховуються наступним чином:

;

.

Якщо порівняти коефіцієнти парної та частинної кореляції, то можна побачити, що з-за високої міжфакторної залежності коефіцієнти парної кореляції дають завишенні оцінки тісноти зв’язку. Саме по цій причині, рекомендується, при наявності сильної колінеарності (взаємозв’язку) факторів, виключати з дослідження той фактор, у якого тіснота парної залежності менше, ніж тіснота міжфакторного зв’язку.

Коефіцієнт множинної кореляції визначимо через матрицю парних коефіцієнтів кореляції:

, де – визначник матриці парних коефіцієнтів кореляції, а – визначник матриці міжфакторної кореляції.

;

.

Коефіцієнт множинної кореляції: .

Аналогічний результат отримаємо при використанні інших формул:

;

;

.

Коефіцієнт множинної кореляції показує на достатньо сильний зв'язок усього набору факторів з результатом.

3.Нескорегований коефіцієнт множинної детермінації оцінює долю варіації результату за рахунок представлених у рівнянні факторів у загальній варіації результату. У нашому прикладі ця доля складає та вказує на достатньо високий ступень обумовленості варіації результату варіацією факторів, іншими словами – на достатньо тісний зв'язок факторів з результатом.

Скорегований коефіцієнт множинної детермінації:

визначає тісноту зв’язку з урахуванням ступеню свободи загальної та залишкової дисперсій. Він дає таку оцінку тісноти зв’язку, яка на залежить від кількості факторів і тому може порівнюватися по різним моделям з різним числом факторів. Обидва коефіцієнти вказують на достатньо високу (більш ) детермінованість результату в моделі факторами и .

4.Оцінку надійності рівняння регресії в цілому та показника тісноти зв’язку визначає - критерій Фішера:

В нашому випадку фактичне значення - критерію Фішера:

.

Таким чином (при ), тобто ймовірність випадково отримати таке значення - критерію не перевищує допустимий рівень значущості . Отже, отримане значення не випадкове, воно сформувалося під впливом істотних факторів, тобто підтверджується статистична значимість усього рівняння та показнику тісноти зв’язку .

5.За допомогою частинних - критеріїв Фішера оцінимо доцільність включення до рівняння множинної регресії фактора після и фактора після за допомогою формул:

;

.

Знайдемо и : ;

.

Маємо:

;

.

Таким чином . Отже, включення в модель фактора після того, як в модель включений фактор статистично недоцільно: приріст факторної дисперсії за рахунок додаткового признака виявляється незначним, несуттєвим; фактор включать в рівняння після фактора не слід.

Якщо поміняти початковий порядок включення факторів в модель та розглянути варіант включення після , то результат розрахунку частинного -критерія для буде іншим. , тобто ймовірність його випадкового формування менше, ніж прийнятий стандарт . Отже, значення частинного -критерія для додаткового включеного фактора не випадкове, являється статистично значимим, надійним, достовірним: приріст факторної дисперсії за рахунок додаткового фактора являється істотним. Фактор повинен бути присутнім в рівнянні, в тому числі в варіанті, коли він додатково включається після фактора .

6.Загальний висновок полягає в тому, що множинна модель з факторами и с містить неінформативний фактор . Якщо виключити фактор , то можна обмежитися рівнянням парної регресії:

, при .

Множинна регресія

За підприємствами регіону вивчається залежність вироблення продукції на одного працівника (тис. грн.) від введення в дію нових основних фондів ( від вартості фондів на кінець року) та від питомої ваги працівників високої кваліфікації у загальній чисельності працівників ( ).

Номер підприємства Номер підприємства
7,0 3,9 10,0 9,0 6,0 21,0
7,0 3,9 14,0 11,0 6,4 22,0
7,0 3,7 15,0 9,0 6,8 22,0
7,0 4,0 16,0 11,0 7,2 25,0
7,0 3,8 17,0 12,0 8,0 28,0
7,0 4,8 19,0 12,0 8,2 29,0
8,0 5,4 19,0 12,0 8,1 30,0
8,0 4,4 20,0 12,0 8,5 31,0
8,0 5,3 20,0 14,0 9,6 32,0
10,0 6,8 20,0 14,0 9,0 36,0

Необхідно:

7.Побудувати лінійну модель множинної регресії. Записати стандартизоване рівняння множинної регресії. На основі стандартизованих коефіцієнтів регресії та середніх коефіцієнтів еластичності ранжувати фактори за ступенем їх впливу на результат.

8.Знайти коефіцієнти парної, частинної та множинної кореляції. Проаналізувати їх.

9.Знайти скорегований коефіцієнт множинної детермінації. Порівняти його з не скорегованим (загальним) коефіцієнтом детермінації.

10.За допомогою -критерію Фішера оцінити статистичну надійність рівняння регресії та коефіцієнту детермінації .

11.За допомогою частинних -критеріїв Фішера оцінити доцільність включення до рівняння множинної регресії фактора після та фактора після .

12.Скласти рівняння парної лінійної регресії, залишивши лише один значущий фактор.

Розв’язок

Результати проміжних розрахунків занесемо до таблиці:

7,0 3,9 10,0 27,3 70,0 39,0 15,21 100,0 49,0
7,0 3,9 14,0 27,3 98,0 54,6 15,21 196,0 49,0
7,0 3,7 15,0 25,9 105,0 55,5 13,69 225,0 49,0
7,0 4,0 16,0 28,0 112,0 64,0 16,0 256,0 49,0
7,0 3,8 17,0 26,6 119,0 64,6 14,44 289,0 49,0
7,0 4,8 19,0 33,6 133,0 91,2 23,04 361,0 49,0
8,0 5,4 19,0 43,2 152,0 102,6 29,16 361,0 64,0
8,0 4,4 20,0 35,2 160,0 88,0 19,36 400,0 64,0
8,0 5,3 20,0 42,4 160,0 106,0 28,09 400,0 64,0
10,0 6,8 20,0 68,0 200,0 136,0 46,24 400,0 100,0
9,0 6,0 21,0 54,0 189,0 126,0 36,0 441,0 81,0
11,0 6,4 22,0 70,4 242,0 140,8 40,96 484,0 121,0
9,0 6,8 22,0 61,2 198,0 149,6 46,24 484,0 81,0
11,0 7,2 25,0 79,2 275,0 180,0 51,84 625,0 121,0
12,0 8,0 28,0 96,0 336,0 224,0 64,0 784,0 144,0
12,0 8,2 29,0 98,4 348,0 237,8 67,24 841,0 144,0
12,0 8,1 30,0 97,2 360,0 243,0 65,61 900,0 144,0
12,0 8,5 31,0 102,0 372,0 263,5 72,25 961,0 144,0
14,0 9,6 32,0 134,4 448,0 307,2 92,16 1024,0 196,0
14,0 9,0 36,0 126,0 504,0 324,0 81,0 1296,0 196,0
Сума 123,8 1276,3 2997,4 837,74 10828,0 1958,0
Ср. знач. 9,6 6,19 22,3 63,815 229,05 149,87 41,887 541,4 97,9

Знайдемо середні квадратичні відхилення факторів:

;

;

.

2.Розрахунок параметрів лінійного рівняння множинної регресії.

Для знаходження параметрів лінійного рівняння множинної регресії:

Необхідно розв’язати наступну систему лінійних рівнянь відносно невідомих параметрів , , :

або скористатися готовими формулами:

; ;

.

Розрахуємо спочатку парні коефіцієнти кореляції:

;

;

.

знайдемо

;

;

.

Таким чином, отримали наступне рівняння множинної регресії:

.

Коефіцієнти и стандартизованого рівняння регресії знаходяться за формулами:

;

.

Тобто, рівняння матиме вигляд:

.

Так як стандартизовані коефіцієнти регресії можна порівнювати між собою, то можна зробити висновок про те, що введення в дію нових основних фондів оказує більший вплив на вироблення продукції, ніж питома вага працівників високої кваліфікації.

Порівнювати вплив факторів на результат можна також за допомогою середніх коефіцієнтів еластичності:

.

Розрахуємо:

; .

З розрахунків можна зробити висновок про те, що збільшення тільки основних фондів (від свого середнього значення) або тільки питомої ваги працівників високої кваліфікації на 1% збільшує в середньому виробітку продукції на 0,61% або 0,20% відповідно. Таким чином, підтверджується більший вплив на результат фактора , ніж фактора .

7.Коефіцієнти парної кореляції ми вже знайшли:

; ; .

Вони свідчать про досить сильний зв'язок кожного фактору з результатом, а також про високу міжфакторну залежність (фактори и явно колінеарні, так як ). При такій сильній міжфакторній залежності рекомендується один з факторів вилучити з розгляду.

Частинні коефіцієнти кореляції характеризують тісноту звязку між результатом і відповідним фактором при елімінуванні (усунення впливу) інших факторів, включених до рівняння регресії.

При двох факторах частинні коефіцієнти кореляції розраховуються наступним чином:

;

.

Якщо порівняти коефіцієнти парної та частинної кореляції, то можна побачити, що з-за високої міжфакторної залежності коефіцієнти парної кореляції дають завишенні оцінки тісноти зв’язку. Саме по цій причині, рекомендується, при наявності сильної колінеарності (взаємозв’язку) факторів, виключати з дослідження той фактор, у якого тіснота парної залежності менше, ніж тіснота міжфакторного зв’язку.

Коефіцієнт множинної кореляції визначимо через матрицю парних коефіцієнтів кореляції:

, де – визначник матриці парних коефіцієнтів кореляції, а – визначник матриці міжфакторної кореляції.

;

.

Коефіцієнт множинної кореляції: .

Аналогічний результат отримаємо при використанні інших формул:

;

;

.

Коефіцієнт множинної кореляції показує на достатньо сильний зв'язок усього набору факторів з результатом.

8.Нескорегований коефіцієнт множинної детермінації оцінює долю варіації результату за рахунок представлених у рівнянні факторів у загальній варіації результату. У нашому прикладі ця доля складає та вказує на достатньо високий ступень обумовленості варіації результату варіацією факторів, іншими словами – на достатньо тісний зв'язок факторів з результатом.

Скорегований коефіцієнт множинної детермінації:

визначає тісноту зв’язку з урахуванням ступеню свободи загальної та залишкової дисперсій. Він дає таку оцінку тісноти зв’язку, яка на залежить від кількості факторів і тому може порівнюватися по різним моделям з різним числом факторів. Обидва коефіцієнти вказують на достатньо високу (більш ) детермінованість результату в моделі факторами и .

9.Оцінку надійності рівняння регресії в цілому та показника тісноти зв’язку визначає - критерій Фішера:

В нашому випадку фактичне значення - критерію Фішера:

.

Таким чином (при ), тобто ймовірність випадково отримати таке значення - критерію не перевищує допустимий рівень значущості . Отже, отримане значення не випадкове, воно сформувалося під впливом істотних факторів, тобто підтверджується статистична значимість усього рівняння та показнику тісноти зв’язку .

10.За допомогою частинних - критеріїв Фішера оцінимо доцільність включення до рівняння множинної регресії фактора після и фактора після за допомогою формул:

;

.

Знайдемо и : ;

.

Маємо:

;

.

Таким чином . Отже, включення в модель фактора після того, як в модель включений фактор статистично недоцільно: приріст факторної дисперсії за рахунок додаткового признака виявляється незначним, несуттєвим; фактор включать в рівняння після фактора не слід.

Якщо поміняти початковий порядок включення факторів в модель та розглянути варіант включення після , то результат розрахунку частинного -критерія для буде іншим. , тобто ймовірність його випадкового формування менше, ніж прийнятий стандарт . Отже, значення частинного -критерія для додаткового включеного фактора не випадкове, являється статистично значимим, надійним, достовірним: приріст факторної дисперсії за рахунок додаткового фактора являється істотним. Фактор повинен бути присутнім в рівнянні, в тому числі в варіанті, коли він додатково включається після фактора .

11.Загальний висновок полягає в тому, що множинна модель з факторами и с містить неінформативний фактор . Якщо виключити фактор , то можна обмежитися рівнянням парної регресії:

, при .