Множинний регресійний аналіз

Економічні явища, як правило, визначаються великою кількістю одночасно діючих сукупностей факторів. У зв’язку з цим часто виникає задача дослідження залежності однієї залежної змінної Y від декількох пояснюючих змінних Ця задача вирішується за допомогою множинного регресійного аналізу.

Позначимо і-е спостереження змінної , а пояснюючих змінних - . Тоді модель множинної лінійної регресії можна представити у вигляді: , де і=1, 2, …, n, а задовольняє вимоги до збурення.

Матричне описування регресії полегшує як теоретичні концепції аналізу, так і необхідні розрахункові процедури. Введемо позначення: - матриця-стовпчик, або вектор, значень залежної змінної; - матриця значень пояснюючих змінних, або матриця плану; - матриця-стовпчик, або вектор, параметрів; - матриця-стовпчик, або вектор, збурень (випадкових помилок). Тоді в матричній формі модель набуде вигляду:

(7.4)

Оцінкою цієї моделі по вибірці є рівняння: , де , . Для оцінки вектора невідомих параметрів застосуємо метод найменших квадратів. Умова мінімізації залишкової суми квадратів запишеться у вигляді:

Після матричних перетворень, отримаємо рівняння

.

Добуток є матриця розміру тобто величина скалярна, відповідно вона не змінюється при транспонуванні: . Тому умова мінімізації прийме вигляд: .

На основі необхідної умови екстремуму функції багатьох змінних прирівняємо до нуля частинні похідні по цим змінним або в матричній формі - вектор частинних похідних:

Для вектора частинних похідних доведені наступні формули: , де b і c - вектори-стовпці, а А – симетрична матриця. Тому, припускаючи, що , а матриця ,знайдемо , звідки отримаємо систему нормальних рівнянь в матричній формі для визначення вектора b: . Знайдемо матриці, які входять в це рівняння. Матриця представляє матрицю сум перших степенів, квадратів і попарних добутків n спостережень пояснюючих змінних:

Матриця є вектор добутку n спостережень пояснюючих і залежних змінних:

Матричне рівняння для однієї пояснюючої змінної (р=1) набуде вигляду: звідки безпосередньо випливає система нормальних рівнянь для незгрупованих даних.

Для вирішення матричного рівняння відносно вектора оцінок параметрів b необхідно ввести ще одне посилання 6 (див. розділ 6) для множинного регресійного аналізу: матриця XТX не є особливою, тобто її визначник не дорівнює нулю. Відповідно, ранг матриці XТX рівний її порядку, тобто rang(XТX)=p+1. Із матричної алгебри відомо, що rang(XТX)= rang(X), значить, rang(X)=p+1, тобто ранг матриці плану Х рівний кількості її стовпців. Це дозволяє сформулювати посилання 6 множинного регресійного аналізу в наступному вигляді:

6. Вектори значень пояснюючих змінних, або стовпці матриці плану Х,

повинні бути лінійно незалежними, тобто ранг матриці Х – максимальний (rang(X)=p+1).

Окрім того, припускають, що число наявних спостережень кожної із пояснюючих змінних більше рангу матриці Х, тобто n> rang(X) або n>p+1.Розв’язком матричного рівняння є вектор де - матриця, обернена до матриці коефіцієнтів системи, а - матриця-стовпчик її вільних членів.

 

◄Приклад 7.4 Є наступні дані про змінний добуток вугілля на одного робочого Y(т), потужність пласта (м) і рівні механізації робіт

(%), які характеризують процес добутку вугілля в 10 шахтах (табл. 7.6). Припускаючи, що між змінними і існує лінійна кореляційна залежність, знайти її аналітичний вираз (рівняння регресії Y по X1 та X2).

 

Таблиця 7.6

i i

 

Розв’язання. Позначимо

Для зручності обчислень складаємо допоміжну таблицю 7.7.

Таблиця 7.7

i
5,13 0,016
8,79 1,464
9,64 1,127
5,98 1,038
5,86 0,741
6,23 0,052
6,35 0,121
5,61 0,377
5,13 0,726
9,28 1,631
- 6,329

 

;

Матрицю А-1 = (XТX)-1 визначимо за формулою де - визначник матриці XТX, - матриця, приєднана до матриці XТX.

Отримаємо

Домножимо на .

Отримаємо

Отже, рівняння множинної регресії має вигляд: Воно показує, що при збільшені тільки потужності пласту Х1 (при незмінному Х2) на 1 м, добуток вугілля на одного робітника Y збільшиться в середньому на 0,854 т, а при збільшенні рівня механізації робіт Х2 (при незмінному Х1) – в середньому на 0,367 т.►

Додавання в регресивну модель нової пояснюючої змінної Х2 змінило коефіцієнт регресії b1 (Y по Х1) з 1,016 для парної регресії (див. приклад 6.1, розділ 6) до 0,854 - для множинної регресії. В цьому ніякого протиріччя нема, оскільки у другому випадку коефіцієнт регресії дозволяє оцінити приріст залежної змінної Y при зміні на одиницю пояснюючої змінної Х1 у чистому вигляді, незалежно від Х2. У випадку парної регресії b1 враховує вплив на Y не тільки змінної Х1, але і кореляційно зв’язаної з нею змінної Х2.

На практиці часто буває необхідне порівняння впливу на залежну змінну різних пояснюючих змінних, коли останні виражаються різними одиницями вимірів. У цьому випадку використовують стандартизовані коефіцієнти регресії і коефіцієнти еластичності :

(7.5)

(7.6)

Стандартизований коефіцієнт регресії показує, на скільки величин зміниться в середньому залежна змінна Y при збільшенні тільки j-ої пояснюючої змінної на , а коефіцієнт еластичності - на скільки відсотків (від середньої) зміниться в середньому Y при збільшенні тільки Хj на 1%.

◄ Приклад 7.5За даними прикладу 7.4 порівняти розділений вплив на змінний добуток вугілля двох факторів – потужності пласту і рівня механізації робіт.

Розв’язування. Для порівняння впливу кожної із пояснюючих змінних за формулою (7.5) обчислимо стандартизовані коефіцієнти регресії:

а за формулою (7.6) – коефіцієнти еластичності:

(розрахунок необхідних характеристик змінних:

)

Таким чином, збільшення потужності пласту і рівня механізації робіт тільки на одне або на одне збільшує в середньому змінний добуток вугілля на одного робітника відповідно на 0,728 або на 0,285 , а збільшення цих змінних на 1% (від своїх попередніх значень) призводить в середньому до зростання видобутку вугілля відповідно на 1,18% і 0,34%. Отже, більший вплив має фактор “потужність пласту” у порівнянні з фактором “рівень механізації робіт”.►

 

Додаткова інформація про регресійний аналіз та його методи знаходиться в додатку 3.

Контрольні питання

1. В чому полягає основна різниця між кореляційним і регресійним аналізом?

2. Основні посилання регресійного аналізу.

3. Як побудований довірчий інтервал для умовного математичного сподівання?

4. Особливості множинного регресійного аналізу: матричний метод.

РОЗДІЛ 8