Обчислення та аналіз регресії. Наступним етапом дослідження є аналіз регресії

Наступним етапом дослідження є аналіз регресії. Аналіз регресії є складовою кореляційного аналізу в широкому розумінні.

У моделях множинної кореляції залежна змінна У розглядається як функція кількох незалежних змінних Х.

Припущення про існування лінійного рівняння множинної регресії може бути представлене у такому вигляді:

= +

Параметри наведеного рівняння знаходять, розв’язавши систему нормальних рівнянь:

Множинне кореляційне рівняння встановлює зв′язок між досліджуваними ознаками і дає змогу вирахувати очікувані значення результативної ознаки під дією включених в аналіз ознак - факторів, пов′язаних із даним рівнянням.У вузькому розумінні рішення кореляційних моделей охоплює операції по знаходженню числових значень параметрів досліджуваних залежностей.

При вивченні множинного кореляційного аналізу результативної ознаки із двома факторними аналітичне рівняння регресії має вигляд:

+

Параметри розраховують, розв′язуючи систему нормальних рівнянь:

 

Обчислення регресії з допомогою програми MS Excel « Регрессия ».

Таблиця 3. ВЫВОД ИТОГОВ  
Регрессионная статистика
Множественный R 0, 931140945
R-квадрат 0,867023459
Нормированный R-квадрат 0,854934683
Стандартная ошибка 2,022646342
Наблюдения

Множинний коефіцієнт кореляції відображує тісноту зв’язку між результативною ознакою і всіма факторами що вивчаються, оскільки він прямує до «0» (R=0, 931140945), отже зв'язок сильний.

Коефіцієнт детермінації (R2) показує, що варіація результативної ознаки У на 86,70% обумовлена впливом двох факторів Х1 і Х2. Решта варіації – 13,30% - це вплив випадкових не врахованих факторів.

Таблиця 4. Дисперсионный анализ        
df SS MS F Значимость F
Регрессия 586,8382 293,4191 71,7214 2,29893E-10
Остаток 90,0041 4,0911    
Итого 676,8424      
             

 

Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 19,75945397 5,389017997 3,666614953 0,001355157 0,001715342 30,9355932 8,583314732 30,9355932
Переменная X 1 0,220455594 0,041863777 5,266022495 2,77315E-05 0,133635434 0,307275754 0,133635434 0,307275754
Переменная X 2 -6,400414083 1,793396124 -3,568879176 0,001715342 -10,11968999 -2,681138178 -10,11968999 -2,681138178
  Таблиця 5. ВЫВОД ОСТАТКА    
  Наблюдение Предсказанное Y Остатки  
  30,86036131 1,139638691  
  18,20186109 0,198138914  
  31,91996051 -1,919960511  
  26,21653022 -2,016530222  
  28,45664713 2,643352871  
  16,87912752 -0,179127523  
  28,79799321 -2,597993207  
  22,39766319 -2,097663188  
  27,26903965 -2,169039646  
  19,19036637 -0,39036637  
  26,22364802 -0,52364802  
  19,94418046 -0,344180463  
  22,93808344 2,761916557  
  20,14331068 -0,843310684  
  16,41686294 1,183137059  
  28,63445198 4,165548023  
  24,60221913 -0,602219126  
  22,07764248 -1,677642484  
  31,98396465 1,116035348  
  19,78061121 1,119388788  
  28,02285374 -1,62285374  
  31,08790668 -2,58790668  
  28,57047586 3,329524143  
  26,52943313 2,070566872  
  19,1548054 -0,1548054  
                             

 

Сума залишків дорівнює нулю, а це свідчить про відсутність залежності залишків від значень факторів (сталість дисперсії).

Система показників таблиці «Вывод итогов» дає всебічну характеристику регресії. Крім того, в цій таблиці показані оцінки статистичної суттєвості кореляційних характеристик та оцінки характеристик гіпотетичної генеральної сукупності.

Як видно з табл.4, в нашому прикладі залежність урожайності описується рівнянням: Y=19,7595+0,2205X1-6,4004X2

З цього випливає, що збільшення якості грунту на 1 бал обумовлює зростання урожайності на 0,2205 ц/га, а збільшення затрат праці на 1 ц зернових на 1 люд.-год. обумовлює зниження урожайності на 6,4004 ц/га.

Варіація урожайності на 86,7% обумовлена впливом досліджуваних факторів, про що свідчить множинний коефіцієнт детермінації (R-квадрат=0,867023459).