Перевірка значущості та інтервальна оцінка параметрів зв’язку

 

В практичних дослідженнях про тісноту кореляційної залежності судять по значенню вибіркового коефіцієнта кореляції . Оцінка величина випадкова. Нехай . В цьому випадку перевіряється гіпотеза про відсутність лінійного кореляційного зв’язку між змінними в генеральній сукупності. Якщо ця гіпотеза справедлива, то статистика має - розподіл Стьюдента з степенями вільності. Гіпотеза відкидається, якщо , де - табличне значення - критерію Стьюдента, що визначається на рівні значущості при кількості степенів вільності .

 

◄Приклад 6.3 Перевірити на рівні =0,05 значущість коефіцієнта кореляції між змінними Х та Y за даними табл. 6.1.

Розв’язання. В прикладі 6.2 обчислено коефіцієнт кореляції . Статистика критерію . Для рівня значущості =0,05 і кількості степенів вільності знаходимо критичне значення статистики . Оскільки , то коефіцієнт кореляції між добовим виробітком продукції Y і величиною основних виробничих фондів Х значно відмінний від нуля.►

 

Для значущого коефіцієнта кореляції доцільно знайти довірчий інтервал, який із заданою надійністю накриває невідомий генеральний коефіцієнт кореляції . Для побудови такого інтервалу використовують спеціально підібрані функції від , які збігаються до добре відомих розподілів. Найчастіше використовують - перетворення Фішера:

(6.20) Розподіл вже при невеликих n є приблизно нормальним з математичним сподіванням і дисперсією .

Спочатку будується довірчий інтервал для :

, де - нормоване відхилення , що визначається за допомогою функції Лапласа: .

Для визначення границь довірчого інтервалу для існують спеціальні таблиці. За їх відсутності користуються формулою .

Якщо коефіцієнт кореляції значущий, то коефіцієнти регресії і також значно відрізняються від нуля, а інтервальні оцінки для відповідних генеральних коефіцієнтів регресії і можуть бути отримані за формулами, що спираються на те, що статистики , мають t-розподіл Стьюдента з (n-2) степенями вільності:

(6.21)

(6.22)

- перетворення Фішера може бути застосовано при перевірці різних гіпотез відносно коефіцієнта кореляції. Наприклад, для перевірки значущості розбіжностей двох коефіцієнтів кореляції і , отриманих за вибірками об’ємів і для перевірки нульової гіпотези

застосовується статистика (6.23)

 

Приклад 6.4 За даними таблиці 6.1 знайти з надійністю 0,95 інтервальні оцінки (довірчі інтервали) параметрів зв’язку між добовим виробітком продукції Y і величиною основних виробничих фондів X.

Розв’язання . Оскільки коефіцієнт кореляції X і Yзначущий (див. приклад 6.3), то побудуємо довірчий інтервал для генерального коефіцієнта кореляції ρ, застосовуючи - перетворення Фішера:

. За таблицею функцій Лапласа і за умови , знаходимо . Побудуємо довірчий інтервал для M(z): , або . Знаходимо границі довірчого інтервалу для ρ, використовуючи спеціальну таблицю чи формулу: .

Генеральний коефіцієнт кореляції ρ на рівні значущості 0,05 (з надійністю 0,95) накривається знайденим інтервалом.

Тепер побудуємо довірчі інтервали для генеральних коефіцієнтів регресії і . Спочатку визначимо середнє квадратичне відхилення змінних: ; .

Тепер за (6.21): .

Або .

Аналогічно за (6.22): ►.

 

При змістовній інтерпретації параметрів ρ, слід врахувати в першу чергу їх інтервальні ( а не тільки точкові ) оцінки.

 

Приклад 6.5 При дослідженні зв’язку між продуктивністю праці і рівнем механізації робіт на підприємствах однієї галузі промисловості, що розташовані в двох різних районах держави, обчислені коефіцієнти кореляції і за вибірками об’ємів відповідно і . З’ясувати, чи є на рівні значущості суттєві розбіжності в тісноті зв’язку між змінними, що розглядаються на підприємствах галузі в цих районах.

Розв’язання. Гіпотеза, що перевіряється . Альтернативна гіпотеза . Статистика обчислюється за формулою (6.23):

. . Отже, гіпотеза не відкидається, тобто немає підстав вважати розбіжності суттєвими.►