Проверка значимости и интервальные оценки параметров связи

Лабораторная работа №4

Корреляционно-регрессионный анализ.

 

Оценки параметров корреляционного анализа

Основная задача двумерного корреляционного анализа признаков (Х, Y) состоит в оценке пяти параметров:

- оценка среднего значения величины Х,

- оценка среднего значения величины Y,

- оценка среднего значения величины Х2,

- оценка среднего значения величины Y2,

- оценка среднего значения произведения величин Х и Y.

Откуда:

- оценка дисперсии величины Х,

- оценка дисперсии величины Y,

- оценка для парного коэффициента корреляции.

Парный коэффициент корреляции служит мерой линейной статистической зависимости между величинами и является одним из основных показателей взаимосвязи между ними, принимающий значения от -1 до 1.

Имея эти показатели, можно получить уравнения линий регрессии, показывающих изменение условных математических ожиданий в зависимости от изменения соответствующих значений случайных переменных:

уравнение регрессии Y на X:

уравнение регрессии X на Y:

И тогда оценка коэффициентов уравнения регрессии

В двумерном случае для наглядности наносят на график точки ( ) - корреляционное поле; строят эмпирическую регрессию – ломанную, соединяющую точки ( ), где - средне арифметическое наблюденных значений Y; оценки функции регрессии (рисунок 4.1)

 

 


 

 

Рисунок 4.1

 

 

Проверка значимости и интервальные оценки параметров связи

 

Проверка значимости парного коэффициента корреляции.

С этой целью проверки гипотезы о значимости коэффициента корреляции выдвигают нулевую гипотезу Н0: , при альтернативной гипотезе Н1: . Для ее проверки используют статистику

(1)

Критическое значение t находят по таблицам распределения Стьюдента с степенями свободы и уровнем значимости α. Затем сравнивают наблюдаемое и критические значения. Если ‌‌‌‌t> tкр, то гипотеза о незначимости коэффициента корреляции отвергается.

Интервальные оценки находят для значимых параметров связи:. При определении с надежностью γ доверительного интервала для ρ используют Z – преобразование Фишера:

(2)

tγ вычисляют по таблице нормального распределения с заданным γ.

Значение Zr определяют по таблице Z – преобразования по найденному значению r.

Обратный переход от Z кρ осуществляют также по таблицам Z – преобразования Фишера, после чего получают интервальную оценку для ρ:

 

. (3)

 

Значимость коэффициентов регрессии проверяют с использованием статистики:

, (4)

 

где

(5)

которая при справедливости гипотезы распределена по закону Фишера – Снедекора с заданным уровнем значимости a и числом степеней свободы n1=n2=n-1

Интервальная оценка для коэффициентов регрессии имеет вид:

(6)

Аналогично для коэффициента βXY:

 

(7)