КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ И ЕГО СВОЙСТВА. УРАВНЕНИЯ РЕГРЕССИИ

ЗАДАЧА корреляционного анализа сводится к:

1. Установлению направления и формы связи между признаками;

2. Измерению ее тесноты.

Функциональнойназывается однозначная зависимость между переменными величинами, когда определенному значению одной (независимой) переменной х, называемой аргументом, соответствует определенное значение другой (зависимой) переменной у, называемой функцией. (Пример: зависимость скорости химической реакции от температуры; зависимость силы притяжения от масс притягивающихся тел и расстояния между ними).

Корреляционной называется зависимость между переменными, имеющими статистистический характер, когда определенному значению одного признака (рассматриваемого в качестве независимой переменной) соответствует целый ряд числовых значений другого признака. (Пример: связь между урожаем и количеством осадков; между ростом и весом и т.д.).

Поле корреляции представляет собой множество точек, координаты которых равны полученным на опыте парам значений переменных х и у.

По виду корреляционного поля можно судить о наличии или отсутствии связи и ее типе.

 

Связь между величинами х и у линейная, положительная (прямая).   Связь между величинами х и у линейная, отрицательная (обратная).

 

Связь между величинами квадратичная.   Связи между величинами нет.

 

Связь называется положительной, если при увеличении одной переменной увеличивается другая переменная.

Связь называется отрицательной, если при увеличении одной переменной уменьшается другая переменная.

Связь называется линейной, если ее можно в аналитическом виде представить как .

Показателем тесноты линейной связи является коэффициент линейной корреляции. Эмпирический коэффициент линейной корреляции определяется выражением:

Коэффициент линейной корреляции лежит в пределах от -1 до 1 и характеризует степень близости между величинами x и y. Если:

1. - положительная корреляция;

2. - отрицательная корреляция;

3. - связь функциональная;

4. - связь высокая (или сильная);

5. - связь средняя;

6. - связь слабая;

7. - линейной связи нет.

Корреляционную зависимость между признаками можно описывать разными способами. В частности, любая форма связи может быть выражена уравнением общего вида . Уравнение вида и называются регрессией. Уравнение прямой регрессии у на х в общем случае можно записать в виде

Уравнение прямой регрессии х на у в общем случае выглядит как

Наиболее вероятные значения коэффициентов а и в, с и d могут быть вычислены, например, при использовании метода наименьших квадратов.