Понятие корреляционной связи
Лекция 6. Элементы корреляционного и регрессионного анализа
В математике для описания связей между переменными величинами используют понятие функции F, которая ставит в соответствие каждому определенному значению независимой переменной X определенное значение зависимой переменной Y. Такого рода однозначные зависимости между переменными величинами X и У называют функциональными. Но подобные однозначные, или функциональные, связи между переменными величинами встречаются далеко не всегда
Поэтому, связи между психологическими признаками имеют не функциональный, а статистический характер, когда в среднем определенному значению одного признака, например, выраженной акцентуации подростков по гипертимному типу, рассматриваемому в качестве аргумента, соответствует не одно какое-либо значение, а целый спектр, распределяющихся в вариационный ряд числовых значений, например, такого психологического признака, как тревожность, который можно рассматривать в качестве зависимой переменной или функции. Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией. Корреляционная связь — это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.
Функциональные связи легко обнаружить и измерить на единичных и групповых объектах, однако этого нельзя проделать с корреляционными связями, которые можно изучать только на представительных выборках методами математической статистики. Корреляционные связи — это вероятностные изменения.
Виды корреляционных связей между измеренными признаками могут быть различны: так, корреляция бывает линейной и нелинейной, положительной и отрицательной. Она линейна — если с увеличением или уменьшением одной переменной X, вторая переменная Y всреднем либо также растет, либо убывает. Она нелинейна, если при увеличении одной величины характер изменения второй не линеен, а описывается другими законами.
Корреляция будет положительной, если с увеличением переменной X переменная Y в среднем также увеличивается, а если с увеличением X переменная Y имеет в среднем тенденцию к уменьшению, то говорят о наличии отрицательной корреляции.



Возможна ситуация, когда между переменными невозможно установить какую-либо зависимость. В этом случае говорят об отсутствии корреляционной связи. Подчеркнем, однако, что нередко встречаются задачи, в которых традиционная и наиболее часто встречающаяся в психологических исследованиях линейная корреляционная связь отсутствует, в то время как имеется высокозначимая криволинейная связь, например, полиномиальная или гиперболическая.
Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.
Сила связи не зависит от ее направленности и определяется по абсолютному значениюкоэффициента корреляции. Максимальное возможное значение коэффициента корреляции
; минимальное
.
Используются две системы классификации корреляционных связей по их силе: общая и частная. Общая классификация корреляционных связей:
1) сильная, или тесная при коэффициенте корреляции
;
2) средняя при
;
3) умеренная при
;
4) слабая при
;
5) очень слабая при 
Частная классификация корреляционных связей:
1) высокая значимая корреляция при
, соответствующем уровню статистической значимости
;
2) значимая корреляция при
, соответствующем уровню статистической значимости
;
3) тенденция достоверной связи при
, соответствующем уровню статистической значимости
;
4) незначимая корреляция при
, не достигающем уровня статистической значимости.
Две эти классификации не совпадают. Первая ориентирована только на величину коэффициента корреляции, а вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньше величины коэффициента корреляции оказывается достаточно, чтобы корреляция была признана достоверной. В результате при малом объеме выборки может оказаться так, что сильная корреляция окажется недостоверной. В то же время при больших объемах выборки даже слабая корреляция может оказаться достоверной.
Обычно принято ориентироваться на вторую классификацию, так как она учитывает объем выборки. Вместе с тем, необходимо помнить, что сильная, или высокая, корреляция – это корреляция с коэффициентом
, а не просто корреляция высокого уровня значимости.
Задача корреляционного анализа сводится кустановлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.
Зависимость между коррелирующими переменными X и У, как и в математике, можно выразить с помощью формул и уравнений (т.е. аналитически), аможно выразить графически.
Графики корреляционных зависимостей строят по уравнениям следующих функций:
или 
которые называются уравнениями регрессии.Здесь
и
,так называемые, условные средние арифметические переменных Х и Y.
Переменные X и У могут быть измерены в разных шкалах, именно это определяет выбор соответствующего коэффициента корреляции. Представим соотношения между типами шкал, в которых могут быть измерены переменные Х и У и соответствующими мерами связи в виде таблицы 1:
Таблица 1.
| Тип шкалы | Мера связи | |
Переменная
| Переменная
| |
| Интервальная или отношений | Интервальная или отношений | Коэффициент
Пирсона
|
| Ранговая, интервальная или отношений | Ранговая, интервальная или отношений | Коэффициент
Спирмена
|
| Ранговая | Ранговая | Коэффициент « »
Кендалла
|
| Дихотомическая | Дихотомическая | Коэффициент « »
|
| Дихотомическая | Ранговая | Рангово-бисериальный
|
| Дихотомическая | Интервальная или отношений | Бисериальный
|
| Интервальная | Ранговая | Не разработан |
»
Кендалла
»