Показатели тесноты связи между количественными признаками
Статистическое изучение взаимосвязей социально-экономических явлений предполагает измерение тесноты (силы) и направления связи. Нахождение уравнения регрессии сопровождается измерением тесноты связи между признаками. Связь между количественными признаками измеряется через их вариацию. При измерении тесноты корреляционной связи ставится задача – определить, в какой мере вариация результативного признака вызвана вариацией факторного признака.
Теснота связи между количественными признаками измеряется с помощью следующих показателей:
§ линейный коэффициент корреляции ;
§ эмпирическое и теоретическое корреляционное отношение ;
§ коэффициент Фехнера ;
§ ранговые коэффициенты связи Спирмена и Кендалла ;
§ коэффициент конкордации .
Линейный коэффициент корреляции (К. Пирсона) применяется для измерения тесноты парной линейной связи.
При расчете коэффициента учитывается величина отклонений признаков от средних значений:
.
После преобразования данной формулы можно получить следующее выражение для расчета линейного коэффициента корреляции:
.
В статистике используются различные модификации формулы расчета данного коэффициента:
;
,
где - коэффициент регрессии в уравнении связи;
- среднее квадратическое отклонение соответствующего факторного признака. Знаки коэффициентов регрессии и корреляции совпадают.
Линейный коэффициент корреляции может принимать значения от -1 до +1: . Знак «-» означает, что связь обратная, а знак «+» свидетельствует о наличии прямой связи.
Интерпретация значений коэффициента корреляции представлена в табл. 10.2.
Таблица 10.2
Оценка линейного коэффициента корреляции
Значение коэффициента | Характер связи | Интерпретация связи |
обратная | с увеличением уменьшается , и наоборот | |
отсутствует | - | |
прямая | с увеличением увеличивается | |
функциональная | каждому значению факторного признака строго соответствует одно значение результативного признака |
Таким образом, линейный коэффициент парной корреляции одновременно характеризует тесноту и направление связи. Коэффициент корреляции является симметричной мерой связи между признаками и , т.е.
Рассмотрим порядок проверки коэффициента корреляции на значимость (существенность).
Коэффициент корреляции является выборочным показателем, поэтому он может содержать случайную ошибку, и не всегда однозначно отражать реальную связь между изучаемыми показателями.
Поэтому, чтобы оценить существенность (значимость) самого коэффициента и реальность измеряемой связи, необходимо рассчитать среднюю квадратическую ошибку коэффициента корреляции .
Для оценки существенности (значимости) линейного коэффициента корреляции необходимо сопоставить его со средней квадратической ошибкой:
.
Если число наблюдений 30, то средняя ошибка линейного коэффициента корреляции определяется по формуле:
.
Значимость линейного коэффициента корреляции проверяется на основе - критерия Стьюдента:
.
При этом выдвигается и проверяется нулевая гипотеза : о равенстве коэффициента корреляции нулю (гипотеза об отсутствии связи между х и у в генеральной совокупности)
Если нулевая гипотеза верна, т.е. = 0, то распределение - критерия подчиняется закону Стьюдента с заданными параметрами: уровнем значимости (обычно принимается за 0,05) и числом степеней свободы = п -2.
По таблице распределения Стьюдента (Приложение 5) находится критическое значение tтабл., которое допустимо при справедливости нулевой гипотезы. С этим значением сравнивается фактическое (расчетное) значение tрасч..
При этом, если > , то нулевая гипотеза отвергается, что свидетельствует о значимости линейного коэффициента корреляции. Следовательно, связь между х и у является статистически существенной (реальной).
Если < , то нулевая гипотеза не отвергается. Коэффициент корреляции считается незначимым (значение получено случайно), связь между х и у отсутствует.
Величина носит название коэффициента детерминации. Он показывает, в какой степени результативный признак зависит от факторного признака. Очевидно, что чем ближе коэффициент к 100 %, тем теснее выявленная зависимость между признаками.
С помощью линейного коэффициента связи и коэффициента детерминации можно определить тесноту линейной связи между двумя признаками (табл. 10.3.)
Таблица 10.3