Формулы коэффициента корреляции

При сравнении порядковых данных применяется коэффициент ранговой корреляции по Ч. Спирмену (г):

 

 

где d — разность рангов (порядковых мест) двух величин, N — число сравниваемых пар величин двух переменных и у).

При сравнении метрических данных используется коэффициент корреляции произведенийпо К. Пирсону (г):

 

где хiотклонение индивидуального значения х; х — среднее арифметическое; уi — отклонение индивидуального значение у; у' — среднее арифметическое; S — сумма.

Внедрение в научные исследования вычислительной техники позволяет быстро и точно определять любые количественные характеристики любых массивов данных. Разработаны различные программы для ЭВМ, по которым можно проводить соответствующий статистический анализ практически любых выборок. Из массы статистических приемов в психологии наибольшее распространение получили следующие:

1) комплексное вычисление статистик;

2) корреляционный анализ;

3) дисперсионный анализ;

4) регрессионный анализ;

5) факторный анализ;

6) таксономический (кластерный) анализ;

7) шкалирование.

 

Корреляционный анализ

 

Корреляционный анализ сводится к вычислению коэффициентов корреляции в самых разнообразных соотношениях между переменными. Соотношения задаются исследователем, а переменные равнозначны, то есть, что является причиной, а что следствием, установить через корреляцию невозможно. Кроме тесноты и направленности связей метод позволяет установить форму связи (линейность, нелинейность). Надо заметить, что нелинейные связи не поддаются анализу общепринятыми в психологии математическими и статистическими методами. Данные, относящиеся к нелинейным зонам (например, в точках разрыва связей, в местах скачкообразных изменений), характеризуют через содержательные описания, воздерживаясь от формально-количественного их представления. Иногда для описания нелинейных явлений в психологии удается применить непараметрические математико-статистические методы и модели. Например, используется математическая теория катастроф.

Для эффективного использования вычисленных коэффициентов корреляции необходимо представить имеющуюся числовую информацию в подходящем виде. Прежде всего, надо выделить коэффициенты корреляции, величина которых превышает критические значения. В психологии чаще всего рассматривают два уровня достоверности: 0,05 и 0,01. Целесообразно выделить среди прочих коэффициенты корреляции, превышающие эти уровни достоверности. Можно подчеркнуть коэффициенты с достоверностью 0,05 одной чертой или отметить одной звездочкой, а с достоверностью 0,01 — двумя. Удобно использовать и цветовое кодирование.

Если после этого выделения обнаружилось, что значимых коэффициентов корреляции (превышающих уровень 0,05 или 0,01) довольно много, то для дальнейшего анализа более удобна полная матрица интеркорреляций. Поэтому, если в принтерной распечатке содержится только половина матрицы, отделенная от другой половины главной диагональю, то ее надо восстановить до полного вида.

Матрица интеркорреляций оцифрована только номерами признаков и содержит только коэффициенты корреляции каждого признака с каждым. Испытуемые и их порядковые номера в таблице исходных данных в ней не представлены.

Поскольку матрица интеркорреляций симметрична относительно своей главной диагонали (проходящей из левого верхнего угла в правый нижний), то ее при восстановлении надо «опрокинуть», повернуть относительно этой оси симметрии. Обычно в распечатке каждая строчка начинается с номера признака, затем написано 1,0 — это коэффициент корреляции данного признака с самим собой. Затем напечатан коэффициент корреляции данного признака со следующим по порядковому номеру и далее коэффициенты корреляции с остальными признаками.

Пример. Получена распечатка1:

1 Нули перед десятичной точкой опущены.

 

1*1.0.58.30.41.60.40

2*1.0.43.57.65.51

3*1.0.39.38.41

4* 1.0 .60 .38

5*1.0.35

6* 1.0

Заполним половину матрицы, используя полученные данные.