Методы вычисления коэффициента корреляции.

Измерение связи между явлениями и/или признаками. Корреляционная связь. Методы определения коэффициента корреляции.

1. Виды связей между явлениями и признаками, краткая характеристика, примеры.

Фундаментальным свойством всех процессов и явлений в природе и в обществе является их взаимозависимость. Поиск причинно-следственных взаимодействий имеет огромное значение в практической деятельности врача, так как только при их учете можно воздействовать на причину болезни. Не устранив причину болезни невозможно добиться положительного клинического эффекта. При анализе статистической совокупности взаимосвязь между признаками рассматривается как пятое свойство в статистической совокупности.

Выделяют две формы связи между явлениями и признаками:

· Функциональную;

· Корреляционную.

Функциональная связьхарактеризуется тем, что каждому значению одного признака соответствует строго определенное значение другого признака и изменение величины одного признака неизбежно вызывает совершенно определенные изменения величины другого признака. Выражением такого характера связи является математическая функция. Как правило, функциональная связь характерна для физико-химических явлений, наблюдаемых в неживой природе.

Например: пройденное расстояние функционально зависит от скорости и времени движения, площадь круга функционально зависит от радиуса, вес объекта функционально зависит от силы гравитации и т.д.

Корреляционная связьпроявляется при анализе сложных объектов и процессов, как правило, наблюдаемых в живой природе (растительный и животный мир, человек, общественные явления) и характеризуется тем, что каждому значению одного признака может соответствовать несколько значений другого признака.

Например: каждому значению роста может соответствовать несколько значений массы тела, при одинаковой дозе введенного лекарственного вещества наблюдается разный клинический эффект, длительность течения одного и того же заболевания у разных людей отличается и т.д.

2. Вычисление и оценка коэффициента корреляции по методу Пирсена.

Наличие или отсутствие корреляционной взаимосвязи между признаками определяется коэффициентом корреляции.

Методические требования к использованию коэффициента корреляции:

· измерение связи возможно только в качественно однородных совокупностях (например, измерение связи между ростом и весом в совокупностях, однородных по полу и возрасту);

· расчет может производиться с использованием абсолютных или производных величин;

· для вычисления коэффициента корреляции используются не сгруппированные вариационные ряды (это требование применяется только при вычислении коэффициента корреляции по методу квадратов);

· число наблюдений менее 30.

Методы вычисления коэффициента корреляции.

Для вычисления коэффициента корреляции используются различные методы:

· рангов () или метод Спирмена;

· квадратов (r) или метод Пирсена;

· корреляционной решетки ();

· множественной корреляции.

 

Критерий корреляции Пирсена – это метод параметрической статистики, позволяющий определить наличие или отсутствие линейной связи между двумя количественными показателями, а также оценить ее тесноту и статистическую значимость. Другими словами, критерий корреляции Пирсена позволяет определить, есть ли линейная связь между изменениями значений двух переменных. В статистических расчетах и выводах коэффициент корреляции обычно обозначается как rxy или Rxy.

Метод Пирсена применяется в тех случаях, когда необходимо более точное значение коэффициента корреляции при числе наблюдений до 100 единиц и признаки выражены в количественных показателях.

Рекомендации к применению метода квадратов (метод Пирсена):

§ когда требуется точное установление силы связи между признаками;

§ когда признаки имеют только количественное выражение.

Метод квадратов (метод Пирсена):

v построить вариационные ряды для каждого из сопоставляемых признаков, обозначив первый и второй ряд чисел соответственно х и у;

v определить для каждого вариационного ряда средние значения (М1 и М2);

v найти отклонения (dх и dy) каждого числового значения от среднего значения своего вариационного ряда;

v полученные отклонения перемножить (dx dy);

v каждое отклонение возвести в квадрат и суммировать по каждому ряду ( dx² и dy²);

v подставить полученные значения в формулу расчета коэффициента корреляции:

при наличии вычислительной техники расчет производится по формуле:

 

 

-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-/-

По направлению корреляционная связь может быть:

· прямой (значение коэффициента корреляции положительное, имеет знак «+»);

· обратной (значение коэффициента корреляции отрицательное, имеет знак « – »).

Если связь между признаками прямая, то с увеличением значения одного признака наблюдается увеличение значения другого признака, или с уменьшением одного признака уменьшается другой признак. Например: при увеличении роста наблюдается увеличение массы тела; при снижении температуры тела наблюдается снижение частоты сердечных сокращений и т.д.

Если связь между признаками обратная, то с увеличением значения одного признака наблюдается уменьшение значения другого признака. Например: при увеличении повозрастных показателей смертности снижается показатель средней продолжительности предстоящей жизни, при увеличении охвата профилактическими прививками уменьшается уровень инфекционной заболеваемости и т.д.

Абсолютная величина коэффициента свидетельствует о силе корреляционной связи между изучаемыми признаками.