Разбор темы по учебным вопросам

· Определение понятия «корреляционная связь».

· Коэффициент корреляции: понятие, методика вычисления.

· Коэффициент детерминации: применение, методика вычисления.

· Коэффициент регрессии: понятие, методика вычисления.

2. Решение задач.

Закрепление материала по контрольным вопросам и тестам

 

Коэффициент корреляции

Все явления в природе и обществе находятся во взаимосвязи.

Корреляционная связь – изменение какого-либо признака связано главным образом, но не исключительно с изменением другого явления или признака.

Например, вес человека в основном зависит от его роста, однако кроме роста на величину веса влияют и другие факторы (питание, состояние здоровья, занятия спортом и так далее). Поэтому люди одинакового роста имеют разный вес за редким исключением. Кроме корреляционной связи имеется функциональная связь – это строгая зависимость явлений. Например, чем больше радиус шара, тем больше объем шара. При функциональной связи изменение какого-либо явления вызывает обязательно строго определенные изменения другого явления.

В медицине мы часто встречаемся с корреляционной связью.

При положительной (прямой) связи, когда изменение одного явления идет в том же направлении, что и другого, коэффициент корреляции принимает значение в пределах от 0 до +1. В случаях отрицательной (обратной) связи, когда изменение одного явления сопровождается изменением другого явления в обратном направлении, коэффициент корреляции принимает значение в пределах от 0 до –1. Чем больше коэффициент корреляции приближается к 1 (–1), тем больше связь изучаемых явлений. Значение коэффициента корреляции равное 0, говорит об отсутствии связи, а равное 1 (–1), говорит о полной связи.

Методы вычисления коэффициента корреляции:

· ранговая корреляция (способ Спирмана – Р), менее точный;

· способ квадратов (способ Пирсона – r), более точный, применяется для малой выборки.

Формула вычисления коэффициента ранговой корреляции:

, где

6 – постоянная величина,

d – разность между порядковыми номерами рядов,

n – число корреляционных рядов.

Пример вычисления коэффициента ранговой корреляции (способ Спирмана) (табл. 7.1).

Таблица 7.1

Показатели содержание уровня холестерина в крови в зависимости от возраста

Возраст, лет Х Холестерин в мг % У Ранги в сторону увеличения Разность рангов d (Х-У) Квадрат разности Рангов d2
возраст Х холестерин У
20-29 193,3
30-39 222,5 -2
40-49 224,4 -2
50-59 220,0
60-69 218,8
70 лет и старше 229,7
         
             

Методика вычисления.

1. Определение порядковых номеров (ранги) возраста и величины холестерина в порезке увеличения величин (графа х и у).

2. Вычисление разности рангов d: (х-у).

3. Воздействие разности рангов в квадрат d и определение их суммы

4. Данные представляют формулу:

5. Оценку показателя проводится по шкале (табл.7.2)

 

Таблица 7.2

Шкала оценки направления и силы коэффициента корреляции

Сила связи Характер связи
Прямая Обратная
Слабая Средняя Сильная 0-0,29 0,3-0,69 0,7-1 0-(-0,29) -0,3-(-0,69) -0,7-(-1)

 

В данном примере связь прямая (знак +), средняя (0,5).

Вычисление коэффициента детерминации, показывающего долю влияния причины на следствие (в нашем случае возраста на количество холестерина), производится по формуле: .

Вычисление коэффициента по способу квадратов (Пирсона) имеется в соответствующей литературе.

Коэффициент регрессии

Регрессия – функция, позволяющая по величине одного коррелируемого (связанного) признака определить средние величины другого признака.

С помощью регрессии ставится задача выяснить, как количественно меняется одна величина при изменении другой величины. Например, насколько в среднем увеличится вес ребенка с увеличением его роста на определенную величину. Имея местный стандарт, например, родители ребенка могут коррелировать его вес в соответствии с увеличением роста.

Для определения размера этого изменения применяется коэффициент регрессии.

Формула определения коэффициента регрессии

, где

rxy – коэффициент корреляции,

у – первая сравниваемая величина,

х – вторая сравниваемая величина,

σх и σу – среднее квадратическое отклонение для ряда первой и второй величины.

С помощью коэффициента регрессии можно определить величину одного из признаков (массы тела зная значение другого (роста)). Это возможно по уравнению линейной регрессии: формула

, где

у – искомая величина (масса тела),

х – известная величина роста,

– коэффициент регрессии массы тела по росту,

Му – среднее значение массы тела,

Мх – среднее значение роста.

 

В жизни люди одинакового роста могут иметь разный вес. Меру индивидуального разнообразия характеризует сигма регрессии. Формула:

, где

σ – среднее квадратическое отклонение изучаемого признака,

rxy – коэффициент корреляции.

По данным сигмы регрессии можно построить график (шкала регрессии), по которому возможно по росту найти и средний вес, и индивидуальное колебание веса.

Техника вычисления указанных коэффициентов приведены в соответствующей литературе.

Задачи

Задача 1

Влияние содержание уровня фтора в воде на заболеваемость кариеса

Зона Средняя концентрация фтора, мг/л Кол-во выявленных
1 зона 0,29±0,01
2 зона 0,60±0,02
3 зона 1,18±0,07

Определить коэффициент корреляции между содержанием фтора и кариесом зубов.

 

Задача 2

Влияние содержание уровня фтора в воде на флюороз

Район Кол-во выявленных Концентрация фтора, мг/л
А 1,8
Б 2,5
В 2,9
Г 1,7

Определить коэффициент корреляции между содержанием фтора и флюорозом.

 

Задача 3

Повозрастная заболеваемость пародонтоза у взрослого населения района «Н» за 2009 год

Возраст, лет 20-24 25-29 30-34 35-39 40-49 50-59 60 и старше
На 1000 населения 26,4 25,6 19,6 34,2 29,6 17,4

Вычислить коэффициент регрессии заболеваемости населения. Определить ожидаемую заболеваемость в возрасте 25-39, 40-49 лет, начертите линию регрессии

Задача 4

Уровень холестерина по возрастным группам у обследованного мужского населения «Н» района

Возраст в годах 20-29 30-39 40-49 50-59 60-69 70 и старше
Холестерин в мг % 185,1 195,0 238,0 217,5 204,0 233,7

Определить направление и силу связи между этими явлениями путем вычисления ранговой корреляции, оценить его достоверность и сделать соответствующие выводы.

 

Задача 5

Зависимость между длительностью охлаждения организма (2 часа ежедневно) и уровнем молочной кислоты в крови (мг %)

Дни охлаждения
Молочная кислота в мг % 77,0 77,0 77,2 77,1 88,5 88,9 88,7 99,0 99,5 99,3

Определить направление и силу связи между двумя показателями путем вычисления коэффициента корреляции и оценить его достоверность, вычислить коэффициент детерминации.

 

Задача 6