Разбор темы по учебным вопросам
· Определение понятия «корреляционная связь».
· Коэффициент корреляции: понятие, методика вычисления.
· Коэффициент детерминации: применение, методика вычисления.
· Коэффициент регрессии: понятие, методика вычисления.
2. Решение задач.
Закрепление материала по контрольным вопросам и тестам
Коэффициент корреляции
Все явления в природе и обществе находятся во взаимосвязи.
Корреляционная связь – изменение какого-либо признака связано главным образом, но не исключительно с изменением другого явления или признака.
Например, вес человека в основном зависит от его роста, однако кроме роста на величину веса влияют и другие факторы (питание, состояние здоровья, занятия спортом и так далее). Поэтому люди одинакового роста имеют разный вес за редким исключением. Кроме корреляционной связи имеется функциональная связь – это строгая зависимость явлений. Например, чем больше радиус шара, тем больше объем шара. При функциональной связи изменение какого-либо явления вызывает обязательно строго определенные изменения другого явления.
В медицине мы часто встречаемся с корреляционной связью.
При положительной (прямой) связи, когда изменение одного явления идет в том же направлении, что и другого, коэффициент корреляции принимает значение в пределах от 0 до +1. В случаях отрицательной (обратной) связи, когда изменение одного явления сопровождается изменением другого явления в обратном направлении, коэффициент корреляции принимает значение в пределах от 0 до –1. Чем больше коэффициент корреляции приближается к 1 (–1), тем больше связь изучаемых явлений. Значение коэффициента корреляции равное 0, говорит об отсутствии связи, а равное 1 (–1), говорит о полной связи.
Методы вычисления коэффициента корреляции:
· ранговая корреляция (способ Спирмана – Р), менее точный;
· способ квадратов (способ Пирсона – r), более точный, применяется для малой выборки.
Формула вычисления коэффициента ранговой корреляции:
, где
6 – постоянная величина,
d – разность между порядковыми номерами рядов,
n – число корреляционных рядов.
Пример вычисления коэффициента ранговой корреляции (способ Спирмана) (табл. 7.1).
Таблица 7.1
Показатели содержание уровня холестерина в крови в зависимости от возраста
Возраст, лет Х | Холестерин в мг % У | Ранги в сторону увеличения | Разность рангов d (Х-У) | Квадрат разности Рангов d2 | ||
возраст Х | холестерин У | |||||
20-29 | 193,3 | |||||
30-39 | 222,5 | -2 | ||||
40-49 | 224,4 | -2 | ||||
50-59 | 220,0 | |||||
60-69 | 218,8 | |||||
70 лет и старше | 229,7 | |||||
Методика вычисления.
1. Определение порядковых номеров (ранги) возраста и величины холестерина в порезке увеличения величин (графа х и у).
2. Вычисление разности рангов d: (х-у).
3. Воздействие разности рангов в квадрат d и определение их суммы
4. Данные представляют формулу:
5. Оценку показателя проводится по шкале (табл.7.2)
Таблица 7.2
Шкала оценки направления и силы коэффициента корреляции
Сила связи | Характер связи | |
Прямая | Обратная | |
Слабая Средняя Сильная | 0-0,29 0,3-0,69 0,7-1 | 0-(-0,29) -0,3-(-0,69) -0,7-(-1) |
В данном примере связь прямая (знак +), средняя (0,5).
Вычисление коэффициента детерминации, показывающего долю влияния причины на следствие (в нашем случае возраста на количество холестерина), производится по формуле: .
Вычисление коэффициента по способу квадратов (Пирсона) имеется в соответствующей литературе.
Коэффициент регрессии
Регрессия – функция, позволяющая по величине одного коррелируемого (связанного) признака определить средние величины другого признака.
С помощью регрессии ставится задача выяснить, как количественно меняется одна величина при изменении другой величины. Например, насколько в среднем увеличится вес ребенка с увеличением его роста на определенную величину. Имея местный стандарт, например, родители ребенка могут коррелировать его вес в соответствии с увеличением роста.
Для определения размера этого изменения применяется коэффициент регрессии.
Формула определения коэффициента регрессии
, где
rxy – коэффициент корреляции,
у – первая сравниваемая величина,
х – вторая сравниваемая величина,
σх и σу – среднее квадратическое отклонение для ряда первой и второй величины.
С помощью коэффициента регрессии можно определить величину одного из признаков (массы тела зная значение другого (роста)). Это возможно по уравнению линейной регрессии: формула
, где
у – искомая величина (масса тела),
х – известная величина роста,
– коэффициент регрессии массы тела по росту,
Му – среднее значение массы тела,
Мх – среднее значение роста.
В жизни люди одинакового роста могут иметь разный вес. Меру индивидуального разнообразия характеризует сигма регрессии. Формула:
, где
σ – среднее квадратическое отклонение изучаемого признака,
rxy – коэффициент корреляции.
По данным сигмы регрессии можно построить график (шкала регрессии), по которому возможно по росту найти и средний вес, и индивидуальное колебание веса.
Техника вычисления указанных коэффициентов приведены в соответствующей литературе.
Задачи
Задача 1
Влияние содержание уровня фтора в воде на заболеваемость кариеса
Зона | Средняя концентрация фтора, мг/л | Кол-во выявленных |
1 зона | 0,29±0,01 | |
2 зона | 0,60±0,02 | |
3 зона | 1,18±0,07 |
Определить коэффициент корреляции между содержанием фтора и кариесом зубов.
Задача 2
Влияние содержание уровня фтора в воде на флюороз
Район | Кол-во выявленных | Концентрация фтора, мг/л |
А | 1,8 | |
Б | 2,5 | |
В | 2,9 | |
Г | 1,7 |
Определить коэффициент корреляции между содержанием фтора и флюорозом.
Задача 3
Повозрастная заболеваемость пародонтоза у взрослого населения района «Н» за 2009 год
Возраст, лет | 20-24 | 25-29 | 30-34 | 35-39 | 40-49 | 50-59 | 60 и старше |
На 1000 населения | 26,4 | 25,6 | 19,6 | 34,2 | 29,6 | 17,4 |
Вычислить коэффициент регрессии заболеваемости населения. Определить ожидаемую заболеваемость в возрасте 25-39, 40-49 лет, начертите линию регрессии
Задача 4
Уровень холестерина по возрастным группам у обследованного мужского населения «Н» района
Возраст в годах | 20-29 | 30-39 | 40-49 | 50-59 | 60-69 | 70 и старше |
Холестерин в мг % | 185,1 | 195,0 | 238,0 | 217,5 | 204,0 | 233,7 |
Определить направление и силу связи между этими явлениями путем вычисления ранговой корреляции, оценить его достоверность и сделать соответствующие выводы.
Задача 5
Зависимость между длительностью охлаждения организма (2 часа ежедневно) и уровнем молочной кислоты в крови (мг %)
Дни охлаждения | ||||||||||
Молочная кислота в мг % | 77,0 | 77,0 | 77,2 | 77,1 | 88,5 | 88,9 | 88,7 | 99,0 | 99,5 | 99,3 |
Определить направление и силу связи между двумя показателями путем вычисления коэффициента корреляции и оценить его достоверность, вычислить коэффициент детерминации.
Задача 6