Коэффициенты взаимной сопряженности К. Пирсона

И коэффициент взаимной сопряженности А. А. Чупрова

Коэффициенты взаимной сопряженности Пирсона и Чуп-

Рова используются в том случае, если по каждому из взаимо-

Связанных признаков выделяется число групп более двух. Факт

наличия связи устанавливается с помощью критерия χ2.

, (10.51)

где μij — фактическая (эмпирическая) клеточная частота, т. е.

число единиц с i-м значением признака x и j-м значением при-

знака y;

— теоретическая клеточная частота, которая отвечает

предположению о независимости признаков x и y, т. е. отсутс-

Твию связи.

Теоретическую клеточную частоту находят по формуле

, (10.52)

Т. е. итог по строке надо умножить на итог по столбцу и разде-

Лить на общее число данных.

Сумма теоретических частот всех клеток таблицы равна

общему числу наблюдений n. Сумма теоретических частот по

строкам и столбцам соответственно равна μi и μj. Поэтому, те-

Оретические частоты — это перераспределение исходных дан-

Ных в том предположении, что связь между изучаемыми при-

знаками x и y отсутствует. Значение χ2 показывает, насколько

Велико расхождение реальных частот с теми, которые были бы

в том случае, если изучаемые признаки x и y не зависели бы

Друг от друга. Данное расхождение будет всегда, поэтому есть

таблица критических значений критерия χ2 (мы ей уже поль-

Зовались, когда проверяли гипотезу о нормальном распределе-

Нии и значимость коэффициента конкордации). Распределение

χ2 зависит от уровня значимости б, которое назначается иссле-

Дователем и от числа степеней свободы

v = (k1 − 1)(k2 − 1),

где k1 — число категорий признака x (число строк таблицы);

k2 — число категорий признака y (число столбцов таб-

Лицы).

Найденное по формуле (10.51) значение χ2 сравнивается с

Табличным при принятом уровне значимости и данном числе

степеней свободы. Если χ2 > , то делается вывод о наличии

связи между признаками x и y. В том случае, если χ2 ≤ , гипо-

теза о независимости x и y не отклоняется, т. е. наличие связи

между признаками x и y не может считаться доказанным.

Используем данные примера 10.3 и сделаем вывод о нали-

Чии или отсутствии зависимости успеваемости студентов-ве-

Черников от соответствия профиля работы.

Для этого используем критерий χ2. Сначала найдем теоре-

тические клеточные частоты:

;

;

;

.

Теперь по формуле (10.51) находим:

Количество степеней свободы в данном случае будет равно:

v = (2 − 1)(2 − 1) = 1, так как k1 = k2 = 2.

Принимаем 5%-ный уровень значимости (α = 0,05) и по

таблице критерия χ2 (приложение 6) находим: = 3,84. Так

как χ2 > , то делаем вывод, что распределение неслучайно и

Скорее всего связанно с зависимостью между признаками, ко-

Торые положены в основу группировки. Следовательно, можно

Говорить о зависимости между характером работы студентов

Вечерников и результатами сдачи ими экзаменов по специаль-

Ным предметам.

Для измерения тесноты имеющейся связи между изуча-

Емыми признаками используют коэффициенты взаимной со-

Пряженности Пирсона и Чупрова. Коэффициент взаимной со-

Пряженности К. Пирсона находится по формуле

, (10.53)

Где .

Данный коэффициент не принимает во внимание число ка-

тегорий для изучаемых признаков x и y.

Более совершенным и точным является коэффициент вза-

Имной сопряженности А. А. Чупрова, который вычисляется по

следующей формуле:

. (10.54)

Оба приведенных нами коэффициента взаимной сопря-

женности основаны на нормировании χ2: погашении зависи-

Мости от числа наблюдений и размерности таблицы. Данные

коэффициенты принимают все свои значения на отрезке [0, 1],

причем КЧвз, если таблица не квадратная, никогда не достигает

Единицы.

Приведем конкретный пример вычисления коэффициен-

Тов взаимной сопряженности Пирсона и Чупрова.

Пример 10.4

Пусть известно распределение 500 участков, засеянных

сахарной свеклой, по двум признакам: степени полива (х) и

уровню урожайности (y) (табл. 10.11).

Необходимо определить, случайно ли данное распределе-

ние (см. табл. 10.11) и существует ли зависимость между x и y.