Статистическое исследование зависимости между качественными признаками
Для исследования зависимости между качественными признаками могут быть использованы методы группировки, методы дисперсионного анализа, коэффициенты ранговой корреляции и специфические показатели степени тесноты связи между качественными признаками (коэффициент ассоциации, коэффициент контингенции и др.). При этом следует иметь в виду, что коэффициент ассоциации и коэффициент контингенции применимы для оценки степени тесноты связи только между альтернативными признаками. Здесь полезно вспомнить, что именно такие качественные признаки характерны экономическим явлениям и процессам.
Коэффициент ассоциации
вычисляется по следующей формуле
.
Параметры a, b, c, d определяются построением так называемой таблицы «четырех полей».
Рассмотрим пример. Необходимо выявить существует ли связь между выполнением норм выработки рабочими предприятия и техническим уровнем их обучения. Исходные данные:
| Группа рабочих | Число рабочих мест, чел | ||
| выполняющих и перевыполняющих норму | не выполняющие норму | Всего | |
| 1. Прошедшие техническое обучение | |||
| 2. Не прошедшие техническое обучение | |||
| Итого |
Представим эту таблицу в форме «таблицы четырех полей»
| a | b | a+b |
| c | d | c+d |
| a+c | b+d |
Для нашего примера имеем
.
Можно говорить о наличии весьма тесной прямой связи между данными качественными признаками.
Если
, то коэффициент ассоциации равен нулю. Практически считается, что величина
свидетельствует о наличии связи между изучаемыми качественными признаками.
Недостатком
является то, что если хотя бы один из четырех показателей «таблицы четырех полей» равен нулю (т.е. отсутствует), то
, что дает преувеличенное представление о степени тесноты связи между изучаемыми качественными признаками.
Коэффициент контингенции
дает более точную оценку степени тесноты связи и вычисляется также на основании данных «таблицы четырех полей» по формуле
.
По вышеприведенным данным величина
составляет
.
Следует иметь в виду, что
всегда меньше
.
Практически наличие связи между изучаемыми альтернативными признаками считается подтвержденным при величине
не ниже 0,3.
Для использования коэффициентов корреляции рангов необходимо признаки, хотя и качественные, упорядочить, например, по балловым (бальным) оценкам. Как пример такого подхода можно вспомнить уровень квалификации работников.
Для оценки степени тесноты связи между несколькими качественными признаками при использовании рангов применяется коэффициент конкордации
, вычисляемый по формуле
,
где m – число факторов (признаков);
n – число ранжируемых единиц;
S – сумма квадратов степеней рангов.
Если обозначить
ранг i-го фактора у j-й единицы, то величина S будет равна
.
Рассмотрим вычисление коэффициента конкордации
на учебном примере.
Пример. По приведенным в таблице данным оценить множественную связь
| Порядковый номер предприятия | Ранг по показателю
|
|
| ||
| Уровня рентабельности | Уровня качества | Уровня спроса | |||
Окончание табл.
| Итого | - | - | - |
Из таблицы можно определить сумму квадратов отклонений рангов
.
Величина
составляет
.
Это свидетельствует о наличии достаточно тесной зависимости между изучаемыми признаками.