Статистическое исследование зависимости между качественными признаками

 

Для исследования зависимости между качественными признаками могут быть использованы методы группировки, методы дисперсионного анализа, коэффициенты ранговой корреляции и специфические показатели степени тесноты связи между качественными признаками (коэффициент ассоциации, коэффициент контингенции и др.). При этом следует иметь в виду, что коэффициент ассоциации и коэффициент контингенции применимы для оценки степени тесноты связи только между альтернативными признаками. Здесь полезно вспомнить, что именно такие качественные признаки характерны экономическим явлениям и процессам.

Коэффициент ассоциации вычисляется по следующей формуле

 

.

 

Параметры a, b, c, d определяются построением так называемой таблицы «четырех полей».

Рассмотрим пример. Необходимо выявить существует ли связь между выполнением норм выработки рабочими предприятия и техническим уровнем их обучения. Исходные данные:

 

Группа рабочих Число рабочих мест, чел
выполняющих и перевыполняющих норму не выполняющие норму Всего
1. Прошедшие техническое обучение
2. Не прошедшие техническое обучение
Итого

 

Представим эту таблицу в форме «таблицы четырех полей»

 

a b a+b
c d c+d
a+c b+d  

 

Для нашего примера имеем .

Можно говорить о наличии весьма тесной прямой связи между данными качественными признаками.

Если , то коэффициент ассоциации равен нулю. Практически считается, что величина свидетельствует о наличии связи между изучаемыми качественными признаками.

Недостатком является то, что если хотя бы один из четырех показателей «таблицы четырех полей» равен нулю (т.е. отсутствует), то , что дает преувеличенное представление о степени тесноты связи между изучаемыми качественными признаками.

Коэффициент контингенции дает более точную оценку степени тесноты связи и вычисляется также на основании данных «таблицы четырех полей» по формуле

 

.

 

По вышеприведенным данным величина составляет

 

.

 

Следует иметь в виду, что всегда меньше .

Практически наличие связи между изучаемыми альтернативными признаками считается подтвержденным при величине не ниже 0,3.

Для использования коэффициентов корреляции рангов необходимо признаки, хотя и качественные, упорядочить, например, по балловым (бальным) оценкам. Как пример такого подхода можно вспомнить уровень квалификации работников.

Для оценки степени тесноты связи между несколькими качественными признаками при использовании рангов применяется коэффициент конкордации , вычисляемый по формуле

 

,

 

где m – число факторов (признаков);

n – число ранжируемых единиц;

S – сумма квадратов степеней рангов.

Если обозначить ранг i-го фактора у j-й единицы, то величина S будет равна

.

 

Рассмотрим вычисление коэффициента конкордации на учебном примере.

 

Пример. По приведенным в таблице данным оценить множественную связь

 

Порядковый номер предприятия Ранг по показателю
Уровня рентабельности Уровня качества Уровня спроса

Окончание табл.

Итого - - -

 

Из таблицы можно определить сумму квадратов отклонений рангов

 

.

 

Величина составляет

 

.

 

Это свидетельствует о наличии достаточно тесной зависимости между изучаемыми признаками.