Правило сложения дисперсий

Дисперсия, как показатель вариации, может применяться в статистических рядах, где варианты совокупности сгруппированы по какому-либо признаку. Такой ряд состоит из признака-фактора (группированного) и признака-результата (результативного). Например, в качестве группированного признака для рабочих цеха могут выступать стаж работы, разряд (квалификация), в качестве результативного – выполнение норм выработки, средняя заработная плата.

Для измерения колеблемости результативного признака под влиянием разных условий, действующих в данной совокупности, рассчитывают три дисперсии:

– общую ( );

– межгрупповую ( );

– среднюю из групповых ( ).

 

Общая дисперсия характеризует вариацию результативного признака под влиянием всех условий, действующих в данной совокупности. В зависимости от вида ряда, общую дисперсию определяют по формулам для несгруппированных или сгруппированных признаков.

Межгрупповая дисперсия характеризует вариацию результативного признака под влиянием – признака-фактора, положенного в основу группировки:

, (7.23)

где – частота вариант в группах.

Для расчета средней из внутригрупповых дисперсий сначала определяют внутригрупповые дисперсии в каждой отдельной группе ( ) по формуле:

. (7.24)

Средняя из внутригрупповых дисперсий, которая характеризует случайную вариацию результативного признака, т.е. вариацию под влиянием всех прочих факторов, кроме группированного, рассчитывается по формуле:

. (7.25)

Поскольку общая колеблемость результативного признака определяется как колеблемость под влиянием группировочного признака и колеблемость под влиянием прочих факторов (кроме группировочного), то закономерно равенство:

. (7.26)

Представленная формула – это правило сложения дисперсий: общая дисперсия равна сумме межгрупповой дисперсии и средней из групповых.

На основе этих дисперсий можно рассчитать эмпирическое корреляционное отношение и коэффициент детерминации (причинности).

Эмпирическое корреляционное отношение ( ) показывает тесноту вязи между факторным и результативным признаками и рассчитывается по формуле:

. (7.27)

Оно изменяется то 0 до 1, и чем его значение ближе к 1, тем связь между признаками теснее.

Коэффициент детерминации (причинности) ( ) характеризует долю вариации результативного признака под влиянием признака-фактора, положенного в основу группировки. Формула расчета:

. (7.28)

Если межгрупповая дисперсия равна 0 ( ), это означает, что и коэффициент детерминации равен 0, следовательно, связь между факторным и результативным признаками полностью отсутствует. Полная связь между этими признаками ( ) будет в случае равенства общей и межгрупповой дисперсий ( ).

 

Рассмотрим определение разных видов дисперсий на примере 4.

Пример 4. Рабочие цеха сгруппированы по стажу работы в три группы. Со стажем работы связана квалификация рабочих (тарифный разряд). Данные представлены в табл. 7.3.

Таблица 7.3

Таблица группировка рабочих по стажу работы

Группы рабочих по стажу, лет Тарифный разряд рабочего Число рабочих, чел.
1-ая группа 0-5
2-ая группа 5-10
3-я группа 10 и более

Определите:

1.средний разряд рабочих в каждой группе и по трем группам вместе;

2.общую дисперсию тарифного разряда;

3.межгрупповую дисперсию тарифного разряда;

4.групповые дисперсии и среднюю из групповых;

5.коэффициент детерминации, эмпирическое корреляционное отношение.

Объясните смысл каждой дисперсии. Проверьте правило их сложения.

Решение:

1. Поскольку мы имеем дело со сгруппированными данными, отметим элементы ряда: варианты ( ) – тарифный разряд рабочего; частоты ( ) – число рабочих. Для расчета среднего разряда применим формулу средней арифметической взвешенной:

.

Расчет среднего тарифного разряда:

по 1-ой группе:

по 2-ой группе:

по 3-ей группе:

 

Средний тарифный разряд по всей совокупности рабочих составит:

Расчеты средних тарифных разрядов удобно выполнить во вспомогательной таблице, графа 3. В этой же таблице подготовим сведения для расчета дисперсий.