Правило сложения дисперсий
Дисперсия, как показатель вариации, может применяться в статистических рядах, где варианты совокупности сгруппированы по какому-либо признаку. Такой ряд состоит из признака-фактора (группированного) и признака-результата (результативного). Например, в качестве группированного признака для рабочих цеха могут выступать стаж работы, разряд (квалификация), в качестве результативного – выполнение норм выработки, средняя заработная плата.
Для измерения колеблемости результативного признака под влиянием разных условий, действующих в данной совокупности, рассчитывают три дисперсии:
– общую (
);
– межгрупповую (
);
– среднюю из групповых (
).
Общая дисперсия характеризует вариацию результативного признака под влиянием всех условий, действующих в данной совокупности. В зависимости от вида ряда, общую дисперсию определяют по формулам для несгруппированных или сгруппированных признаков.
Межгрупповая дисперсия характеризует вариацию результативного признака под влиянием – признака-фактора, положенного в основу группировки:
, (7.23)
где
– частота вариант в группах.
Для расчета средней из внутригрупповых дисперсий сначала определяют внутригрупповые дисперсии в каждой отдельной группе (
) по формуле:
. (7.24)
Средняя из внутригрупповых дисперсий, которая характеризует случайную вариацию результативного признака, т.е. вариацию под влиянием всех прочих факторов, кроме группированного, рассчитывается по формуле:
. (7.25)
Поскольку общая колеблемость результативного признака определяется как колеблемость под влиянием группировочного признака и колеблемость под влиянием прочих факторов (кроме группировочного), то закономерно равенство:
. (7.26)
Представленная формула – это правило сложения дисперсий: общая дисперсия равна сумме межгрупповой дисперсии и средней из групповых.
На основе этих дисперсий можно рассчитать эмпирическое корреляционное отношение и коэффициент детерминации (причинности).
Эмпирическое корреляционное отношение (
) показывает тесноту вязи между факторным и результативным признаками и рассчитывается по формуле:
. (7.27)
Оно изменяется то 0 до 1, и чем его значение ближе к 1, тем связь между признаками теснее.
Коэффициент детерминации (причинности) (
) характеризует долю вариации результативного признака под влиянием признака-фактора, положенного в основу группировки. Формула расчета:
. (7.28)
Если межгрупповая дисперсия равна 0 (
), это означает, что и коэффициент детерминации равен 0, следовательно, связь между факторным и результативным признаками полностью отсутствует. Полная связь между этими признаками (
) будет в случае равенства общей и межгрупповой дисперсий (
).
Рассмотрим определение разных видов дисперсий на примере 4.
Пример 4. Рабочие цеха сгруппированы по стажу работы в три группы. Со стажем работы связана квалификация рабочих (тарифный разряд). Данные представлены в табл. 7.3.
Таблица 7.3
Таблица группировка рабочих по стажу работы
| Группы рабочих по стажу, лет | Тарифный разряд рабочего | Число рабочих, чел. |
| 1-ая группа 0-5 | ||
| 2-ая группа 5-10 | ||
| 3-я группа 10 и более |
Определите:
1.средний разряд рабочих в каждой группе и по трем группам вместе;
2.общую дисперсию тарифного разряда;
3.межгрупповую дисперсию тарифного разряда;
4.групповые дисперсии и среднюю из групповых;
5.коэффициент детерминации, эмпирическое корреляционное отношение.
Объясните смысл каждой дисперсии. Проверьте правило их сложения.
Решение:
1. Поскольку мы имеем дело со сгруппированными данными, отметим элементы ряда: варианты (
) – тарифный разряд рабочего; частоты (
) – число рабочих. Для расчета среднего разряда применим формулу средней арифметической взвешенной:
.
Расчет среднего тарифного разряда:
по 1-ой группе:

по 2-ой группе:

по 3-ей группе:

Средний тарифный разряд по всей совокупности рабочих составит:

Расчеты средних тарифных разрядов удобно выполнить во вспомогательной таблице, графа 3. В этой же таблице подготовим сведения для расчета дисперсий.