Виды дисперсий. Правило сложения дисперсий

Вариация результативного признака обусловлена действием различных факторов, оценить влияние некоторых из них можно, разбив статистическую совокупность на группы по факторному признаку. Тогда вместе с изучением общей вариации признака в совокупности становится возможным изучить вариацию признака в каждой из составляющих её групп, а также между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации осуществляется с использованием трёх видов дисперсий.

1. Общая дисперсия характеризует вариацию результативного признака в совокупности в результате действия всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака от общей средней и может быть вычислена по формулам:

простая дисперсия для несгруппированных данных

взвешенная дисперсия для вариационного ряда

2. Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней :

где f – численность единиц в группе.

3. Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть общей вариации, обусловленную влиянием неучтённых факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы xi (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная по соответствующим формулам:

простая дисперсия для несгруппированных данных ;

взвешенная дисперсия для вариационного ряда – .

На основании внутригрупповой дисперсии по каждой группе , можно определить среднюю из внутригрупповых дисперсий :

Между всеми указанными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий, — общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии:

Другими словами, общая вариация признака в совокупности складывается из вариации признака внутри отдельных групп, вызванной действием всех неучтённых факторов, и вариации между группами, являющейся результатом действия только одного группировочного признака.

Для количественной оценки силы влияния признака, положенного в основание группировки, на образование общей вариации результативного признака в статистике используется эмпирический коэффициент детерминации:

Очевидно, что чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние признака, положенного в основание группировки, на изменчивость (вариацию) результативного (изучаемого) признака. При отсутствии связи между признаками эмпирический коэффициент детерминации равен нулю, при функциональной зависимости равен 1.

Эмпирическое корреляционное отношение – это корень квадратный из эмпирического коэффициента детерминации:

.

Этот показатель используется для оценки тесноты связи между группировочным и результативным признаками. Принимает значение от 0 до 1. Если связь отсутствует, то эмпирическое корреляционное значение равно 0, т.е. все групповые средние равны между собой и межгрупповая вариация отсутствует. Значит, факторный признак, положенный в основание группировки, никак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение равно 1. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповая дисперсия отсутствует. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. Чем ближе значение корреляционного отношения к единице, тем теснее и ближе к функциональной связь между признаками.

Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чэддока:

Ŋ 0,1–0,3 0,3 –0,5 0,5–0,7 0,7–0,9 0,9–0,99
Сила связи слабая умеренная заметная тесная весьма тесная