Показатели структуры распределения
Форма распределения отражает характер последовательного изменения частот. Рассмотренные показатели центра распределения (см. § 5.2 - 5.3) не вскрывают характера последовательного изменения частот . Поэтому для отражения особенностей структуры распределения признака в совокупности используют квантили распределения.
Квантили (градиенты)- это значения признака, занимающие определенное место (каждое четвертое, пятое, десятое и т.д.) в упорядоченном вариационном ряду.
В результате квантили делят ряд распределения на равные по числу единиц части. Частными случаями квантилей являются: квартили, децили, квинтили, перцентели.
Квартили ( ) - это значения признака, делящие ранжированный ряд на четыре равные части (рис. 6.2).
Следовательно, в ряду распределения выделяют три квартиля:
- первый квартиль Q1 (нижний) – отделяет часть совокупности с наименьшими значениями признака;
- второй квартиль Q2 - делит распределение пополам и совпадает с медианой Ме;
- третий квартиль Q3 (верхний)– отсекает часть совокупности с наибольшими значениями признака.
Рис. 6.2. Распределение количества значений для квартилей и медианы
Вычисление квартилей аналогично вычислению медианы. В дискретном ряду сначала определяют положение или место квартили:
; ; .
Затем по накопленным частотам определяют численное значение квартилей.
В интервально ряду распределения сначала указывают интервал, в котором лежит квартиль. Затем определяют ее численное значение по формулам:
;
,
где: xQ1 и xQ3 - нижние границы квартильных интервалов;
SQ1 и SQ3 - накопленные частоты предквартильных интервалов;
fQ1 и fQ3 - частоты квартильных интервалов.
Пример.По данным табл. 5.3рассчитать квартили для распределения сотрудников по стажу работу.
Решение. Находим интервалы, содержащие первый и третий квартили:
> , следовательно, интервал от 3 до 6 содержит первый квартиль. Имеем,
лет. Это означает, что часть всех сотрудников имеет стаж до 3, 5 лет, а - больше, чем 3,5 лет.
Второй квартиль совпадает с медианой. Его значение равно = 6 лет.
> , следовательно, интервал от 6 до 9 содержит третий квартиль. Имеем,
лет. То есть, всех сотрудников имеет стаж до 7, 9 лет, а - больше, чем 7,9 лет.
Децили( ) -это варианты, делящие ранжированный ряд на десять равных частей. Вычисляются для интервального ряда в соответствии с указанными обозначениями по следующей схеме:
;
и т.д.
В ряду распределения выделяют девять децилей, так как медиана является одновременно пятым децилем. Децили находят широкое применение в анализе дифференциации различных социально-экономических явлений; вычисляются по той же схеме, что и квартили.
Квинтили – это значения признака, делящие ряд на пять равных частей. Определяются по той же схеме, что квартили и децили. Перцентили ( )– это значения признака, делящие ряд на 100 равных частей. Схема вычисления перцентилей вытекает из рассмотренной схемы для квинтилей. Очевидно, что , , .
6.5. Показатели формы распределения
Выяснение общего характера распределения предполагает оценку степени его однородности, а также оценку формы распределения.
При этом для обобщающей характеристики особенностей формы распределения применяется кривая распределения, т.е. графическое изображение эмпирического вариационного ряда в виде плавной кривой. Различают эмпирические и теоретические кривые распределения. Эмпирическая кривая распределения – это фактическая кривая распределения, построенная по исходным данным наблюдения. Теоретическая кривая распределения – это кривая распределения, выражающая общую закономерность данного типа распределения.
Таким образом, теоретическое распределение является идеализированной моделью эмпирического распределения. Можно предположить, что данному распределению соответствует определенная, характерная для него теоретическая кривая. Поэтому анализ вариационного ряда сводится к сопоставлению эмпирического и теоретического распределений. При этом выдвинув гипотезу о некоторой форме распределения, стремятся описать эмпирический ряд с помощью математической модели, выражающей теоретический закон распределения.
Теоретическое распределениеможет получиться при полном погашении случайных причин в результате увеличения числа наблюдений и уменьшения величины интервала. В статистике существует большое число теоретических распределений, но чаще всего используется симметричное (нормальное) распределение.
Если сравниваются теоретическое нормальное и эмпирическое распределения, то обязательно необходимо проверить соответствие формы распределения с помощью показателей асимметрии и эксцесса.
Исследование закономерностей (формы) распределения предполагает решение трех задач:
1) выяснение общего характера распределения;
2) выравнивание эмпирического распределения - построение на основе эмпирического распределения кривой с заданной формой;
3) проверка соответствий между полученным теоретическим и эмпирическим распределением.
Для характеристики формы распределения используются показатели симметричности распределения частот:
§ коэффициент асимметрии ;
§ показатель эксцесса Ek, который отражает крутизну (островершинность) распределения.
Расчет значений этих показателей основан на использовании моментов распределения.
Моменты распределения
Для подробного описания особенностей распределения используются дополнительные характеристики – моменты распределения.
В математической статистике под моментом к-го порядка называют среднюю арифметическую к-й степени отклонений отдельных вариантов от некоторой постоянной величины А:
где: - степень отклонения (порядок момента).
В зависимости от выбора постоянной величины А различают три вида моментов:
1. Если А = 0, то моменты называются начальными (Мk);
2. Если А = , то моменты называются центральными ( ).
3. Если А 0, а равно некоторой произвольной величине (начало отсчета), то моменты называются условными ( );
При анализе вариационных рядов практически ограничиваются расчетом моментов первых четырех порядков (табл. 6.4).
Таблица 6.4