Показатели формы распределения
На практике приходится встречаться с самыми различными распределениями. Однородные совокупности характеризуются, как правило, одновершинным распределением. Многовершинность свидетельствует о неоднородности изучаемой совокупности. При изучении распределений, отличных от нормального, возникнет необходимость количественно оценить это различие. С этой целью вводят такие характеристики, как асимметрия и коэффициент эксцесса. Для нормального распределения эти характеристики равны нулю. Поэтому, если для изучаемого распределения асимметрия и эксцесс имеют небольшие значения, то можно предположить близость этого распределения к нормальному.
1) Коэффициент асимметрии определяется по формуле:
.
Если =0, то ряд симметричен относительно моды.
При >0 скошенность вправо, средняя арифметическая правее моды, «длинная часть» кривой распределения расположена справа от моды. При правосторонней асимметрии
.
При <0 скошенность влево, средняя арифметическая левее моды, «длинная часть» кривой распределения расположена слева от моды. При левосторонней асимметрии
.
Напомним, что мода – точка максимума дифференциальной функции распределения.
В нашем случае:
=–0,3.
Коэффициент асимметрии отрицательный, следовательно “длинная часть” кривой, полученной на основании опытных данных, расположена слева от моды и средняя арифметическая левее моды (рисунок 3). Заметим, что в нашем случае коэффициент асимметрии близок к нулю.
Рисунок 3. – Левосторонняя асимметрия.
2) Коэффициент эксцесса определяется по формуле:
.
Если эксцесс положительный, то кривая имеет более высокую и острую вершину, чем нормальная кривая (островершинное распределение); если эксцесс отрицательный, то сравниваемая кривая имеет более низкую и "плоскую" вершину, чем нормальная кривая (плосковершинное распределение).
Замечание: . Если
близок к –2, то кривая двухвершинная. При
кривая распадается на две островершинные кривые, что говорит о неоднородности статистического материала.
В нашем случае:
.
Коэффициент эксцесса отрицательный, следовательно, вершина кривой ряда распределения ниже, чем у кривой нормального распределения.
Рисунок 4. – Плосковершинное распределение.
6. Точечные и интервальные оценки параметров
генеральной совокупности
Задачи математической статистики практически сводятся к оценке свойств генеральной совокупности по результатам случайной выборки.
Любую функцию от результатов выборочных наблюдений
принято, называть статистикой (выборочной характеристикой). Статистики обычно и используются для построения статистических оценок параметров
генеральной совокупности, когда точные значения этих параметров нам неизвестны. Статистику
используемую как оценку параметра
, называют точечной оценкой. Из точечных оценок в приложениях математической статистики наиболее часто используют среднюю арифметическую
как оценку математического ожидания
, выборочную дисперсию
и среднее квадратическое отклонение
, как оценки генеральной дисперсии
и среднего квадратического отклонения
.
В математической статистике в зависимости от задачи статистику рассматривают либо как случайную величину, либо как число (конкретную реализацию случайной величины). Возникает вопрос, каким требованиям должны отвечать точечные оценки, чтобы их можно было считать в каком-то определенном смысле "хорошими". Эти требования характеризуют понятиями несмещенности, состоятельности и эффективности.
Оценку называют несмещенной, если при любом объеме выборки n ее математическое ожидание равно оцениваемому параметру
, то есть
=
.
В случае большой выборки оценка
параметра
называется состоятельной, если по мере роста числа наблюдений n (то есть
в случае конечной генеральной совокупности объемом N или при
в случае бесконечной генеральной совокупности) она стремится к оцениваемому параметру
.
Несмещенная оценка параметра
называется эффективной, если среди прочих несмещенных оценок того же параметра она обладает наименьшей дисперсией.
Точечные оценки параметров генеральной совокупности в нашем примере:
9,0548;
9,115;
9,097;
0,89;
0,7988;
9,8%;
–0,3;
–0,25.
Точечная оценка без указания степени точности и надежности малоинформативна, так как наблюдаемые значения статистики есть лишь значения случайной величины. Она может существенно отличаться от оцениваемого параметра при малом объеме выборки, что приводит к грубым ошибкам.
Интервальной оценкой параметра называют такой интервал
, относительно которого можно утверждать с определенной, близкой к единице вероятностью
, что он содержит неизвестное значение
. Величину
называют доверительной вероятностью или надежностью оценки параметра
,
,
– некоторые функции от результатов выборочных наблюдений
. Разность 2
=
–
между верхней и нижней границами доверительного интервала называют длиной доверительного интервала, а величину
– точностью оценки.
Для построения интервальных оценок необходимо знать закон распределения статистики .
На практике закон распределения генеральной совокупности неизвестен. В этом случае пользуются приближенным методом построения доверительных интервалов, суть которого в следующем: если считать, что распределение выборочных характеристик в больших выборках асимптотически нормалью (для дисперсии это справедливо при , а для средней арифметической при
), то доверительные интервалы строятся следующим образом
.
где – оцениваемый параметр;
* – выборочная оценка параметра;
– стандартные ошибки выборочной характеристики (главный член среднего квадратического отклонения);
– найденное по таблице значений функций Лапласа
, соответствующее доверительной вероятности
:
.
Стандартные ошибки:
а) выборочной средней :
б) выборочной дисперсии :
;
в) выборочного среднеквадратического отклонения :
г) выборочного коэффициента асимметрии :
д) выборочного коэффициента эксцесса :
е) выборочного коэффициента вариации :
ж) выборочной медианы :
.
В нашем примере при имеем следующие стандартные ошибки:
а) выборочной средней :
б) выборочной дисперсии :
в) выборочного среднеквадратического отклонения :
г) выборочного коэффициента асимметрии :
д) выборочного коэффициента эксцесса :
е) выборочного коэффициента вариации :
ж) выборочной медианы :
Построим доверительные интервалы для параметров генеральной совокупности нашего примера при .
1) Для математического ожидания:
,
8,879619 9,229981.
2) Для дисперсии:
,
0,776699 0,820985.
3) Для среднеквадратического отклонения:
,
0,769908 1,017651.
4) Для коэффициента асимметрии:
,
-0,78765 0,172362.
5) Для коэффициента эксцесса:
,
-1,25322 0,666792.
6) Для коэффициента вариации:
,
8,489497 11,25207.
7) Для медианы:
,
,
8,87744 9,31656.