Проверка гипотезы о виде распределения
Пусть - выборка объема
, представляющая собой результат
независимых наблюдений над случайной величиной
, относительно распределения которой выдвинута простая гипотеза
( - теоретическая функция распределения, соответствующая гипотезе
). Наиболее распространенным критерием проверки этой гипотезы
является критерии
Пирсона.
Чтобы воспользоваться критерием Пирсона, выборочные данные
следует предварительно сгруппировать, представив их в виде интервального статистического ряда. Пусть
-интервалы группировки;
- частоты попадания выборочных значений в интервалы
соответственно (
).
Обозначим теоретическую (соответствующую
) вероятность попадания случайной величины
в интервал
.
Статистикой критерия является величина:
,
которая характеризует отклонение эмпирической функции распределения от теоретической функции распределения
(значение
является приращением эмпирической функции
на интервале
, а
- приращением теоретической функции
на том же интервале). Поскольку относительные частоты
сближаются с вероятностями
при
, то в случае справедливости гипотезы
значение величины
не должно существенно отличаться от нуля. Поэтому критическая область критерия
задается в виде
, где
– значение величины
, полученное для заданной выборки, а порог
определяется по заданному уровню значимости
так, чтобы
. Нахождение
основано на том факте (известном как теорема Пирсона), что случайная величина
имеет при
предельное распределение хи - квадрат
с
степенью свободы.
На практике предельное распределение можно использовать с хорошим приближением при
и
. При выполнении этих условий для заданного уровня значимости
можно положить
, где
является (1—
)-квантилью распределения
.
Таким образом, критерий согласия Пирсона состоит в следующем:
1. По заданному уровню значимости находится по табл. П4 порог
.
2. По заданной выборке объема
определяется число
интервалов группировки так, чтобы
. Вычисляется значение статистики
.
3. Если , то гипотезу
отвергают.
4. Если , то гипотезу
принимают.
Если случайная величина дискретная,
- различные выборочные значения, а
в случае справедливости
, то всегда можно определить
интервалов, содержащих ровно по одному выборочному значению. Поэтому в данном случае можно сразу считать, что
, где
– частота выборочного значения
.
На практике теоретическое распределение полностью бывает определено редко. Чаще известен предположительно только тип распределения, но неизвестны параметры его определяющие. В этом случае гипотеза о виде распределения, подлежащая проверке, имеет вид и является сложной параметрической гипотезой.
Критерий согласия Пирсона применим для проверки такой гипотезы
со следующими изменениями:
а) вероятности ,
вычисляют, заменяя неизвестные параметры
их оценками максимального правдоподобия
:
;
б) число степеней свободы предельного распределения хи - квадрат должно быть уменьшено на число неизвестных параметров и считаться равным .