Критерии согласия. Проверка гипотез о виде функции

Распределения

 

 

В одних случаях закон распределения может быть установлен теоретически на основании выбранной модели рассматриваемого процесса. В других случаях функцию распределения выбирают априорно. Однако для получения надёжных решений вероятностных задач в каждом отдельном случае необходима проверка соответствия опытных данных используемому закону распределения.

Наиболее простым, но весьма приближённым методом оценки согласия результатов эксперимента с тем или иным законом распределения является графический метод. Опытные данные сравнивают с графиком принятой функции распределения. Если экспериментальные точки ложатся вблизи кривой со случайными отклонениями влево и вправо, то опытные данные соответствуют рассматриваемому закону. Данный способ является субъективным и используется на практике лишь в качестве первого приближения.

Критерий согласия Пирсона (χ2)применяют для проверки гипотезу о соответствии эмпирического распределения предполагаемому теоретическому распределению при большом объёме выборки (n ≥ 100). Критерий применим для любых видов функций, даже при неизвестных значениях их параметров.

Использование критерия χ2 предусматривает разбиение размаха варьирования выборки на интервалы и определения числа наблюдений (частоты) nj для каждого из e интервалов. Для удобства оценок параметров распределения интервалы выбирают одинаковой длины.

Число интервалов зависит от объёма выборки. Обычно принимают: при n = 100 e = 10 … 15, при n = 200 e = 15 … 20, при n = 400 e = 25 … 30, при n = 1000 e = 35 … 40.

Интервалы, содержащие менее пяти наблюдений объединяют с соседними.

Статистикой критерия Пирсона служит величина

χ2 = , (3.30)

где pj – вероятность попадания изучаемой случайной величины в j-й интервал, вычисляемая в соответствии с гипотетическим законом распределения. При вычислении вероятности pj нужно иметь в виду, что левая граница первого интервала и правая последнего должны совпадать с границами области возможных значений случайной величины. Например, при нормальном распределении первый интервал простирается до –∞, а последний – до +∞.

Если выполняется неравенство

χ2 ≤ χ2α, (3.31)

при уровне значимости α и числе степеней свободы k = em – 1, (m – число параметров, оцениваемых по рассматриваемой выборке, для нормального закона распределения m = 2), то нулевую гипотезу не отвергают. При несоблюдении указанного неравенства принимают альтернативную гипотезу о принадлежности выборки неизвестному распределению.

Недостатком критерия согласия Пирсона является потеря части первоначальной информации, связанная с необходимостью группировки результатов наблюдений в интервалы. В связи с этим рекомендуется дополнять проверку соответствия распределения по критерию χ2 другими критериями. Особенно это необходимо при сравнительно малом объёме выборки (n ≈ 100).

Пример 3.9. Проверить с помощью критерия согласия χ2 гипотезу о нормальном распределении данных в примере 2.2. Принять уровень значимости α = 0,05.

Оценка вероятности попадания значения характеристики в интервал (6-ой столбец) представляет собой разность значений функций Лапласа на правой и левой границе интервала. Если интервалы объединяются, вычисляют разность значений функции на границах объединённого интервала. Сумма чисел pj в 6 столбце всегда будет равна единице. Сумма в 7 столбце должна равняться сумме в 3-м столбце.

Таблица 3.6

j Границы интервала xj Число наблюдений nj Координаты границ интервалов = Значение функции Лапласа на границе интервала Ф( ) Оценка вероятности попадания в интервал pj npj
5,825; 5,975 –∞; –1,24 0,000; 0,1075 0,1075 10,75 0,984
5,975; 6,125
6,125; 6,275 –1,24; –0,76 0,1075; 0,2236 0,1161 11,61 0,223
6,275; 6,425 –0,76; –0,29 0,2236; 0,3859 0,1623 16,23 0,643
6,425; 6,575 –0,29; 0,19 0,3859; 0,5753 0,1894 18,94 0,224
6,575; 6,725 0,19; 0,67 0,5753; 0,7486 0,1733 17,33 0,006
6,725; 6,875 0,67; 1,14 0,7486; 0,8729 0,1243 12,43 0,198
6,875; 7,025 1,14; 1,61 0,8729; 0,9463 0,0734 7,34 0,244
7,025; 7,175 1,61; ∞ 0,9463; 1,0000 0,0537 5,37 0,025
7,175; 7,325
7,325; 7,475
Сумма 1,0000   χ2 = 2,547

 

Для α=0,05 и k = 8 – 2 –1 = 5(8 – число интервалов после объединения, 2 – число параметров, оцениваемых по выборке ( , s))

χ2 = 2,547 < χ20,05 =11,1

Заключение: опытные данные не противоречат нормальному закону распределения.

 

Таблица 3.7 – Значение нормированной функции нормального распределения (функции Лапласа)

z Сотые доли z
0,0 0,50000*
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
Примечание. Ф(–z) = 1 – Ф(z) * У всех остальных значений функции Лапласа разряд целых также равен нулю, и поэтому в таблице приведены только десятичные знаки

Приложение А