Критерий однородности выборок
Имеется
независимых выборок, объемом ni каждая (i=1,2,…,
);
.
H0: выборки извлечены из одной и той же совокупности (т.е. выборки однородны)
Н1: выборки неоднородны.
Критерий проверки гипотезы
- случайная величина, имеющая
2 – распределение с
степенями свободы.
Алгоритм проверки основной гипотезы
:
1) данные каждой выборки группируются в
одиночных групп (интервалов); подсчитывают число mij наблюдений из i-й выборки, попавших в j-ю группу:

2) подсчитывают вероятность pj принадлежности отдельного результата к каждой группе:
;
затем вычисляют ожидаемые частоты 
3) вычисляют величину 
При
>5 это
2 – распределение с
степенями свободы.
4) если
- гипотезу H0 принимают.
если
- гипотезу H0 отвергают.
§15. Проверка гипотезы о виде распределения случайной величины. Критерий согласия
(хи – квадрат)
Критерий согласия – это критерий проверки гипотезы о предполагаемом неизвестном распределении. Рассмотрим критерий Пирсона, который отвечает на вопрос: «Значимо ли расхождение эмпирических иК теоретических частот?».
Оценкой функции плотности распределения случайной величины Х служит относительная частота -
, где
– объем выборки;
- число наблюдений попавших в интервал
, на которые разбита вся числовая прямая. По гистограмме делают предположения о законе распределения (при подходящем выборе шага
, она напоминает функцию плотности
случайной величины Х)
Пусть Х и Y – независимые выборки.
Выдвигаем основную гипотезу:
H0: случайная величина Х подчиняется закону распределения F(x).
Н1: случайная величина Х не подчиняется закону распределения F(x).
Алгоритм проверки основной гипотезы:
1) вся область разбивается на k интервалов
(в каждом
должно не меньше 5 наблюдений);
ni – эмпирическое количество элементов, попавших в
(эмпирическая частота)
2) вычисляем вероятность
по известной функции F(x) при условии справедливости основной гипотезы
;
- теоретическое количество значений случайной величины, попавших в интервал
( теоретическая частота или выравнивающая частота)
|
| … |
|
|
| … |
|
|
| … |
|
3) в качестве меры расхождения между эмпирическими и теоретическими частотами используют критерий
Пирсона:
,
где
- теоретические частоты.
4) находят наблюдаемое значение критерия 
По таблице
- распределения находят критическую точку
- число степеней свободы,
- количество параметров, вычисленных по выборке;
- уровень значимости).
Если
гипотезу H0 отвергают.
Если
гипотезу H0 принимают.
В частности, если предполагать, что генеральная совокупность распределена нормально, то выравнивающие частоты могут быть найдены по формуле:
n =
|
где n – объем выборки; h – шаг выборки; sВ - выборочное среднее квадратическое отклонение; zi=
(
- выборочная средняя); j(z)=
- плотность нормированного нормального распределения .
1.
Замечание:объем выборки должен быть достаточно велик (n³50). Причем критерий только дает согласие, поэтому для улучшения можно повторить опыт, увеличить число наблюдений и т.д.
Пример 34. Дано статистическое распределение выборки: в первой строке указаны выборочные варианты хi , а во второй строке – соответственные частоты ni количественного признака Х). Требуется, пользуясь критерием Пирсона, при уровне значимости a=0,05, установить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с данными выборки объема n=100.
| хi | |||||||
| ni |
Решение: Для применения критерия Пирсона составим таблицу:
| xi | zi=
=
| j(zi) | n
| ni | n - ni
|
|
| -1,90 | 0,0656 | 5,19 | 0,19 | 0,01 | ||
| -1,11 | 0,2155 | 17,06 | 2,06 | 0,25 | ||
| -0,32 | 0,3790 | 29,96 | -10,04 | 3,36 | ||
| 0,47 | 0,3572 | 28,24 | 3,24 | 0,37 | ||
| 1,26 | 0,1804 | 14,26 | 6,26 | 2,75 | ||
| 2,06 | 0,0478 | 3,78 | -0,22 | 0,01 | ||
| 2,85 | 0,0069 | 0,55 | -2,45 | 10,91 | ||
|
Здесь:
=284, sВ = =12,65 вычислены в примере 33; n=100 по условию; h=270-260=10 – шаг выборки; n
=
=
=79,05×j(zi).
Таким образом, получаем, что
=17,66.
По таблице критических точек распределения
приложения 4 при заданном a=0,05 и k = s – 3 = 7 – 3 = 4 (s – число групп выборки) находим
(a; k)=
(0,05; 4)=9,5.
Т.к.
>
(17,66 > 9,5), то гипотеза о нормальном распределении генеральной совокупности не согласуется с данными выборки.
Ответ: гипотеза не согласуется с данными выборки.
| Лекция 3 | Статистический анализ. Регрессионный и корреляционный анализ. Корреляция и причинная зависимость, коэффициент корреляции. Регрессионные модели. Множественная линейная регрессия |