Проверка статистических гипотез. Опр. Статистической гипотезой Н называется предположение относительно параметров или вида распределения СВ Х

Пусть Х – наблюдаемая СВ. Она может быть дискретной, а может и непрерывной.

Опр. Статистической гипотезой Н называется предположение относительно параметров или вида распределения СВ Х. Гипотеза Н называется простой, если она однозначно определяет распределение СВ Х, иначе Н называется сложной.

Если распределение СВ Х известно и по выборке наблюдений необходимо проверить предположение о значении параметров этого распределения, то такие гипотезы называются параметрическими. А гипотезы о виде распределения – непараметрические.

Проверяемая гипотеза называется нулевой гипотезой и обозначается Н0. Обязательно на ряду с Н0 рассматривают одну из альтернативных гипотез Н1.

При этом имеются различные ситуации для Н1.

; ; ; .

Выбор альтернативной гипотезы Н1 определяется конкретной формулировкой задачи.

Опр.Правило, по которому принимается решение принять или отклонить гипотезу Н0, называется критерием К. Так как решение принимается на основе выборки наблюдений СВ Х, то необходимо выбрать подходящую статистику, которую мы будем называть статистикой Z критерия К.Замечание.При проверке простой параметрической гипотезы Н0: q=q0 в качестве статистики критерия выбирают ту же статистику, что и для оценки параметра q, т.е. .Основной принцип при проверке статистической гипотезы: Маловероятные события считаются невозможными, а события, имеющие большую вероятность, считаются достоверными. Реализация этого принципа на практике. Перед анализом выборки фиксируется некоторая малая вероятность a, называемая уровнем значимости. Пусть V множества значений статистики Z, VK – подмножество множества значений статистики Z (VK £ V). Это такое подмножество, что при условии истинности гипотезы Н0, имеем вероятность того, что P{ZÎVkïH0}=a. Обозначим через zв – выборочное значение статистики Z, которое вычитается по конкретной выборке. Критерии К формулируется следующим образом.

Отклонить гипотезу Н0, если zвÎVk. Отклонить гипотезу Н0, если zвÎV \ Vk. Уровень значимости a определяет размер критической области, а ее положение зависит от альтернативной гипотезы Н1.

Z1–aквантиль распределения Z при условии, что верна гипотеза Н0.

Za квантиль распределения Z при условии, что верна гипотеза Н0.

Проверку параметрической гипотезы при помощи критерия значимости можно разбить на следующие этапы:1)сформулировать Н0 и Н1;2)назначить a;3)выбрать статистику Z для проверки Н0;4)определить выборочное распределение Z при условии, что верна Н0;5)определить VK (она зависит от Н1);6)получить выборку и вычислить zb ;7)принять статистическое решение: zвÎVk – отклонить Н0;

zвÎV \Vk – принять Н0.

Ошибки 1 и 2 рода

Статистическое решение может быть ошибочным. При этом различают ошибки I-го и II-го родов.Опр. Ошибкой первого рода называется ошибка, состоящая в том, что гипотеза Н0 отклоняется, когда Н0 – верна. Вероятность P{ZÎVkïH0}=a..ОпрОшибкой второго рода называется ошибка, состоящая в том, что принимается гипотеза Н0, но в действительности верна альтернативная гипотеза Н1. Вероятность ошибки второго рода при условии, что гипотеза Н1 – простая, P{ZÎV\VkïH1}=b.Проверка статистических гипотез и доверительных интервалов.Проверка гипотез с использованием критерия значимости может быть проведена на основе доверительных интервалов. При этом одностороннему критерию значимости будет соответствовать односторонний доверительный интервал, а двустороннему критерию значимости будет соответствовать, двусторонний доверительный интервал. Гипотеза Н0 – принимается, если значение q0 накрывается доверительным интервалом, иначе отклоняется.

 

 

55. Критерий и его применение.

Критерий применяется в частности для проверки гипотез о виде распределения генеральной совокупности.

Процедура применения критерия для проверки гипотезы H0, утверждающей, что СВ Х имеет закон распределения состоит из следующих этапов.

Этапы:

1. По выборке найти оценки неизвестных параметров предполагаемого закона .

2. Если Х–СВДТ – определить частоты , i = 1, 2, …, r, с которым каждое значение встречается в выборке.

Если Х–СВНТ – разбить множество значений на r – непересекающихся интервалов и попавших в каждый из этих интервалов .

3. Х–СВДТ вычислить .

Х–СВНТ вычислить .

4. .

5. Принять статистическое решение.

– гипотеза Н0 – принимается.

– гипотеза Н0 – отклоняется.

e – количество оцениваемых параметров.

Малочисленные частоты надо будет объединять.

Проверка гипотезы о равномерном распределении генеральной совокупности.

n = 200

А;

 

 

(xi-1, xi) ni  
2 – 4 a =0,05
4 – 6
6 – 8
8 – 10
10 – 12
12 – 14
14 – 16
16 – 18
18 – 20
20 – 22

 

1.

2.

17,3 0,79
0,8

k = 10 – 2 – 1 = 7

– нет основания отвергать гипотезу о том, что выборка взята из генеральной совокупности и имеет равномерное распределение.