Приведите примеры нулевой, альтернативной, простой и сложной гипотез. Объясните, в чем состоит принцип проверки нулевых гипотез с помощью статистических критериев значимости

Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н0. Наряду с этой гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н1. Если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.

Гипотезуназывают простой, если она однозначно характеризует параметр распределения случайной величины. Например, если l является параметром экспоненциального распределения, то гипотеза Н0 о равенстве l =10–простая гипотеза. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Сложная гипотеза Н0 о неравенстве l >10 состоит из бесконечного множества простых гипотез Н0 о равенстве l =bi , где bi – любое число, большее 10. Гипотеза Н0 о том, что математическое ожидание нормального распределения равно двум при неизвестной дисперсии, тоже является сложной.

Принцип проверки нулевых гипотез состоит в следующем:

- нулевую гипотезу отвергают, если наблюдаемое значение критерия принадлежит критической области;

- гипотезу принимают, если наблюдаемое значение критерия принадлежит области принятия гипотезы.

 

1) Что называется ошибкой первого рода, второго рода, уровнем значимости?

Ошибка первого рода состоит в том, что отвергается правильная гипотеза.

Вероятность ошибки первого рода называют уровнем значимости α.

Ошибка второго рода заключается в том, что принимается неправильная гипотеза. Вероятность ошибки второго рода принято обозначать β.

 

2) Как находятся критические точки (квантили) статистических критериев значимости в случае двусторонней и в случае правосторонней критической области?

Для нахождения критической области задается уровень значимости α и находится критическая точка исходя из таких соотношений, когда kкр > 0:

- для двусторонней симметричной области P (K > kкр) = α / 2 и P (K < - kкр) = α / 2

- для правосторонней области P (K > kкр) = α..

 

3) Что называется критерием согласия?

Критерием согласияназывают критерий, который позволяет установить, является ли расхождение эмпирическогоитеоретическогораспределений случайным или значимым, т. е. согласуются ли данные наблюдений с выдвинутой статистической гипотезой или не согласуются.

Дайте общую схему проверки гипотезы о виде функции распределения с помощью критерия согласия Пирсона.

Чтобы при уровне значимости α проверить гипотезу о нормальном распределении генеральной совокупности надо:

1) вычислить выборочную среднюю x и выборочное среднеквадратическое отклонение S, причем в качестве вариант Ci принимают среднее арифметическое концов интервала

Ci = (xi + xi+1) / 2

2) пронормировать X, т.е. перейти к случайной величине u = (X – x) / S и вычислить ui = (xi – x) / S и ui+1 = (xi+1 – x) / S, причем наименьшее значение u, т.е. u1 полагают равным -∞, а наибольшее значение uk+1 полагают равным +∞, т.е. u1 = -∞, uk+1 = +∞

3) вычислить теоретические частоты ni* = n · Pi,

где n – объем выборки, Pi – функция, равная Ф(ui+1) – Ф(ui) – это вероятность попадания X в интервал (xi ; xi+1), а Ф(u) – это функция Лапласа.

4) сравнить эмпирические и теоретические частоты с помощью критерия Пирсона.

5) На основании каких признаков или критериев можно сделать предварительный выбор закона распределения?

Наглядное представление о статистическом распределении дают полигон и гистограмма.

Полигоном называют ломаную, отрезки которой соединяют точки

(x1 ; n1), (x2 ; n2),…, (xk ; nk) или [(x1 ; w1), (x2 ; w2),…, (xk ; wk)]

Гистограммой называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы h, а высоты равны отношению ni / h (отношение частоты к длине частичного интервала называют плотностью частоты).