Статистические гипотезы и правила их проверки. Статистические критерии

Основные типы гипотез, проверяемых в ходе статистического анализа и моделирования

Гипотезы о типе закона распределения исследуемой случайной величины

Гипотезы об однородности двух или нескольких обрабатываемых выборок или некоторых характеристик анализируемых совокупностей

Гипотезы о числовых значениях параметров исследуемой генеральной совокупности

Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками

Понятие статистической гипотезы

Пусть - независимая повторная выборка объема из некоторой генеральной совокупности с неизвестной функцией распределения .

Под статистической гипотезой понимается всякое предположение о виде или параметрах неизвестного закона распределения.

Гипотеза есть определенное утверждение, которое по отношению к реальной ситуации является или истинным, или ложным высказыванием.

Простой статистической гипотезой называется предположение о соответствии неизвестной функции распределения некоторому конкретному распределению вероятностей.

Сложной статистической гипотезой называется предположение о том, что неизвестное распределение принадлежит некоторому множеству распределений, состоящему более чем из одного элемента.

Если удается выдвинуть две взаимоисключающие статистические гипотезы, содержащих в своей совокупности верное суждение о неизвестном распределении, то проверяемую гипотезу принято называть основной (или нулевой), а противоположную гипотезу - альтернативой (или конкурирующей гипотезой).

Этапы проверки статистических гипотез

Формулировка основной гипотезы H0 и конкурирующей гипотезы H1. Гипотезы должны быть чётко формализованы в математических терминах.

Задание уровня значимости α, отвечающей ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.

Расчёт статистики K критерия.

Построение критической области.

Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику K и по попаданию (или непопаданию) в критическую область W выносится решение об отвержении (или принятии) выдвинутой гипотезы H0.

Статистический критерий

Правило, определяющее условия, при которых статистическая гипотеза отвергается или не отвергается[1], называется статистическим критерием.

Замечание. Статистический критерий не устанавливает, верна или нет выдвинутая гипотеза, а позволяет лишь проверить, противоречат или согласуются с гипотезой в рамках этого критерия выборочные данные.

Математическую основу критерия составляет выбираемая с учетом особенностей поставленной конкретной задачи специальная статистика , точное или приближенное распределение которой при выполнении гипотезы известно.

В области возможных значений статистики критерия выделяется множество , называемое критической областью (областью отвержения гипотезы).

 

При проверке гипотезы руководствуются следующим правилом:

если значение статистики критерия для выборки принадлежит критической области , то гипотеза отвергается, в противном случае - не отвергается.

В результате проверки гипотезы при заданном критерии ; возможны верные решения двух следующих видов:

истинная гипотеза не отвергается;

ложная гипотеза отвергается.

Ошибка первого рода совершается, когда основная гипотеза верна, но отвергается в соответствии с заданным критерием .

Вероятность ошибки первого рода называется уровнем значимости (или размером) критерия :

.

На практике уровень значимости критерия задается изначально, исходя из потребностей реальных приложений и потенциальных последствий вероятных ошибок.

Ошибка второго рода допускается, когда альтернативная гипотеза верна, но отвергается в соответствии с заданным критерием (т.е. если основная гипотеза не верна, но не отвергается).

Величина , где - вероятность ошибки второго рода:

,

называется мощностью критерия .

Замечание. Значение (или ) вычисляется по распределению вероятностей значений критической статистики в предположении, что неизвестное распределение генеральной совокупности отвечает гипотетически верному утверждению (соответственно ):

; .

Вероятности ошибок первого и второго рода для любых гипотез и критериев находятся при разных предположениях о неизвестном распределении, что исключает наличие не зависящих от вида гипотез и критерия постоянных соотношений между ними.

Статистические критерии подразделяются на следующие категории:

Критерии согласия (Пирсона, Колмогорова-Смирнова) - проверка факта о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости.

Критерии однородности (Смирнова, Вилкоксона-Манна-Уитни, Стьюдента, критерий дисперсионного анализа, критерий однородности дисперсий, критерий Бартлетта) - случайные величины исследуются на факт взаимного соответствия их законов распределения (подчиняются ли эти величины одному и тому же закону).

Критерии проверки гипотез о числовых значениях параметров

содержание