Статистические гипотезы и правила их проверки. Статистические критерии
Основные типы гипотез, проверяемых в ходе статистического анализа и моделирования
Гипотезы о типе закона распределения исследуемой случайной величины
Гипотезы об однородности двух или нескольких обрабатываемых выборок или некоторых характеристик анализируемых совокупностей
Гипотезы о числовых значениях параметров исследуемой генеральной совокупности
Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками
Понятие статистической гипотезы
Пусть - независимая повторная выборка объема
из некоторой генеральной совокупности с неизвестной функцией распределения
.
Под статистической гипотезой понимается всякое предположение о виде или параметрах неизвестного закона распределения.
Гипотеза есть определенное утверждение, которое по отношению к реальной ситуации является или истинным, или ложным высказыванием.
Простой статистической гипотезой называется предположение о соответствии неизвестной функции распределения некоторому конкретному распределению вероятностей.
Сложной статистической гипотезой называется предположение о том, что неизвестное распределение принадлежит некоторому множеству распределений, состоящему более чем из одного элемента.
Если удается выдвинуть две взаимоисключающие статистические гипотезы, содержащих в своей совокупности верное суждение о неизвестном распределении, то проверяемую гипотезу принято называть основной (или нулевой), а противоположную гипотезу
- альтернативой (или конкурирующей гипотезой).
Этапы проверки статистических гипотез
Формулировка основной гипотезы H0 и конкурирующей гипотезы H1. Гипотезы должны быть чётко формализованы в математических терминах.
Задание уровня значимости α, отвечающей ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.
Расчёт статистики K критерия.
Построение критической области.
Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику K и по попаданию (или непопаданию) в критическую область W выносится решение об отвержении (или принятии) выдвинутой гипотезы H0.
Статистический критерий
Правило, определяющее условия, при которых статистическая гипотеза отвергается или не отвергается[1], называется статистическим критерием.
Замечание. Статистический критерий не устанавливает, верна или нет выдвинутая гипотеза, а позволяет лишь проверить, противоречат или согласуются с гипотезой в рамках этого критерия выборочные данные.
Математическую основу критерия составляет выбираемая с учетом особенностей поставленной конкретной задачи специальная статистика , точное или приближенное распределение которой при выполнении гипотезы
известно.
В области возможных значений статистики критерия выделяется множество
, называемое критической областью (областью отвержения гипотезы).
При проверке гипотезы руководствуются следующим правилом:
если значение статистики критерия для выборки
принадлежит критической области
, то гипотеза
отвергается, в противном случае - не отвергается.
В результате проверки гипотезы при заданном критерии
; возможны верные решения двух следующих видов:
истинная гипотеза не отвергается;
ложная гипотеза отвергается.
Ошибка первого рода совершается, когда основная гипотеза верна, но отвергается в соответствии с заданным критерием
.
Вероятность ошибки первого рода называется уровнем значимости (или размером) критерия
:
.
На практике уровень значимости критерия задается изначально, исходя из потребностей реальных приложений и потенциальных последствий вероятных ошибок.
Ошибка второго рода допускается, когда альтернативная гипотеза верна, но отвергается в соответствии с заданным критерием
(т.е. если основная гипотеза
не верна, но не отвергается).
Величина , где
- вероятность ошибки второго рода:
,
называется мощностью критерия .
Замечание. Значение (или
) вычисляется по распределению вероятностей значений критической статистики в предположении, что неизвестное распределение генеральной совокупности отвечает гипотетически верному утверждению
(соответственно
):
;
.
Вероятности ошибок первого и второго рода для любых гипотез и критериев находятся при разных предположениях о неизвестном распределении, что исключает наличие не зависящих от вида гипотез и критерия постоянных соотношений между ними.
Статистические критерии подразделяются на следующие категории:
Критерии согласия (Пирсона, Колмогорова-Смирнова) - проверка факта о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости.
Критерии однородности (Смирнова, Вилкоксона-Манна-Уитни, Стьюдента, критерий дисперсионного анализа, критерий однородности дисперсий, критерий Бартлетта) - случайные величины исследуются на факт взаимного соответствия их законов распределения (подчиняются ли эти величины одному и тому же закону).
Критерии проверки гипотез о числовых значениях параметров
содержание