Статистические гипотезы и правила их проверки. Статистические критерии
Основные типы гипотез, проверяемых в ходе статистического анализа и моделирования
Гипотезы о типе закона распределения исследуемой случайной величины
Гипотезы об однородности двух или нескольких обрабатываемых выборок или некоторых характеристик анализируемых совокупностей
Гипотезы о числовых значениях параметров исследуемой генеральной совокупности
Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками
Понятие статистической гипотезы
Пусть 
 - независимая повторная выборка объема 
 из некоторой генеральной совокупности с неизвестной функцией распределения 
 .
Под статистической гипотезой понимается всякое предположение о виде или параметрах неизвестного закона распределения.
Гипотеза есть определенное утверждение, которое по отношению к реальной ситуации является или истинным, или ложным высказыванием.
Простой статистической гипотезой называется предположение о соответствии неизвестной функции распределения 
 некоторому конкретному распределению вероятностей.
Сложной статистической гипотезой называется предположение о том, что неизвестное распределение принадлежит некоторому множеству распределений, состоящему более чем из одного элемента.
Если удается выдвинуть две взаимоисключающие статистические гипотезы, содержащих в своей совокупности верное суждение о неизвестном распределении, то проверяемую гипотезу 
 принято называть основной (или нулевой), а противоположную гипотезу 
 - альтернативой (или конкурирующей гипотезой). 
Этапы проверки статистических гипотез
Формулировка основной гипотезы H0 и конкурирующей гипотезы H1. Гипотезы должны быть чётко формализованы в математических терминах.
Задание уровня значимости α, отвечающей ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.
Расчёт статистики K критерия.
Построение критической области.
Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику K и по попаданию (или непопаданию) в критическую область W выносится решение об отвержении (или принятии) выдвинутой гипотезы H0.
Статистический критерий
Правило, определяющее условия, при которых статистическая гипотеза отвергается или не отвергается[1], называется статистическим критерием.
Замечание. Статистический критерий не устанавливает, верна или нет выдвинутая гипотеза, а позволяет лишь проверить, противоречат или согласуются с гипотезой в рамках этого критерия выборочные данные.
Математическую основу критерия составляет выбираемая с учетом особенностей поставленной конкретной задачи специальная статистика 
 , точное или приближенное распределение которой при выполнении гипотезы 
 известно.
В области возможных значений статистики критерия 
 выделяется множество 
 , называемое критической областью (областью отвержения гипотезы).
При проверке гипотезы 
 руководствуются следующим правилом:
если значение статистики критерия 
 для выборки 
 принадлежит критической области 
 , то гипотеза 
 отвергается, в противном случае - не отвергается.
В результате проверки гипотезы 
 при заданном критерии 
 ; возможны верные решения двух следующих видов:
истинная гипотеза 
 не отвергается; 
ложная гипотеза 
 отвергается.
Ошибка первого рода совершается, когда основная гипотеза 
 верна, но отвергается в соответствии с заданным критерием  
 . 
Вероятность 
 ошибки первого рода называется уровнем значимости (или размером) критерия  
 :
 
 .
На практике уровень значимости критерия задается изначально, исходя из потребностей реальных приложений и потенциальных последствий вероятных ошибок.
Ошибка второго рода допускается, когда альтернативная гипотеза 
 верна, но отвергается в соответствии с заданным критерием  
 (т.е. если основная гипотеза 
 не верна, но не отвергается).
Величина 
 , где 
 - вероятность ошибки второго рода:
 
 ,
называется мощностью критерия  
 .
Замечание. Значение 
 (или 
 ) вычисляется по распределению вероятностей значений критической статистики в предположении, что неизвестное распределение генеральной совокупности отвечает гипотетически верному утверждению 
 (соответственно 
 ):
 ; 
 .
Вероятности ошибок первого и второго рода для любых гипотез и критериев находятся при разных предположениях о неизвестном распределении, что исключает наличие не зависящих от вида гипотез и критерия постоянных соотношений между ними.
Статистические критерии подразделяются на следующие категории:
Критерии согласия (Пирсона, Колмогорова-Смирнова) - проверка факта о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости.
Критерии однородности (Смирнова, Вилкоксона-Манна-Уитни, Стьюдента, критерий дисперсионного анализа, критерий однородности дисперсий, критерий Бартлетта) - случайные величины исследуются на факт взаимного соответствия их законов распределения (подчиняются ли эти величины одному и тому же закону).
Критерии проверки гипотез о числовых значениях параметров
содержание