Уровень значимости и мощность критерия
Рассмотрим две простые гипотезы: проверяемую :
и конкурирующую:
:
. С каждым
-критерием связаны ошибки двух родов. Ошибка первого рода – отвержение гипотезы
, когда она верна; принимая гипотезу
, в случае когда верна конкурирующая гипотеза
, мы делаем ошибку второго рода.
Обозначим
, i = 0, 1. (2.1)
Тогда, вероятность ошибки первого рода - критерия равна:
, (2.2)
а вероятность ошибки второго рода равна:
, где
, (2.3)
и
иногда называют просто ошибками І и ІІ рода.
Задача построения -критерия для проверки простой гипотезы
при конкурирующей гипотезе
ставится следующим образом. Вероятность ошибки І рода
называют уровнем значимости
- критерия.
Функцией мощности
-критерия называется следующая функция от
:
(2.4)
т.е. вероятность отвергнуть гипотезу , если истинное значение параметра равно
.
Как видно из (2.2), (2.3) и (2.4), вероятности ошибок І и ІІ рода следующим образом выражаются через функцию мощности:
,
Итак, сначала задается уровень значимости и рассматривается множество
всех
-критериев с уровнем значимости
. Среди этих критериев выбирается критерий
, для которого мощность при
принимает наибольшее значение, т.е.
,
Критерий , удовлетворяющий условиям (2.5) называется оптимальным, или наиболее мощным, критерием, который не всегда существует.
Обобщим понятие статистического критерия. Для этого опишем -критерий с помощью функции
, определенной по правилу:
(2.6)
Мы можем истолковать , как вероятность отвергнуть гипотезу
, когда выборка приобретает значение
. Критерии, описываемые функцией вида (2.6) называются нерандомизированными. Введем понятие рандомизированого критерия (от англ. random-случайный).
Пусть задана функция , такая, что для любых
. Мы предполагаем, что с каждыми значением выборки
связывается некий случайный эксперимент (рандомизация ) с двумя исходами: 1 и 0, причем вероятность 1 равна
, а вероятность 0 равна
В зависимости от исхода этой рандомизации действует и этот рандомизированный критерий. Если выпала 1, то
отвергается, если выпал 0, то
принимается.
Функцию мощности этого критерия, который можно назвать -критерием обозначим
Она равна :
где означает математическое ожидание по распределению
, а
- случайная величина, плотность которой равна
.
Уровень значимости -критерия равен:
,
а вероятность ошибки II рода равна:
Рассмотрим множество всех
-критериев с фиксированным уровнем значимости
. Мы будем называть
-критерий оптимальным или наиболее мощным, если
,
(2.7)
Задача (2.7) всегда допускает решения.