Уровень значимости и мощность критерия

Рассмотрим две простые гипотезы: проверяемую : и конкурирующую: : . С каждым -критерием связаны ошибки двух родов. Ошибка первого рода – отвержение гипотезы , когда она верна; принимая гипотезу , в случае когда верна конкурирующая гипотеза , мы делаем ошибку второго рода.

Обозначим

, i = 0, 1. (2.1)

Тогда, вероятность ошибки первого рода - критерия равна:

, (2.2)

а вероятность ошибки второго рода равна:

, где , (2.3)

и иногда называют просто ошибками І и ІІ рода.

Задача построения -критерия для проверки простой гипотезы при конкурирующей гипотезе ставится следующим образом. Вероятность ошибки І рода называют уровнем значимости - критерия.

Функцией мощности -критерия называется следующая функция от :

(2.4)

т.е. вероятность отвергнуть гипотезу , если истинное значение параметра равно .

Как видно из (2.2), (2.3) и (2.4), вероятности ошибок І и ІІ рода следующим образом выражаются через функцию мощности:

,

Итак, сначала задается уровень значимости и рассматривается множество всех -критериев с уровнем значимости . Среди этих критериев выбирается критерий , для которого мощность при принимает наибольшее значение, т.е.

,

Критерий , удовлетворяющий условиям (2.5) называется оптимальным, или наиболее мощным, критерием, который не всегда существует.

Обобщим понятие статистического критерия. Для этого опишем -критерий с помощью функции , определенной по правилу:

(2.6)

Мы можем истолковать , как вероятность отвергнуть гипотезу , когда выборка приобретает значение . Критерии, описываемые функцией вида (2.6) называются нерандомизированными. Введем понятие рандомизированого критерия (от англ. random-случайный).

Пусть задана функция , такая, что для любых . Мы предполагаем, что с каждыми значением выборки связывается некий случайный эксперимент (рандомизация ) с двумя исходами: 1 и 0, причем вероятность 1 равна , а вероятность 0 равна В зависимости от исхода этой рандомизации действует и этот рандомизированный критерий. Если выпала 1, то отвергается, если выпал 0, то принимается.

Функцию мощности этого критерия, который можно назвать -критерием обозначим Она равна :

где означает математическое ожидание по распределению , а - случайная величина, плотность которой равна .

Уровень значимости -критерия равен:

,

а вероятность ошибки II рода равна:

Рассмотрим множество всех -критериев с фиксированным уровнем значимости . Мы будем называть -критерий оптимальным или наиболее мощным, если

, (2.7)

Задача (2.7) всегда допускает решения.