Определение доверительного интервала

Пусть

х1,…,хn (4.1)

выборка (независимая) из некоторого распределения с плотностью р(х; )=р(х1,…,хn; ), зависящей от параметра , который может изменяться в интервале 0 < < 1. Пусть у(х1,…,хn) - некоторая статистика (т.е. функция от выборки) и F(х; )=Р{η≤ х} – функция распределения случайной величины η= у(х1,…,хn), когда выборка (4.1) имеет распределение с плотностью р(х1,…,хn; ). Предположим, что F(х; ) есть убывающая функция от параметра . Обозначим квантиль распределения F(х; ), т.е. корень уравнения F (х; ) =1-γ.

В этом случае квантиль есть возрастающая функция от . Зададимся малым числом α>0, например, α=0,05 или α =0,01. Пусть α=α12 . При каждом неравенства

(4.2)

выполняются с вероятностью 1-α, близкой к единице. Обозначим функцию, обратную , т.е. решение уравнения

у=

через = .

Тогда неравенства (4.2) при любом выполняются с вероятностью 1-α. Обозначим , и запишем (4.3) в следующем виде:

( . (4.4)

Интервал ( называется доверительным интервалом для параметра , а вероятность 1-α доверительной вероятностью.

Следует различать смысл неравенств (4.2) и (4.3). В неравенстве (4.2) при любом случайная величина ξ попадает в указанный интервал с вероятностью 1-α .

В неравенстве (4.3) параметр неслучайный, а концы интервала случайны, поэтому правильнее будет говорить, что при любом доверительный интервал (со случайными концами) покрывает параметр с доверительной вероятностью 1-α.

Доверительный интервал (4.4), кроме доверительной вероятности 1-α, имеет еще одну характеристику - среднюю длину:

( .

Мы должны стараться среди всех доверительных интервалов с доверительной вероятностью 1-αвыбрать тот, который имеет наименьшую длину.

Если статистика η=у(х1,…,хn) уже выбрана, то мы можем варьировать разложение αна сумму α1+α2.

В дальнейшем мы встретимся со следующими двумя случаями.

Случай 1. Функция распределения F (х; ) имеет вид F (х - ). В этом случае F (х - ) убывает с ростом . Легко видеть, что при этом

= + и ,

поэтому доверительный интервал (4.3) имеет вид :

(4.5)

Случай 2. Параметр положителен, и F(х; )= , F(0)=0. В этом случае при х >0 убывает с ростом , и

= · и

Доверительный интервал (4.3) в этом случае имеет вид:

 

Доверительные интервалы для параметров

Нормального распределения

Пусть независимая выборка (4.1) взята из нормального распределения с параметрами (а, σ) .

а) Доверительный интервал для а при известном σ.

Возьмем за статистику η среднее . Это разумно, так как есть достаточная статистика относительно а и является эффективной оценкой а.

Как известно, имеет нормальное распределение с параметрами (а, ). Обозначим, как и раньше, uγ - квантиль нормального распределения, т.е. 10(uγ)=γ (Ф0(u) - функция распределения нормального распределения).

Пусть α= α1+ α2. Так как u1-γ=- uγ, то неравенство

(4.6)

выполняется с вероятностью 1-α. Разрешая неравенство (4.6) относительно а, имеем доверительный интервал для а

, (4.7)

являющийся частным случаем для (4.5).

Доверительная вероятность (4.7) равна 1-α, а его длина

.

Эта длина будет наименьшей, если взять α122/2.

б) Доверительный интервал для а при неизвестном σ.

Пусть

, .

Теорема 1. Статистики для выборки (4.1) из нормального распределения независимы. Случайная величина

·(n-1)/σ2 имеет c2 - распределение с (n-1)-й степенью свободы.

Доказательство.

Случайные величины независимы и имеют нормальное распределение с параметрами (0, 1). Обозначим

,

тогда

, .

Докажем, что и независимы и что ·(n-1) имеет c2- распределение с (n-1)-й степенью свободы. Случайный вектор 1´,…,хn´) имеет сферическое нормальное распределение с плотностью

(4.8)

Переход от одного ортогонального базиса в Rn к другому осуществляется при помощи преобразования координат

,

коэффициенты которого связаны между собой соотношениями . Такое преобразование называется ортогональным.

Пусть у=С·х´ - ортогональное преобразование, заданное соотношениями:

,

, .

Тогда у12,…,уn также будут иметь сферически нормальные распределения с плотностью (4.8). Так как у1= и = (из-за ортогональности преобразования С), то

(n-1) · = = ,

поэтому (n-1) · не зависит от имеет распределение c2 с (n-1)-й степенью свободы. Теорема доказана.

Следствием только что доказанной теоремы является

Теорема 2. Пусть (4.1) - независимая выборка из нормального распределения. Статистика:

, (4.10)

называемая отношением Стьюдента, имеет распределение Стьюдента с (n-1)-й степенью свободы.

Доказательство. Случайная величина имеет нормальное распределение с параметрами (0,1), а S/σ не зависит от и равно , где имеет c2 - распределение с (n-1)-й степенью свободы. Поэтому отношение (4.10) имеет распределение Стьюдента с (n-1)-й степенью свободы. Теорема доказана.

Для построения доверительного интервала для а при неизвестном σ воспользуемся отношением Стьюдента (4.10). Пусть Sn(t)- функция распределения Стьюдента с n степенями свободы:

, .

Обозначим tγ(n) - квантиль распределения Sn(t), т.е. корень уравнения

Sn(t)=1-γ.

Так как распределение Стьюдента симметрично, t1-γ(n)= -tγ(n) и при построении доверительного интервала надо брать α12=α/2. Неравенство

выполняется с вероятностью 1-α. Это дает нам доверительный интервал

в) Доверительный интервал для σ при известном a.

Статистика

является достаточной для оценки параметра σ и имеет c2 - распределение с n степенями свободы. Обозначим через Кn(х) функцию распределения и через кγ(n) – квантиль Кn),

.

Квантиль кγ(n) – корень уравнения

Кn(х)= 1-γ.

Пусть α=α12 . Тогда неравенства

выполняется с вероятностью 1-α.

Это дает нам доверительный интервал

(4.11)

г) Доверительный интервал для σпри неизвестном a.

В этом случае за основную статистику η возьмем эмпирическую дисперсию.

По теореме 1 имеет c2 - распределение с (n-1) - й степенью свободы. Это приводит к доверительному интервалу, аналогичному (4.11)

с доверительной вероятностью 1-(α12).

Обычно на практике используют значения 1-α равные 0.9, 0.95 или 0.99.