II. Доверительный интервал для дисперсии.

войства оценок максимального правдоподобия.

Если существует эффективная оценка, то она является оценкой, полученной по методу максимального правдоподобия (МП оценкой или ОМП).
Если функция правдоподобия имеет единственный достижимый локальный максимум в области , то МП оценка является:

а) состоятельной,

б) асимптотически эффективной,

в) асимптотически нормальной.

ояснения.

Оценка неизвестного параметра является асимптотически нормальной, если она имеет асимптотически нормальное распределение, т.е.:

имеет распределение .

асимптотически эффективна, т.е. .

Величина – это информация Фишера, т.е. количество информации о параметре , заключенное в выборке объема .

Для всех состоятельных и несмещенных оценок параметра всегда выполняется неравенство Рао-Крамера:

, или ,

где , – оценка параметра .

Отметим, что в дискретном случае, т.е. когда выборка получена из дискретного распределения величина равна:

Если несмещенная оценка превращает неравенство Рао-Крамера в равенство, то она является эффективной оценкой, т.е.

Пример. Можно показать, что оценка математического ожидания нормально распределенной совокупности , , …, , является эффективной.

Имеем: .

Тогда , т.е. .

При этом известно (см. выше), что . Отсюда следует, что и значит оценка является эффективной оценкой математического ожидания для всех нормальных распределений. Аналогично можно показать (проделайте это сами), что оценка является эффективной оценкой для математического ожидания распределения Пуассона и параметра показательного распределения вида .

Доверительное (интервальное) оценивание

Доверительным интервалом (интервальной оценкой) числовой характеристики или параметра генеральной совокупности с доверительной вероятностью (доверительным уровнем или коэффициентом доверия) называется интервал со случайными границами , , который накрывает параметр с вероятностью , т.е.:

Итак, и – доверительные границы, равные некоторым статистикам , а – доверительная вероятность, и – уровень значимости. Обычно берут равным , , , .

Для параметрической функции интервальную оценку можно записать так:

Таким образом, задача доверительного оценивания состоит в том, чтобы определить границы и для параметрической функции .

Если известна статистика , связывающая параметр и ее точечную оценку , и закон распределения этой статистики , тогда доверительный интервал строят таким образом, чтобы дополнительные интервалы и накрывали с вероятностями . По распределению находят квантили и распределения порядков и , и тогда:

. Найдя обратную функцию для , строго возрастающую по , получим:

, т.е. , . Чем ближе к единице, тем больше длина доверительного интервала.

Здесь , .

Оценки параметров нормального распределения

Рассмотрим выборку , полученную из нормального распределения . Можно рассмотреть отдельно две нормальных модели: в первой неизвестным параметром является , а во второй – , т.е. рассмотрим отдельно модели и . Тогда, для первой модели можно использовать следующую оценку параметра : , а во второй модели оценка параметра будет: .

Если рассматривается модель , то тогда обычно используют оценки: и или .

I. Доверительный интервал для математического ожидания.

Рассмотрим два случая, когда – второй параметр распределения, известен и когда он не известен.

1. Пусть (дисперсия ), известна, т.е. рассматривается модель . Если , то , При этом, случайная величина (согласно центральной предельной теореме) имеет нормальное распределение , а отсюда случайная величина имеет нормальное распределение .

Выборочное распределение случайной величины симметрично относительно параметра , поэтому в таких случаях целесообразно рассматривать доверительный интервал симметричным относительно параметра , т.е. . Из теории вероятностей известно, что для нормально распределенной с.в.

где подчинена закону , – функция Лапласа. Тогда

где – квантиль нормального распределения уровня . Используя и выделяя в явном виде в формуле слева, получим следующий доверительный интервал для :

где – доверительный интервал для . Его можно переписать и так:

Отметим свойство квантилей нормального распределения: , т.е. или . Фактически здесь берутся две квантили порядков и , как и было указано выше. Покажем графически расположение этих квантилей на следующем рисунке.

2. Пусть неизвестна. Если распределена по нормальному закону с неизвестной дисперсией , тогда используя оценки и дисперсии (выборочная несмещенная дисперсия), то случайная величина имеет распределение Стьюдента (так называемое -распределение) с степенями свободы. Случайную величину часто называют стьюдентовской дробью.

По таблицам распределения Стьюдента при заданном коэффициенте доверия можно найти квантиль такую, что

Отсюда доверительный интервал для имеет вид:

Из свойств распределения Стьюдента известно, что уже при это распределение близко к нормальному . В этом случае вместо квантилей -распределения используют квантили нормального стандартного распределения .

Построенные доверительные интервалы для математического ожидания при конечном объеме выборки были выведены в предположении, что генеральная совокупность имеет нормальный закон распределения. При больших объемах выборки, когда , распределение случайной величины (по центральной предельной теореме) асимптотически приближается к нормальному. Тогда построенные в пунктах 1 и 2 доверительные интервалы можно приближенно применять к оценке математического ожидания генеральной совокупности , подчиняющейся произвольному закону распределения.

II. Доверительный интервал для дисперсии.

Пусть генеральная совокупность подчинена нормальному закону . Нужно рассмотреть отдельно два случая, когда (математическое ожидание ) известно и не известно.

1.Пусть известно, т.е. рассматривается нормальная модель , где параметрическая функция . Возьмем в качестве точечной оценки выборочную дисперсию ,т.е. и рассмотрим случайную величину . Имеем: . Здесь случайная величина имеет нормальное стандартное распределение . Известно, что случайная величина имеет -распределение (хи-квадрат) с степенями свободы. Отсюда следует, что статистика также подчиняется распределению хи-квадрат с степенями свободы. Построим доверительный интервал так, чтобы вероятности выхода за интервал слева и справа были бы одинаковы и равны . Тогда

или ,

где , – квантили распределения хи-квадрат с степенями свободы уровней и соответственно. Далее, из формулы выше получим:

где – доверительный интервал для дисперсии .

2. Пусть математическое ожидание неизвестно, т.е. рассматривается нормальная модель , где параметрическая функция , а – математическое ожидание. В этом случае в качестве точечной оценки удобно взять выборочную несмещенную дисперсию , т.е. , где . Случайная имеет распределение хи-квадрат с степенью свободы. Поэтому, при заданной доверительной вероятности имеем:

Преобразовав здесь неравенство в скобках, получим

т.е. доверительный интервал для дисперсии имеет вид:

или , где .

римеры.

1) Проанализировать выборку из нормального распределения, если , , , .

Оценим математическое ожидание :

2) Оценим дисперсию выборки, когда , , , , при этом считаем неизвестным, тогда

Интервальные оценки параметров распределений Бернулли и Пуассона

1. Пусть – выборка из биномиального распределения с неизвестным параметром – вероятностью успеха в одном испытании Бернулли. Здесь – число успехов в схеме Бернулли, ; . По методу максимального правдоподобия проведем поиск точечной оценки . Для функции имеем:

Тогда функция правдоподобия равна:

Пусть в испытаниях Бернулли успех наступил раз. Найдем оценку вероятности успеха в этих испытаниях. Из формул выше следует, что

– относительная частота успеха в схеме испытаний Бернулли.

По центральной предельной теореме случайная величина имеет асимптотически нормальное распределение . Тогда статистика будет иметь асимптотически нормальное распределение независимо от значения . При больших получим:

Отсюда придем к доверительному интервалу с коэффициентом доверия для вероятности успеха в схеме Бернулли:

2) Пусть – выборка из пуассоновского распределения с неизвестным параметром . Так как и в качестве точечной оценки параметра обычно берут выборочное среднее, т.е. , то рассматривая случайную величину (которая имеет асимптотически нормальное распределение ) и так как из ЦПТ получим (при больших ):

Выполняя преобразования в полученной формуле, придем к следующему доверительному интервалу для параметра :