Построение доверительных интервалов для параметров нормального распределения

Интервальной оценкой математического ожидания μ нормального распределения при известной дисперсии называется интервал

, ,

удовлетворяющий равенству: , где: γ ─ заданная доверительная вероятность, μ ─ истинное математическое ожидание, ─ точечная оценка математического ожидания, n ─ объём выборки; число находится из уравнения , где ─ функция Лапласа.

Интервальная оценка математического ожидания находится по формуле:

.

В MS Excel для вычисления величины предназначена функция (категория Статистические):

ДОВЕРИТ(Альфа;Станд_откл;Размер),

где: Альфа ─ уровень значимости , используемый для вычисления уровня надёжности . Уровень надёжности равняется процентам; Станд_откл ─ стандартное отклонение генеральной совокупности, предполагается известным; Размер ─ объём выборки n.

Пример 7 . По выборке объёма n=50 найдено значение выборочного среднего =3,5. Стандартное отклонение равно =2,5. Построить доверительный интервал для генерального среднего с уровнем надёжности 95%.

Последовательность выполнения

1. Вычислить уровень значимости: .

2. Ввести в ячейку А1 формулу =ДОВЕРИТ(0,05;2,5;50). В А1 появится результат: 0,693.

3. Вычислить границы доверительного интервала:

;

.

С вероятностью 0,95 математическое ожидание (генеральное среднее) принадлежит интервалу (2,807; 4,193). Математически этот вывод выражается формулой .

Интервальной оценкой математического ожидания μ нормального распределения при неизвестной дисперсии называется интервал:

, ,

удовлетворяющий равенству: ,

где γ ─ заданная доверительная вероятность, μ ─ истинное математическое ожидание, ─ точечная оценка математического ожидания, ─ исправленная выборочная дисперсия; n ─ объём выборки; число находится из уравнения , где ─ функция распределения Стъюдента.

Интервальная оценка математического ожидания находится по формуле:

.

В MS Excel для вычисления величины предназначена функция (категория Статистические):

СТЪЮДРАСПОБР(вероятность;степени_свободы),

где: вероятность ─ уровень значимости ; степени_свободы ─ число степеней свободы .

Пример 8. По выборке объёма n = 20 найдено выборочное среднее =3,5 и исправленное среднеквадратическое отклонение . Построить доверительный интервал для генерального среднего с уровнем надёжности 95%.

1. Ввести в ячейку А1 формулу =СТЪЮДРАСПОБР(0,05;19). В А1 появится результат: 2,093.

2. Вычислить границы доверительного интервала:

;

;

.

Доверительный интервал для генерального среднего имеет вид:

.

Доверительный интервал для генеральной дисперсии нормально распределённого признака Х определяется на основе соотношения

,

где: γ ─ заданная доверительная вероятность, ─ исправленная выборочная дисперсия; n ─ объём выборки; и определяются из условий

,

Для вычисления и используется функция

ХИ2ОБР(вероятность; степени свободы),

Вероятность ─ значение правой части условий; степени_свободы ─ число степеней свободы .

Пример 9. Количественный признак Х генеральной совокупности распределён нормально. По выборке объёма n = 25 найдено исправленное среднеквадратическое отклонение . Найти доверительный интервал, покрывающий генеральное среднеквадратическое отклонение с надёжностью .

Решение в MS Excel.

1. Вычислить

, , .

2. Ввести в ячейки А1 и А2 соответственно формулы =ХИ2ОБР(0,975;24), = ХИ2ОБР(0,025;24). В ячейках появятся результаты: 12,40 и 39,36, то есть и .

3. Найти границы интервала

; .

Доверительный интервал с уровнем надёжности 0,95 для генеральной дисперсии имеет вид 0,39< <1,24. Доверительный интервал для генерального среднеквадратического отклонения находится извлечением квадратного корня 0,62< <1,11.

 

Получение выборочных характеристик

Инструмент«Описательная статистика»используется для получения оценок числовых характеристик распределения генеральной совокупности по случайной выборке из неё. С помощью инструмента «Описательная статистика» можно вычислить следующие параметры:

‒ среднее (статистическую оценку математического ожидания)

‒ стандартную ошибку (среднего)

‒ медиану (Me) – значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности;

‒ моду (Mo) – значение изучаемого признака, повторяющегося с наибольшей частотой;

‒ исправленную выборочную дисперсию

‒ Исправленное среднее квадратическое отклонение

‒ Эксцесс

‒ Асимметрию

‒ размах выборки

‒ минимальное значение выборки

‒ максимальное значение выборки

‒ сумму всех значений выборки

‒ объём выборки

‒ наибольшее значение признака, имеющее разность с порядком единиц

‒ наименьшее значение признака, имеющее разность с порядком единиц

‒ уровень надёжности (предельную ошибку выборки)

Уровень надёжности. Флажок устанавливается в том случай, когда необходимо вычислить доверительный интервал для математического ожидания, соответствующий заданной доверительной вероятности (указывается в поле справа в процентах). В таблице результатов появится число, равное половине длины доверительного интервала.

К-наименьший и К-наибольший. Если флажки установлены, то появляются элементы упорядоченной выборки, расположенные на K-ом месте от её начала и от конца.

 

Пример 10. По полученной на занятии 1 выборке (пример 3) найти оценки числовых характеристик выборки.

Решение

Вызовем инструмент «Описательная статистика» и введём в окне диалога следующие параметры: Входной интервал: $F$1:$F$30; Группирование: по столбцам; Выходной интервал: $B$33. Установим флажки на пунктах Итоговая статистика; Уровень надёжности: 95%; К-наименьший: 2; К-наибольший: 2. Нажмём кнопку ОК и округлим результаты до двух знаков после запятой. Результаты показаны на рис.

 

Доверительный интервал для математического ожидания нормальной случайной величины при неизвестном среднем квадратическом отклонении имеет вид:

,

где: число tg определяется с помощью распределения Стъюдента с k = n - 1 степенями свободы; g - доверительная вероятность(уровень надёжности).

Для вычисления значения tg используем функцию СТЪЮДРАСПОБР(вероятность; Степени_свободы). Рассчитаем вероятность - уровень значимости α = 1 - g. Для надёжности 95% α = 1 - 0,95 = 0,05. Вызовем функцию с аргументами:

=СТЪЮДРАСПОБР(0,05; 29). Получим результат: 2,045. Найдём границы доверительного интервала:

(Такое же значение получается в инструменте «Описательная статистика» при вычислении параметра Уровень надёжности).

;

Таким образом, доверительный интервал имеет вид:

.

Задания для самостоятельной работы

Сгенерировать совокупность нормально распределённых случайных величин объёмом N для одной переменной с параметрами µ и s. Из полученной совокупности получить выборку объема n. По выборке построить гистограмму частот (число интервалов k), найти оценки числовых характеристик с использованием инструмента «Описательная статистика», построить доверительный интервал для математического ожидания.

№ варианта N k
3,0 1,5
1,5 3,0
2,0 1,2
2,5 1,4
5,5 1,3
4,5 1,1
1,0 1,4
2,5 1,2
3,0 1,3
3,5 1,1
2,5 2,0
4,5 1,4
6,0 1,2
4,0 1,3
5,5 1,1
3,2 0,9
2,2 0,8
2,1 0,5
2,7 0,3
2,3 1,1
3,1 0,7
4,2 1,1
4,4 0,8
4,1 0,5
4,3 0,3