Построение доверительных интервалов для параметров нормального распределения
Интервальной оценкой математического ожидания μ нормального распределения при известной дисперсии
называется интервал
,
,
удовлетворяющий равенству:
, где: γ ─ заданная доверительная вероятность, μ ─ истинное математическое ожидание,
─ точечная оценка математического ожидания, n ─ объём выборки; число
находится из уравнения
, где
─ функция Лапласа.
Интервальная оценка математического ожидания находится по формуле:
.
В MS Excel для вычисления величины
предназначена функция (категория Статистические):
ДОВЕРИТ(Альфа;Станд_откл;Размер),
где: Альфа ─ уровень значимости
, используемый для вычисления уровня надёжности
. Уровень надёжности равняется
процентам; Станд_откл ─ стандартное отклонение
генеральной совокупности, предполагается известным; Размер ─ объём выборки n.
Пример 7 . По выборке объёма n=50 найдено значение выборочного среднего
=3,5. Стандартное отклонение равно
=2,5. Построить доверительный интервал для генерального среднего с уровнем надёжности 95%.
Последовательность выполнения
1. Вычислить уровень значимости:
.
2. Ввести в ячейку А1 формулу =ДОВЕРИТ(0,05;2,5;50). В А1 появится результат: 0,693.
3. Вычислить границы доверительного интервала:
;
.
С вероятностью 0,95 математическое ожидание (генеральное среднее) принадлежит интервалу (2,807; 4,193). Математически этот вывод выражается формулой
.
Интервальной оценкой математического ожидания μ нормального распределения при неизвестной дисперсии
называется интервал:
,
,
удовлетворяющий равенству:
,
где γ ─ заданная доверительная вероятность, μ ─ истинное математическое ожидание,
─ точечная оценка математического ожидания,
─ исправленная выборочная дисперсия; n ─ объём выборки; число
находится из уравнения
, где
─ функция распределения Стъюдента.
Интервальная оценка математического ожидания находится по формуле:
.
В MS Excel для вычисления величины
предназначена функция (категория Статистические):
СТЪЮДРАСПОБР(вероятность;степени_свободы),
где: вероятность ─ уровень значимости
; степени_свободы ─ число степеней свободы
.
Пример 8. По выборке объёма n = 20 найдено выборочное среднее
=3,5 и исправленное среднеквадратическое отклонение
. Построить доверительный интервал для генерального среднего с уровнем надёжности 95%.
1. Ввести в ячейку А1 формулу =СТЪЮДРАСПОБР(0,05;19). В А1 появится результат: 2,093.
2. Вычислить границы доверительного интервала:
;
;
.
Доверительный интервал для генерального среднего имеет вид:
.
Доверительный интервал для генеральной дисперсии нормально распределённого признака Х определяется на основе соотношения
,
где: γ ─ заданная доверительная вероятность,
─ исправленная выборочная дисперсия; n ─ объём выборки;
и
определяются из условий
, 
Для вычисления
и
используется функция
ХИ2ОБР(вероятность; степени свободы),
Вероятность ─ значение правой части условий; степени_свободы ─ число степеней свободы
.
Пример 9. Количественный признак Х генеральной совокупности распределён нормально. По выборке объёма n = 25 найдено исправленное среднеквадратическое отклонение
. Найти доверительный интервал, покрывающий генеральное среднеквадратическое отклонение
с надёжностью
.
Решение в MS Excel.
1. Вычислить
,
,
.
2. Ввести в ячейки А1 и А2 соответственно формулы =ХИ2ОБР(0,975;24), = ХИ2ОБР(0,025;24). В ячейках появятся результаты: 12,40 и 39,36, то есть
и
.
3. Найти границы интервала
;
.
Доверительный интервал с уровнем надёжности 0,95 для генеральной дисперсии
имеет вид 0,39<
<1,24. Доверительный интервал для генерального среднеквадратического отклонения находится извлечением квадратного корня 0,62<
<1,11.
Получение выборочных характеристик
Инструмент«Описательная статистика»используется для получения оценок числовых характеристик распределения генеральной совокупности по случайной выборке из неё. С помощью инструмента «Описательная статистика» можно вычислить следующие параметры:
‒ среднее (статистическую оценку математического ожидания)

‒ стандартную ошибку (среднего)

‒ медиану (Me) – значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности;
‒ моду (Mo) – значение изучаемого признака, повторяющегося с наибольшей частотой;
‒ исправленную выборочную дисперсию

‒ Исправленное среднее квадратическое отклонение

‒ Эксцесс

‒ Асимметрию

‒ размах выборки

‒ минимальное значение выборки
‒ максимальное значение выборки
‒ сумму всех значений выборки
‒ объём выборки
‒ наибольшее значение признака, имеющее разность с порядком единиц
‒ наименьшее значение признака, имеющее разность с порядком единиц
‒ уровень надёжности (предельную ошибку выборки)
Уровень надёжности. Флажок устанавливается в том случай, когда необходимо вычислить доверительный интервал для математического ожидания, соответствующий заданной доверительной вероятности (указывается в поле справа в процентах). В таблице результатов появится число, равное половине длины доверительного интервала.

К-наименьший и К-наибольший. Если флажки установлены, то появляются элементы упорядоченной выборки, расположенные на K-ом месте от её начала и от конца.
Пример 10. По полученной на занятии 1 выборке (пример 3) найти оценки числовых характеристик выборки.
Решение
Вызовем инструмент «Описательная статистика» и введём в окне диалога следующие параметры: Входной интервал: $F$1:$F$30; Группирование: по столбцам; Выходной интервал: $B$33. Установим флажки на пунктах Итоговая статистика; Уровень надёжности: 95%; К-наименьший: 2; К-наибольший: 2. Нажмём кнопку ОК и округлим результаты до двух знаков после запятой. Результаты показаны на рис.
Доверительный интервал для математического ожидания нормальной случайной величины при неизвестном среднем квадратическом отклонении имеет вид:
,
где: число tg определяется с помощью распределения Стъюдента с k = n - 1 степенями свободы; g - доверительная вероятность(уровень надёжности).
Для вычисления значения tg используем функцию СТЪЮДРАСПОБР(вероятность; Степени_свободы). Рассчитаем вероятность - уровень значимости α = 1 - g. Для надёжности 95% α = 1 - 0,95 = 0,05. Вызовем функцию с аргументами:
=СТЪЮДРАСПОБР(0,05; 29). Получим результат: 2,045. Найдём границы доверительного интервала:

(Такое же значение получается в инструменте «Описательная статистика» при вычислении параметра Уровень надёжности).
; 
Таким образом, доверительный интервал имеет вид:
.
Задания для самостоятельной работы
Сгенерировать совокупность нормально распределённых случайных величин объёмом N для одной переменной с параметрами µ и s. Из полученной совокупности получить выборку объема n. По выборке построить гистограмму частот (число интервалов k), найти оценки числовых характеристик с использованием инструмента «Описательная статистика», построить доверительный интервал для математического ожидания.
| № варианта | N |
|
|
| k |
| 3,0 | 1,5 | ||||
| 1,5 | 3,0 | ||||
| 2,0 | 1,2 | ||||
| 2,5 | 1,4 | ||||
| 5,5 | 1,3 | ||||
| 4,5 | 1,1 | ||||
| 1,0 | 1,4 | ||||
| 2,5 | 1,2 | ||||
| 3,0 | 1,3 | ||||
| 3,5 | 1,1 | ||||
| 2,5 | 2,0 | ||||
| 4,5 | 1,4 | ||||
| 6,0 | 1,2 | ||||
| 4,0 | 1,3 | ||||
| 5,5 | 1,1 | ||||
| 3,2 | 0,9 | ||||
| 2,2 | 0,8 | ||||
| 2,1 | 0,5 | ||||
| 2,7 | 0,3 | ||||
| 2,3 | 1,1 | ||||
| 3,1 | 0,7 | ||||
| 4,2 | 1,1 | ||||
| 4,4 | 0,8 | ||||
| 4,1 | 0,5 | ||||
| 4,3 | 0,3 |