Статистические гипотезы и интервальное оценивание параметров

Мы уже знаем, что точечная оценка параметров распределения случайной величины не дает нам точного значения самого параметра. Эта оценка оказывается лишь приблизительной. В ряде случаев бывает важным не просто оценить параметр распределения, а описать диапазон его возможных значений. Такой способ оценивания называют интервальным. Результатом интервального способа становится построение некоторого интервала предполагаемых значений оцениваемого параметра. Этот интервал обозначают как доверительный интервал.

Оказывается, чтобы построить доверительный интервал интересующего нас параметра, необходимо использовать логику, близкую к логике выдвижения и проверки статистических гипотез.

Пусть, например, мы провели оценку какого-то интересующего нас индивидуального свойства, скажем, интеллекта, в репрезентативной выборке испытуемых, например студентов психологических вузов. Пусть эта величина оказалась равной X. Ясно, что если эту величину мы возьмем в качестве теоретического значения исследуемого параметра μ, то ряд близких к этой величине средних значений уровня интеллекта в других выборках будут оценивать как статистически не отличимые на некотором заданном уровне.

Чтобы пояснить эту мысль, преобразуем уравнение (2.1), которое используется для вычисления статистики ί, к следующему виду:

(2.7)

Задав уровень значимости а, скажем, равным 0,05, можно оценить диапазон, в рамках которого мы определим минимальное значение μ, необходимое для того, чтобы принять нулевую гипотезу:

Пусть мы получили среднее значение уровня интеллекта по шкале WAIS (тесту Векслера) для репрезентативной выборки студентов, равное 110 при стандартном отклонении 15. Объем выборки составил 25 испытуемых. Граничное значение статистики t для 24 степеней свободы на 5%-ном уровне значимости оказывается равным 2,06 (см. приложение 3). Подставляя эти значения в формулу (2.7), получаем μ = 103,82.

Таким образом, мы установили нижнюю границу доверительного интервала для найденной величины математического ожидания. Оценивая, статистические нулевые гипотезы о равенстве полученного эмпирического значения относительно любой величины μ – от 103,82 до наблюдаемого нами значения, мы будем получать значение статистики t, недостаточное для отвержения нулевой гипотезы.

На практике, однако, важно установить не только нижнюю, но и верхнюю границу доверительного интервала. Логика рассуждения в этом случае остается той же. Однако, поскольку в этом случае мы оцениваем не одну, а сразу две гипотезы, необходимо использовать двухсторонний тест Стьюдента. Тогда критическую величину А, используемую для отвержения нулевой гипотезы, необходимо будет разделить на два.

Граничное значение t-статистики для 1 – α = 0,025 в нашем примере оказывается равным 2,39 (см. приложение 3). Соответствующее значение для α = 0,025 будет равняться -2,39. Это значение отсутствует в статистических таблицах, по его легко найти, учитывая симметричность t-распределения.

Подставляя полученные значения в формулу (2.7), находим нижнюю и верхнюю границы доверительного интервала для математического ожидания, они оказываются соответственно равными 102,83 и 117,17. В общем случае для обозначения доверительного интервала указывают среднее полученное значение оцениваемого математического ожидания ± значение стандартной ошибки для заданного уровня значимости. Тогда в нашем примере доверительный интервал можно определить так: 110 ± 7,17.

Аналогичным образом можно определять доверительные интервалы и для оценки различий двух средних значений, а также для отличия наблюдаемого нами эмпирического значения от теоретически заданного.