Точность и надежность статистических оценок

Наблюдаемые численности исходов при общепопуляционном формировании выборки

Проверяемый диагностический тест (ПДТ) Эталон сравнения Всего
Результат:
[+] [-]
Результат: [+]
[-]
Всего

 

Статистическими оценками разрешающей и предсказательной способностей ПКЛДТ являются соответствующие наблюдаемые частоты.

Статистическое оценивание

Одной из основных задач статистики является статистическое оценивание числовых характеристик (параметров) обследуемой популяции. Цель – по возможности точно и надежно определить (вычислить) значение той или иной числовой характеристики (параметра). Материалом для этого служат имеющиеся статистические данные.

При оценивании параметров на основе варьирующих данных нельзя ограничиваться одним числом. Обязательно нужны еще оценки их варьирования.

Два основных типа статистических оценок

Точечное оценивание – оценка одним числом.

Интервальное оценивание – оценка интервалом.

Для интервального оценивания в статистике используются Доверительные Интервалы. Доверительный интервал — это такой интервал, который содержит (накрывает) оцениваемый параметр с заданной вероятностью. Такая вероятность называется Доверительной Вероятностью или Уровнем Доверия. Уровень Доверия выбирается исследователем.

Основная логика статистического оценивания: точечные оценки

В биомедицинских исследованиях обычно вероятности P (или иные параметры) нам неизвестны. Мы их оцениваем по наблюдаемым численностям.

Например, разумной и интуитивно понятной точечной оценкой для распространенности болезни по данным общепопуляционного (одномоментного поперечно-срезового) исследования может служить наблюдаемая частота

т.е. доля числа больных , выявленных золотым стандартом, от общего числа n обследованных.

Основная логика статистического оценивания: интервальные оценки

Легко представить, что если мы многократно повторим извлечение выборок из данной популяции, то наблюдаемые частоты неизбежно будут варьировать. Поэтому задача математиков – вывести математический закон (вероятностное распределение), которому подчиняется варьирование этой частоты. Если такой закон найден, то тогда можно получить доверительные интервалы (ДИ) для оценки распространенности болезни с заданной доверительной вероятностью .

Доверительные интервалы

Доверительный Интервал (ДИ) есть такой интервал, который с заданной (доверительной) вероятностью накрывает искомое оцениваемое значение параметра. Синонимы: Интервал Доверия или Интервал Накрытия.

Принципиально важно понимать, что ДИ является случайным. Это означает, что от опыта к опыту его границы будут колебаться, варьировать.

Точность и надежность статистических оценок

Чем ýже ДИ, тем оценка точнее. Чем больше доверительная вероятность , тем оценка надежнее. Однако ДИ с доверительной вероятностью 100% - бессмыслен. Например, 100%-й ДИ для доли будет содержать все значения в границах от 0 до 1: [0, 1].

Надежность доверительных интервалов (ДИ)

Уровень доверия Степень надёжности ДИ
<95% Практически неприемлемая
95% Приемлемая
99% Удовлетворительная
99,9% Высокая

 

Например, 99%-й ДИ означает, что если мы многократно (бесконечное число раз) повторим наши наблюдения, то в 99% случаев получаемые интервалы накроют (неизвестное) значение оцениваемой вероятности P (или иного параметра θ). Но в 1% случаев мы можем «промахнуться»: вычисленный интервал не накроет искомое значение. И промах этот может случиться как раз с данной конкретной выборкой.

Отсюда мы приходим к выводу о неизбежной необходимости многократно повторять опыты (или наблюдения).