Доверительные интервалы для показателей точности и информативности при формировании общепопуляционной выборки

При формировании выборки по схеме общепопуляционного скринингового исследования основные показатели точности – чувствительность (Se), специфичность (Sp),и показатели информативности – предсказательные ценности позитивов (PPV) и негативов (NPV) и распространенность заболевания (Prev) являются простыми долями. Поэтому для их интервальных оценок используются известные методы построения 100(1 – α)%-го ДИ для параметра биномиального распределения.

В общем виде, если оцениваемый параметр φ = P(A) есть неизвестная вероятность события A, которую нужно оценить, то ее точечной статистической оценкой является соответствующая частота

Где x – число испытаний с исходами A, а n – общее число исходов.

Для нахождения границ 100(1 – α)%-го ДИ для оцениваемого параметра можно использовать точный метод Клоппера-Пирсона.

Нижняя граница вычисляется по формуле:

Здесь – такое значение функции F-распределения Снедекора-Фишера при числах степеней свободы , что .

Верхняя граница вычисляется по формуле:

А здесь – такое значение функции F-распределения Снедекора-Фишера при числах степеней свободы , что .

См., например:

Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н. Биометрия: Учеб. пособие. – Л.: Изд-во Ленингр. Ун-та, 1982. – 263 с.

Доверительные интервалы для PPV и NPV при формировании выборок по схеме «случаи-контроли»

При формировании двух независимых выборок по схеме «случаи-контроли» для построения доверительных интервалов для предсказательных вероятностей PPV и NPV нужны «внешние данные» данные о распространенности диагностируемого заболевания :

Для удобства упростим нашу символику и введем следующие обозначения:

- распространенность болезни

- нижнее из известных значений для распространенности (нижняя граница для размаха распространенности)

- верхнее из известных значений для распространенности (верхняя граница для размаха распространенности)

Соответственно, формула для точечной статистической оценки PPV принимает вид:

 

 

Введем «промежуточный» параметр η

 

 

Его дисперсию можно оценить как

 

 

где

а дисперсию R, в свою очередь, можно оценить как

Тогда статистической оценкой нижней границы 100(1 – α)%-го ДИ для η будет:

а оценкой его верхней границы будет:

В итоге получаем следующие статистические оценки границ 100(1 – α)%-го ДИ для PPV:

нижняя

и верхняя

Аналогичным образом находим статистические оценки границ ДИ для NPV. В этом случае приведенных формулах вместо PPV подставляем NPV и вместо данных о распространенности используем ее дополнение

Источник:

Zaykin D.V., Meng Z., Ghosh S.K. Interval estimation of genetic susceptibility for retrospective case-control studies // BMC Genetics, 2004. – V. 5. – paper 9.

URL: http://www.biomedcentral.com/content/pdf/1471-2156-5-9.pdf

 

Доверительные интервалы для LR[+] и LR[-]

Вычисляем стандартные ошибки (SE) для логарифма LR на основе статистики PRAC2

где

где

ДИ для LR[+]

ДИ для LR[-]

Источник:

Bolboacă S., Jäntschi L. Binomial distribution sample confidence interval estimation for positive and negative likelihood ratio medical key parameters // AMIA Annu. Symp. Proc., 2005. – P. 66-70. [American Informatics Medical Association, Bethesda, Special Issue: from Foundation to Application Policy (Proc. CD, October 22-26, Washington D.C., USA), 2005. – P. 66-70].

URL: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1560461/