Формула Бейза в терминах оддов и правдоподобий

А.В. Тишков, Н.Н. Хромов-Борисов, А.В. Комашня,

Ф.Ю. Марченкова, Е.М. Семенова, Н.И. Эюбова, Е.А. Делакова, А.В. Быхова

 

Статистический анализ таблиц 2х2 в клинико-лабораторных диагностических исследованиях

Теоретическая часть

 

 

Санкт-Петербург

Издательство СПбГМУ

 

Методические рекомендации предназначены для студентов 1 и 2 курсов лечебного, стоматологического, педиатрического факультетов, факультетов спортивной медицины, адаптивной физической культуры и психологии, изучающих медицинскую информатику в объеме учебной программы. Пособие может быть полезно студентам медицинских ВУЗов, которых интересуют современные способы и средства статистического анализа результатов клинико-лабораторных исследований.

Авторы-составители: к.ф.м.н., доцент Тишков А.В., к.б.н., доцент Хромов-Борисов Н.Н., к.м.н. Комашня А.В., Ф.Ю.Марченкова, Е.М. Семенова, Н.И. Эюбова, Е.А. Делакова, А.В. Быхова

 

Редактор: зав. кафедрой физики, математики и информатики к.ф.-м.н., доцент Тишков А.В.

 

Рецензенты: ???????????

 

 


 

Пояснительная записка

В данном пособии содержатся методические указания к практическим занятиям по медицинской информатике, посвященным статистическому анализу результатов простейших (дихотомических) клинико-лабораторных исследований, представляемых в форме таблицы перекрестной классификации .

Цель занятий — обучить студентов основным приемам статистического анализа таблиц перекрестной классификации в клинико-лабораторных исследованиях и научить их интерпретировать получаемые результаты.

На практических занятиях закрепляются знания, полученные студентами на лекциях, демонстрируются возможности и приемы всестороннего статистического анализа таблиц перекрестной классификации с использованием современного свободно распространяемого программного обеспечения. На практических занятиях студенты анализируют данные реальных исследований, заимствованные из научных публикаций. Для этого используются данные, как классических работ, так и новейших биомедицинских исследований. Каждому студенту предлагается индивидуальное задание. С помощью набора специализированных программ студенты выполняют необходимые расчеты и графическое представление их результатов; учатся обсуждать полученные результаты и формулировать выводы, как о статистической значимости результатов, так и об их диагностической и прогностической ценности.

В пособии приведены типичные вопросы для теоретической самоподготовки и закрепления практических навыков. Кроме выполнения заданий на практических занятиях, студентам предлагается выполнить самостоятельные письменные реферативные работы по ключевым вопросам курса медицинской информатики.

Студент обязан заранее готовиться к практическим занятиям по материалам лекций и предварительно ознакомиться с настоящим методическим пособием.

Методические указания состоят из двух частей – теоретической и практической. Данная теоретическая часть содержит основные необходимые формулы и определения.

Авторы выражают благодарность сотрудникам кафедры физики, математики и информатики за помощь в подготовке издания


Введение

Две важнейшие области медицины, основанной на доказательствах (МОД): диагностика и лечение.

Основная задача диагностики: как определить качество теста и затем использовать его для оценки вероятности того, что данный субъект имеет данную болезнь.

Основная задача лечения: как определить, является ли данное средство терапии благотворным и если да, то перевешивает ли его практическое применение затраты и риски.

Под диагностическим тестом обычно понимают клинико-лабораторное исследование.

Статистический анализ – единственный путь оценки и сравнения клинико-лабораторных диагностических тестов

Точный, т.е. по возможности максимально безошибочный диагноз – одна из важнейших задач медицины. Однако Диагност обречен использовать несовершенные методы диагностики.

Очевидно, что лучший и фактически единственный путь работать с несовершенной информацией – использовать статистические методы и выражать результаты диагноза и прогноза в терминах вероятности.

Поэтому следует осознавать, что клинико-лабораторные тесты диагностируют не наличие или отсутствие болезни, но лишь их вероятности.

Основные типы клинико-лабораторных тестов[1]

Строго говоря, следует различать три типа клинико-лабораторных тестов. А именно: скрининговые, диагностические и прогностические.

Целью скринингового теста является идентифицировать людей или группы людей с высокой вероятностью наличия у них определенного заболевания или другого признака. Часто скрининговые тесты оценивают вероятность болезни, наличие которой у себя сам субъект еще не осознает. Примеры: депрессия, глухота, анемия, рак и т.п.

Диагностические тесты используются по меньшей мере, с тремя целями: обосновать наличие болезни у данного субъекта, подтвердить подозрение на наличие болезнь и исключить заболевание.

Прогностические тесты предназначены для тестирования болезни, которая еще не проявилась у субъекта в момент тестирования, но риск заболеть у него повышен, и этот риск следует оценить.

Клинико-лабораторные диагностические исследования[2]

Клинико-лабораторные диагностические тесты или процедуры применяются в клинической практике для определения, насколько вероятно, что у данного субъекта имеется определенная болезнь или синдром (медицинское состояние). Когда точный эталонный тест (эталонная процедура) является инвазивным, дорогим, трудоёмким, или времязатрятным и потому малопригодным для применения в повседневной клинической практике, тогда вместо него предпочтительно использовать более простой, более доступный и менее опасный диагностический тест.

Клинико-лабораторный диагностический тест можно использовать для отнесения (классификации, распознания, различения) субъектов к одной из двух категорий, таких как:

С болезнью или без нее.Например, тест на ВИЧ.

Положительное или отрицательное физиологическое состояние.Например, тест на беременность.

Высокий или низкий риск.Например, тест Папаниколау (синонимы: мазок Папаниколау, или влагалищный мазок - Papanicolaou test, Pap test или Pap smear) для выявления предраковых изменений эпителия — цервикальных внутриэпителиальных неоплазий различной степени тяжести.

Подвергнутый или не подвергнутый воздействию. Например, уровень содержания парацетамола или салицилатов при передозировке.

Такие клинико-диагностические тесты далеко не всегда дают верные ответы, и поэтому возникает необходимость выразить количественно, насколько точен и информативен данный тест. Не существует единого статистического показателя, с помощью которого можно было бы измерить точность и информативность клинико-диагностического тест, т.е. его способность распознавать и предсказывать наличие или отсутствие данной болезни. Основными такими показателями являются:

Показатели согласованности: отношение шансов (OR) и коэффициент каппа Коуэна (κC).

Показатели точности: чувствительность (Se) и специфичность (Sp).

Показатели информативности: предсказательная ценность положительных ответов (PPV), предсказательная ценность отрицательных ответов (NPV), отношение правдоподобий для положительных ответов (LR[+]) и отношение правдоподобий для отрицательных ответов (LR[-]).

«Золотой стандарт» или Эталон сравнения

Нередко бывает невозможно поставить верный диагноз без инвазивных процедур, которые могут быть опасными для здоровья субъекта, хотя такой золотой стандарт является наилучшим из возможных. Например, окончательный диагноз болезни Альцгеймера возможен лишь при посмертном гистопатологическом анализе тканей мозга.

Таким образом, чувствительность измеряет, насколько хорошо тест идентифицирует субъектов с болезнью, а специфичность измеряет, насколько хорошо тест идентифицирует субъектов без болезни.

В идеале тест должен обладать и чувствительностью и специфичностью, близкими к 1,0 (или к 100%, если выражать их в процентах). Однако в реальности часто бывает трудно иметь высокими оба эти показателя.

Последствия ложных позитивов и ложных негативов могут быть различными в разных ситуациях. Например:

Ложноотрицательный ответ для болезни, передающейся половым путем, может привести к дальнейшему ее распространению.

Ложноположительный результат теста на синдром Дауна у беременной женщины может привести к ошибочной рекомендации сделать аборт.

Ложноположительный результат теста Папаниколау на наличие рака шейки матки может быть отвергнут дальнейшим тестированием, однако страх, вызванный у пациента положительным результатом, который впоследствии оказывается ложным, также является важным моментом при оценке качества теста. И наоборот, ложноотрицательный результат этого теста может привести к запоздалому диагнозу рака и неблагоприятному прогнозу.

Два основных показателя, используемых в эпидемиологических исследованиях — заболеваемость и распространённость заболевания. Заболеваемость отражает число новых случаев на единицу человеко-времени (обычно количество новых случаев на тысячу человеко-лет), а распространённость заболевания говорит об общем числе поражённых болезнью в популяции на конкретный момент или промежуток времени.

Необходимые сведения из теории вероятностей и математической статистики[3]

Многим биомедицинским явлениям и процессам имманентно присуща принципиально неустранимая неопределенность, которую называют случайностью. Механизмы проявления неопределенности и закономерности в проявлениях случайностей изучают теория вероятностей и математическая статистика.

Свойствами или условиями, которые должны быть присущи реальной неопределенной ситуации, чтобы ее можно было успешно математически описать на языке теории вероятностей, являются следующие:

Непредсказуемость:исход ситуации невозможно заранее предсказать с абсолютной точностью. Это свойство довольно очевидно. Если исход ситуации прогнозируем однозначно, то вообще нет никакой необходимости привлекать аппарат теории вероятностей.

Воспроизводимость: имеется по крайней мере умозрительная (теоретическая) возможность воспроизвести рассматриваемую ситуацию как угодно много раз в остающихся неизменными условиях. Это свойство является ключевым для того, чтобы быть уверенным в успехе применения аппарата теории вероятностей к ее описанию. Именно это свойство имеют в виду, когда говорят, что теория вероятностей и математическая статистика направлены на изучение массовых явлений. В связи с условием воспроизводимости следует весьма осторожно относиться к попыткам применять теорию вероятности к анализу уникальных явлений и систем.

Устойчивость частот:каким бы ни было интересующее нас событие, связанное с рассматриваемой ситуацией, при многократном воспроизведении этой ситуации частота события колеблется, но концентрируется возле некоторого числа, приближаясь к нему все ближе и ближе по мере увеличения числа воспроизведений ситуации.

Частота события A определяется как отношение числа случаев (m), в которых наблюдалось рассматриваемое событие, к общему числу воспроизведений ситуации (n):

Число, к которому сходится частота события (A) при многократном воспроизведении ситуации, можно назвать вероятностью случайного события

В подавляющем большинстве ситуаций, рассматриваемых в биомедицине, вероятности событий нам неизвестны. Однако, если рассматриваемая ситуация характеризуется указанными свойствами (непредсказуемость, воспроизводимость ситуации и устойчивость частот), то наблюдаемую частоту события можно использовать в качестве статистической оценки неизвестной нам вероятности. Таким образом, в прикладных задачах вероятность события выступает как некая абстракция, идеализация понятия частоты события.

Вероятности и/или одды (шансы за и против) - два способа выражения для степени правдоподобия случайного события

Вероятность можно определить как меру правдоподобия случайного события A, выражаемую в долях от единицы:

Другой способ выражать степень правдоподобия события A - посредством оддов, соотнося вероятность события A с вероятностью противоположного события (не A).


«Одды» (шансы за и против)

«Одды» или шансы за и против события A определяются как отношение вероятности этого события к вероятности противоположного события :

где . Одды или шансы за и против события A не определены, когда , ибо деление на ноль – запрещенная операция.

Понятие оддов (шансов за и против) нам знакомо из курсов по генетике. Знаменитое менделевское отношение A- : aa = 3 : 1 суть одды в пользу доминантного фенотипа против рецессивного. В терминах вероятностей это будут:

и .

Независимые события

Одним из фундаментальнейших понятий в теории вероятностей является понятие независимости случайных событий.

По определению два случайных события A и B являются независимыми, когда вероятность их совмещения (AB), т.е. их одновременного осуществления равна произведению вероятностей каждого из этих событий по отдельности:

Отношение оддов

Одной из мер зависимости между двумя случайными событиями может служить величина, называемая отношением оддов.

Отношение оддов OR (Odds Ratio) для двух случайных событий A и B есть отношение шансов за и против события A к шансам за и против события B:

Напомним, что и .


Условные вероятности

Фактически все показатели точности, прогностичности и согласованности клинико-лабораторного диагностического теста являются условными вероятностями и функциями от них.

По определению, условная вероятность события A при условии, что (уже) произошло событие B, есть результат деления вероятности совмещения обоих этих событий P(AB) на вероятность происшедшего события B:

В формулах для обозначения условных вероятностей используется символ “|” - вертикальная черта. Читается и произносится как: «при условии, что» (или просто «при»).

Выражение читается как: «вероятность случайного события A при условии, что произошло событие B» (или «при условии, что утверждение B верно»).

 

«Заблуждение обвинителя»

Принципиально важно осознавать, что условные вероятности необращаемы. А именно: вероятность события A при условии, что осуществилось событие B, не есть вероятность события B при условии, что произошло событие A:

Например, чувствительность клинико-лабораторного диагностического теста, т.е. вероятность получить положительный результат у субъекта с данной болезнью не равна предсказательной (апостериорной) вероятности наличия болезни у субъекта с положительным результатом теста:

При проверке статистических гипотез важно помнить, что вероятность получить наблюдаемые данные D при условии, что верна нулевая гипотеза H0, не есть апостериорная вероятность гипотезы H0 после получения экспериментальных данных:

В судебной генетике подобные заблуждения называют «заблуждением обвинителя (прокурора)». Вероятность наблюдать у заподозренного субъекта ДНК-профиль (генотип) G, идентичный генотипу ДНК-улики при условии, что заподозренный невиновен (I – innocent), не есть вероятность того, что заподозренный невиновен, если у него обнаружен данный генотип:

Связь между подобными условными вероятностями устанавливает теорема Бейза.

Формула Бейза: вероятность причин, гипотез, или обратные или предсказательные вероятности

Формула Бейза устанавливает связь между условными вероятностями и для двух случайных событий A и B:

Другая интерпретация. Вероятность можно назвать априорной вероятностью события A, т.е. вероятностью этого события до осуществления события B. Условную вероятность можно назвать апостериорной вероятностью события A, т.е. вероятностью этого события после осуществления события B.При такой интерпретации формула Бейза устанавливает связь между априорной и апостериорной вероятностями события A (относительно осуществления или неосуществления события B).

Формула Бейза в терминах оддов и правдоподобий

 

Условные вероятности и принято называть правдоподобиями, а их отношение – отношением правдоподобий (LR – от англ. Likelihood Ratio):

Тогда в обозначениях для отношения правдоподобий и априорных и апостериорных оддов (шансов за и против) формула Бейза имеет вид:

Это означает, что апостериорные (т.е. после того как произошло событие B) одды (шансы за и против) события A равны его априорным оддам, умноженным на отношение правдоподобий LR:

Апостериорные шансы = Априорные шансы × Отношение правдоподобий

В теории проверки статистических гипотез событие A несет смысл проверяемой гипотезы, обычно называемой нулевой гипотезой H0, а противоположное событие несет смысл альтернативной гипотезы H1. Тогда соответствующее отношение правдоподобий принято называть бейзовым фактором BF01. Подстрочный индекс 01 (читается как «ноль-один») означает, что сравнивается нулевая гипотеза с альтернативной. Обратная величина для сравнения альтернативной гипотезы с нулевой будет иметь подстрочный индекс 10: (читается как «один-ноль»).

Популяция и выборка

Определение понятия «популяция»

В медицине и в эпидемиологии термин Популяция является калькой с английского population - синоним статистического понятия «генеральная совокупность», т.е. совокупность индивидуумов, из которой отбирается выборка, и на которую распространяются результаты, полученные для этой выборки.

Популяция может представлять собой все население (в эпидемиологических исследованиях) данной местности или данной этнической принадлежности, или же состоять из пациентов с определенным заболеванием. Таким образом, можно говорить об общей популяции или популяции пациентов с конкретным заболеванием.

Важнейшее требование к популяции и к выборке - однородность[4]

Отправной точкой (пусковым, стартовым моментом) в статистическом анализе является обобщение информации, полученной от ограниченного числа различающихся единиц наблюдения (выборка). Сведения (выводы), получаемые на основе такого объединения распространяются на все объекты такой природы (домысливаемая генеральная совокупность).

Получаемые таким путем выводы будут надежными, только если мы уверены, что наблюдаемые единицы являются однородными (принадлежат одной и той же генеральной совокупности, имеют одно и то же вероятностное распределение).

Однородность (гомогенность) выборки является фундаментальным, центральным, ключевым для всех последующих выводов и предсказаний.

Перед тем как подвергать исходные данные основной статистической обработке, исследователь должен ответить на вопрос: Правомерно ли объединение имеющихся в его распоряжении порций (выборок) в один общий массив или же каждая из порций имеет свою специфику и, следовательно, и обрабатывать их надо по отдельности?

В терминах Математической Статистики этот вопрос сводится к проверке однородности (гомогенности), т. е. к выяснению, можно ли считать имеющиеся порции данных выборками из одной и той же генеральной совокупности.