Метод максимального правдоподобия

 

Этот метод применяется, если неизвестны стоимости потерь и выигрышей при постановке диагноза, а также априорные вероятности состояния диагностируемого объекта. Согласно этому методу в область S0 диагноза D0 включаются значения х, для которых Р(D0/х)>Р(D1/х), то есть те х , для которых априорная плотность вероятности диагноза D0 превышает априорную плотность вероятности диагноза D1. Метод максимального правдоподобия по сути является частным случаем метода минимального риска при 0=1. При этом условии (24) определяет граничную поверхность, а (25) – правило постановки диагноза.

Метод минимакса

Метод минимакса используется, если неизвестны априорные вероятности состояний – Р(Do) и P(Dl). Суть метода – минимизация максимально возможного риска, который может иметь место из-за неблагоприятного сочетания неизвестных априорных вероятностей состояний диагностируемого объекта P(D0) и P(D1)

Чтобы понять основную идею метода, рассмотрим как меняется функция среднего риска R в зависимости от априорных вероятностей состояния диагностируемого объекта P(D0) и P(Dl). Так как эти величины взаимосвязаны и в сумме равны единице, достаточно проанализировать поведение R при изменении одной из указанных вероятностей, например P(D0). Очевидно, что известны значения риска в точках P(D0)=0 и P(D1)=1. Действительно, если P(D0)=0, то априорно известно, что объект находится в состоянии D1. Сделав такое заключение, получим выигрыш от правильно принятого решения. Функция риска при этом принимает значение R = П11, (П11 <0), рис.2. Напомним, что выигрыши – это отрицательные потери, см. комментарии к табл. 1. С увеличением P(D0) возрастает неопределенность при определении состояния диагностируемого объекта. Растет и риск принятия решения R11, причем производная функции риска в точке P(D0)=0 положительная. Аналогично, если P(D0)=1, делается заключение, что объект находится в состоянии Do. В результате получаем выигрыш от правильного решения. Функция риска в этой точке равна R00, причем П00, < 0. При смещении из точки P(D0) = l влево (P(D0)<l) из-за возникающей неопределенности данных о состоянии диагностируемого объекта возрастает риск принятия решения, то есть R00. Следовательно, производная функции риска в точке Р(D0)=1 имеет отрицательное значение. Поскольку R – непрерывная функция аргумента P(D0), то в некоторой точке P*(D0) интервала (0;l) R должна иметь максимум. Это – наименее благоприятное значение априорной вероятности P(D0), при котором риск принятия решения R(P*(D0))=R* максимален. При известных потерях и выигрышах максимум риска и значение Р* (Do) можно определить, построив график, аналогичный графику на рис. 2. Данные для этого можно получить, последовательно задавая P(D0) из интервала 0...1 и вычисляя R с помощью соотношения (22). Так как реальная априорная вероятность P(D0) неизвестна, для расчетов принимается значение P*(D0). Очевидно, что при этом реальный риск принятия решения о состоянии диагностируемого объекта не превысит R*.

Рис.2. Изменение среднего риска R в зависимости от априорной вероятности состояния D0

 

 

Чтобы определить условие разбиения диагностического пространства на области S0 и S1 необходимо найти экстремум функции среднего риска R (см. (22)) относительно величины P(D0) с учетом того, что P(Dl) = 1-P(D0). Определить условие разбиения диагностического пространства на области S0 и S1 и величину P*(D0) из уравнения можно только в случае однопараметровой диагностики, то есть когда имеется лишь один диагностический параметр. В общем случае в (22) входят интегралы по S0 и S1, а их зависимости от P(D0) заранее не известны. Поэтому поступают следующим образом.

Рассматривают отношение правдоподобия в левой части неравенства (23) как случайную функцию вектора . Поскольку плотности вероятности распределения для состояний Do и D1 различны, различаются и условные плотности вероятности и . Введение этих функций позволяет перейти от многомерных плотностей вероятности распределения диагностических параметров к одномерным. Действительно, из правила постановки диагноза (23) и (25) следует, что событие, состоящее в том, что выполняется неравенство при условии, что диагностируемый объект находится в состоянии D0, и событие , если объект находится в состоянии D0, эквивалентны. Следовательно, равны вероятности этих событий:

.

Из аналогичных рассуждений находим

Следовательно, вероятности правильно и ошибочно поставленных диагнозов (19) и (20) можно представить в виде:

(27)

(28)

После подстановки этих соотношений в (21) получим зависимость функции среднего риска от параметров P(D0), P(D1) = 1 - P(D0) и . Из условия с учетом (23) получим уравнение для определения порогового значения отношения правдоподобия :

= (29)

Наименее благоприятное значение вероятности исправного состояния Р*(D0) можно вычислить с помощью соотношения:

= . (30)

Правило постановки диагноза определяется формулой (25), уравнение граничной поверхности – (24), а ошибки диагностирования – соотношениями (27) с учетом равенства

P*(D1)=1-P*(D0).

 

Методы расчета условных плотностей вероятности отношения правдоподобия и для некоторых основных видов распределений изложены в [3].

Метод Неймана-Пирсона

Если стоимости потерь от ошибочно принятых решений неизвестны, правило постановки диагноза можно установить из условия минимума значения вероятности одной из ошибок диагностирования при заданном (допустимом) уровне другой. По методу Неймана - Пирсона минимизируется вероятность ошибки 2-го рода (пропуска дефекта) Рм, см. второе соотношение в (26), при условии, что вероятность ошибки 1-го рода (ложной тревоги) PF не превышает заданного значения :

(31)

Этот уровень устанавливается на основе опыта эксплуатации объектов или интуитивных соображений с учетом разрешающей способности диагностических средств, степени опасности дефектов и экономических затрат. В практических расчетах принимают

(32)

где k – коэффициент избыточности, выбираемый из диапазона 1...3, если пропуск дефекта приводит к несущественным потерям, или из интервала 3...10, если пропуск дефекта влечет катастрофические последствия.

Соотношение (31) определяет пороговое значение . Уравнение граничной поверхности в пространстве параметров и правило постановки диагноза по-прежнему описываются формулами (24) и (25).

Можно использовать другой подход определить пороговое значение исходя из допустимой вероятности пропуска дефекта (ошибки 2-го рода) Рм:

.

Если пропуск дефекта влечет тяжелые последствия нежелателен, принимают

,

где N общее число контролируемых объектов, k = 1,..., 10 коэффициент избыточности.

Еще раз отметим, что для упрощения вычислений во всех вышеприведенных формулах вместо отношения правдоподобия можно использовать монотонную функцию логарифм этого отношения.

Пример.Рассмотрим диагностику по двум параметрам х = (x1,x2), имеющим нормальное распределение в состояниях D0 и D1. Параметры будем считать статистически независимыми, то есть их совместная плотность вероятности равна произведению плотностей вероятности распределения каждого параметра:

;

где , (i = 0,1) средние значения параметров, a и среднеквадратические отклонения параметров в состояниях D0 и D1. Логарифмируя обе части (25), находим правило постановки диагноза по методу минимального риска

.

Если в этой формуле знаки неравенства заменить на знак равенства, получим уравнение граничной линии второго порядка на плоскости диагностических параметров (x1,x2). В случае равенства среднеквадратических отклонений (j=1,2) правило упрощается:

.

Задача 2.Состояние подшипника циркуляционного насоса контролируется по содержанию металла в смазке, появляющегося в результате износа конструкционных элементов подшипника. Предварительно установлено, что концентрация металла подчиняется нормальному закону распределения, причем в исправном состоянии D0, среднее содержание металла составляет х0=0,5 мг/кг при среднеквадратическом отклонении =0,2 мг/кг, а для предельно изношенного состояния D1 эти величины соответственно равны х1=1,5 мг/кг, =0,3 мг/кг. Используя различные статистические методы принятия решений, определить предельное содержание металла в смазке, при котором подшипник подлежит разборке и ремонту, если их стоимость в условных величинах составляет П01 =10 единиц, а последствия аварийной ситуации, связанной с остановкой, оцениваются в П10 = 200 единиц. Априорные вероятности исправного и изношенного состояний подшипника на момент диагностики соответственно равны Р(D0)=0,95 и P(D1)=0,05.

 

Метод минимального риска

 

Плотности вероятностей распределения диагностического параметра – концентрации металла в смазке – при нормальном и изношенном состоянии подшипника описываются функциями

Составив отношение правдоподобия и прологарифмировав обе части соотношения (24), получим уравнение для определения критической концентрации (граничное значение) металла в смазке:

(34)

Здесь, поскольку выигрыш от правильно поставленных диагнозов, они приняты равными нулю. Введя обозначение z= уравнение (34) можно записать в виде

(35)

где

Подставив исходные данные, определяем положительный корень уравнения (35) – z=1,842. Следовательно, мг/кг. Вероятности ошибок 1-го и 2-го рода, см. рис. 1 вычисляются по формулам (20), которые в нашем случае имеют вид:

(36)

В результате вычислений находим . Средний риск равен усл. ед.

 

Метод минимального числа ошибочных решений

 

Критическую концентрацию металла в смазке определяем из уравнения (34), положив в правой его части .

В результате вычислений находим мг/гк. Вероятности ошибок 1-го и 2-го рода вычисляются по формулам (36) при найденном значении : и . Средний риск составляет усл. ед.

 

Метод максимального правдоподобия

Критическую концентрацию металла в смазке вычислим из уравнения (34), положив в правой его части П01P(D1)= П01P(D0), (см. п. 2.3). При этом уравнение (34) для определения х* принимает вид:

Решив это уравнение, находим х* =0,92 мг/кг. Вероятности ошибок 1-го и 2-го рода рассчитываются согласно (36) при найденном значении х*: РF = 0,0161 и Рм = 0,00137. Средний риск составляет величину R = 0,44 усл. ед.

 

Метод минимакса

 

Критическая концентрация металла в смазке определяется из уравнения

Решая это уравнение численным методом, находим х* = 0,74 мг/кг. Наименее благоприятное сочетание вероятностей исправного P*(D0) и неисправного Р* (D0) = 1 – Р* (D0) состояний вычисляются по формуле:

В результате определяем P*(D0)= 0,528; P*(D1)= 0,472. Вероятности ошибок 1-го и 2-го рода рассчитываются по формулам (36), в которых необходимо положить P(D0) = P*(D0) и P(D1) = P*(D1): PF =0,0604 и РM =0,0027. Минимаксный риск равен R = 1,14 усл. ед.

Обратим внимание на то, что действительный риск меньше минимаксного риска, поскольку последний определялся при наиболее неблагоприятном значении вероятности исправного состояния P*(D0), отличающегося от реальной априорной вероятности P(D0).

 

Метод Неймана – Пирсона

Проведем расчет критической концентрации металла в смазке для нескольких значений коэффициента избыточности k =1; 3; 5 . Для выбранных значений k вероятности ложной тревоги соответственно равны (ε= k P(D1)): ε = 0,05; 0,15; 0,25. Критическая концентрация металла определяется из условия не превышения ошибки 1-го рода РF заданной величины ε. Следовательно, уравнение для вычисления х* в нашем случае имеет вид, см. рис. 1

Для указанных ε значения х*1 равны: х*1 =0,82; х*2=0,7; х*3=0,63. По формуле (36) определяем соответствующие вероятности пропуска дефекта: РM1 =0,00061; РM2 =0,00019; РM3 =0,00009. Средний риск в этих случаях составляет соответственно: R1 = 0,62; R2 = 1,54; R3 = 2,52 усл. ед. Результаты проведенных расчетов сведены в табл. 4

Таблица 4