ГЛАВА 12. ПРИНЯТИЕ РЕШЕНИЙ НА ОСНОВЕ НЕЧЕТКИХ МОДЕЛЕЙ
Интенсивные исследования и разработки, проводимые в последние два десятилетия в области нечетких моделей, нечеткого представления и обработки данных, нечеткой логики и выводов на основе нечетких знаний обусловлены высокой потребностью, новыми технологиями и активностью исследователей и разработчиков новых информационных технологий.
Потребность внедрения компьютерных систем нового поколения связана с возрастанием их роли в жизни людей, а это требует решения острых проблем взаимопонимания человека и компьютера. К сожалению, современные компьютеры способны воспринимать точные данные, строго математически сформулированные задачи и знания. В то же время знания об окружающем нас мире нечетки, и неспособность компьютеров обрабатывать такие знания существенно сдерживает процесс информатизации общества. Математические модели макро- и микроэкономики, финансово-экономического анализа и т.п. в большинстве своем предполагают наличие нечетких знаний, принятие решений на основе знаний многих экспертов, имеющегося опыта и результатов экспериментов и отсутствие механизмов представления и обработки нечеткостей в современных прикладных компьютерных системах объясняют неэффективность их использования для решения практических задач.
Нечёткие системы впервые были предложены в 1920-х годах польским математиком Лукашевичем. Слово "нечёткий" означает, что некий элемент принадлежит множеству несколько своеобразным образом. В математике всё чётко: либо элемент принадлежит множеству, либо нет, и любая формальная логика, в том числе и булева, основана на этом принципе.
Заслуга Л.А.Заде состоит в том, что он ввёл понятие взвешенной принадлежности. Значение функции принадлежности показывает, что элемент может принадлежать подмножеству в большей или меньшей степени, а отсюда и появляется понятие нечёткого подмножества.
Таким образом, теория нечётких множеств это по сути дела, шаг на пути к сближению точности классической математики и всепроникающей неточности реального мира.
Математическая теория нечетких множеств, предложенная Л.Заде более трех десятилетий назад, позволяет описывать нечеткие понятия и знания, их обрабатывать и делать нечеткие выводы.
Разработанные на основе этой теории новые возможности классических моделей и методов, а также новые нечеткие модели и методы позволяют строить современные нечеткие информационные технологии, наиболее полно соответствующие требованиям потребителей. Производство микропроцессоров, выполняющих операции над нечеткими числовыми данными, существенным образом продвинет разработку и внедрение нечетких компьютерных систем.
И, наконец, последнее условие успешного развития теории и практики нечетких систем - активность исследователей и разработчиков заметно возросла. В мире создано несколько крупных ассоциаций специалистов, работающих в области разработки и использования нечеткостей, таких как IEEE Fuzzy (международный институт радиоинженеров в области нечетких множеств), International Association for Fuzzy Set Management and Economy (международная ассоциация по нечетким множествам в области менеджмента и экономики) и др. Международные конгрессы этих ассоциаций свидетельствуют о высокой активности специалистов, работающих в области нечетких моделей и методов.
В данной главе изложены основные нечеткие модели и методы, описаны нечеткие компьютерные технологии, используемые для принятия решений в финансово-экономическом анализе и прогнозировании.
12.1. Нечёткая логика
Сочетание слов “нечеткая логика” может показаться противоречивым. Действительно, логика - это представление механизмов мышления, что никогда не может быть нечетким, а всегда строгим и формальным. Однако исследование механизмов мышления показывает, что в действительности существует не одна логика (например, булева), а множество логик, и все определяется выбором соответствующей системы аксиом. Все утверждения, построенные на основании выбранных аксиом, должны быть строго, без противоречий увязаны друг с другом, согласно правилам этой системы аксиом. Булева логика связана с булевой теорией множеств, а нечеткая логика - с теорией нечетких подмножеств. Единой теории нечетких подмножеств не существует и их можно построить столько, сколько нужно.
Человеческое мышление - это, с одной стороны, совмещение интуиции и опыта, которое рассматривает все в целом или по аналогии (т.е. нечетко), а с другой - логически и последовательно (т.е. формально) и, значит, представляет собой четкий механизм. Законы мышления, на базе которых разрабатываются программы ЭВМ, конечно, должны быть формальными.
Нечеткая логика является обобщением стандартной пропозициональной логики от двух значений истинности: истина (1), ложь (0) и степени истины между 0 и 1.
Формально пусть A обозначает некоторое утверждение. В нечеткой логике величине A присваивается числовое значение t(A), называемое степенью истинности А, такое что 0£t(А)£1. Для предложения, состоящего из простых утверждений и логических операторов И(Ù), ИЛИ(Ú) и НET(ù) система нечеткой логики определяется следующим образом:
Определение 1. Пусть А и В - два произвольных утверждения. Тогда
t(AÙB)=min{t(A),t(B)}
t(AÚB)=max{t(A),t(B)}
t(ùA)=1-t(A)
t(A)=t(B), если А и В логически эквивалентны.
В зависимости от того, как понимается фраза «логически эквивалентны», определение 1 позволяет производить различные формальные системы. Система нечеткой логики стремится учитывать и производить бесконечное множество числовых значений истинности. Однако, для многих понятий логической эквивалентности, возможны только два различных значения истинности при заданных постулатах определения 1.
Факторы уверенности
Коэффициенты уверенности. Существенной в нечеткой логике является проблема взвешивания сведений. Предположим, что имеется следующий набор продукционных правил:
Правило 1:
ЕСЛИ x имеет ликвидный баланс
И x имеет коэффициент текущей ликвидности=2,2
ТО x выделить кредит
Правило 2:
ЕСЛИ x имеет ликвидный баланс
И x имеет коэффициент промежуточной ликвидности=0,25
ТО x выделить кредит.
Предположим, что ликвидность баланса клиента-заемщика x оценивается на 1 (определенность равна 1) и коэффициент текущей ликвидности, равный 2,2 оценивается на 0,7. Тогда условия ликвидности, входящие в правило 1, имеют совместное значение степени истинности, равное 0,7 (операция min). Предположим для простоты, что степень истинности заключений в правилах совпадает со степенями истинности их условий (хотя это не обязательно). Тогда степень истинности заключения «x выделить кредит» равна 0,7.
Для правила 2, известно, что степень истинности условий «х имеет ликвидный баланс» равна 0,5 и «х имеет коэффициент промежуточной ликвидности=0,25» равна 0,25, тогда степень истинности заключения «х выдать кредит» равна 0,25 (операция min).
Теперь, как нам рассматривать эти противоречивые значения: максимальное, минимальное или какую-либо функцию от двух чисел?
Проблемы возникают и в том случае, если два свидетельства не вступают в противоречие: два различных правила, указывающих в пользу одного и того же заключения, обычно усиливают знание к нему, давая более высокое значение степени истинности, чем среднее или максимальное. Такие же трудности имеют место, если действие нескольких таких правил не может быть полностью компенсировано правилом, указывающим противоположное действие. Исследование этих проблем относится в большей степени к теории свидетельств, чем к нечеткой логике. Использование нечеткой логики само по себе не решает проблем, связанных с взаимным взвешиванием раздельных (и, возможно, противоречивых) сведений. Рассмотрим одну из схем, использующую свидетельства для получения степени уверенности в предполагаемой гипотезе.
Эта схема предложена Шортлиффом и применяется в ЭС MYCIN. Она основывается на так называемых коэффициентах уверенности, предназначенных для измерения степени доверия к заключению, которое является результатом полученных свидетельств. Коэффициент уверенности - это разность между двумя мерами:
КУ[h:e]=МД[h:e]-МНД[h:e],
где КУ[h:e] - уверенность в гипотезе h с учетом свидетельств e; МД[h:e] - мера доверия гипотезе h при заданном e, тогда как МНД[h:e] - мера недоверия h при свидетельствах e.
Коэффициент КУ может изменятся от -1 (абсолютная ложь) до +1 (абсолютная истина), принимая также все промежуточные значения между -1 и +1. Значения МД и МНД могут изменяться только от 0 до +1. Заметим, что эта формула не позволяет отличать случай противоречащих свидетельств, когда МД и МНД обе велики, от случая недостаточной информации, когда МД и МНД очень малы. Заметим также, что КУ, МД и МНД не являются вероятностными мерами.
До сих пор из нечеткой логики в этой формуле использовались операции MIN, MAX и вычитание из 1. Существенной была введенная формула уточнения, по которой новую информацию можно сочетать со старыми результатами. Она применяется к мерам доверия и недоверия, связанными с каждой гипотезой. Формула для МД имеет следующий вид:
МД[h:e1,e2]=МД[h:e1]+МД[h:e2](1-МД[h:e1]),
где запятая между e1 и e2 означает, что e2 следует за e1. Аналогичным образом уточняется МНД. Смысл формулы состоит в том, что влияние второго свидетельства e2 оценивается смещением МД в сторону полной определенности на расстояние, зависящее от второго свидетельства.
Эта формула имеет два важных свойства:
1. Она симметрична относительно следования e1 и e2.
2. По мере накопления подкрепляющих свидетельств величина МД (или МНД) движется к определенности.
Возвратимся к предыдущему примеру, указывая в скобках значение МД для свидетельств.
Правило 1:
ЕСЛИ x имеет ликвидный баланс (0,75)
И x имеет коэффициент абсолютной ликвидности (0,6)
ТО x выделить кредит.
Правило 2:
ЕСЛИ x имеет ликвидный баланс (0,5)
ИЛИ x имеет коэффициент абсолютной ликвидности (0,7)
ТО x выделить кредит.
Операция И в первом правиле определяет минимальное из значений 0,75 и 0,6 т.е. 0,6. Операция ИЛИ во втором правиле требует взятия максимального из значений 0,5 и 0,7, т.е. 0,7.
Тогда гипотеза, что “x выделить кредит” поддерживается правилом 1 со значением 0,6 и правилом 2 со значением 0,7. Применяя приведенную формулу, получаем
МД[кредит: правило 1, правило 2] =
= МД[кредит: правило 1] +
+ МД[лредит: правило 2] ∙
∙ (1- МД[информатика: правило 1]) =
= 0,6 + 0,70,4 = 0,88.
Таким образом, объединенная мера доверия оказывается выше, чем при учете каждого свидетельства, взятого отдельно. Это согласуется с нашей интуицией, что несколько свидетельств в одном направлении подкрепляют друг друга. Заметим, что порядок использования правил 1 и 2 не влияет на результат. Схема Шортлиффа допускает также возможность указывать надежность не только свидетельств, но и правил. Каждое правило снабжено так называемым “коэффициентом ослабления”, числом от 0 до 1, показывающим надежность правила. Пусть в нашем примере надежность правила 1 равна 0,65, а правила 2 - 0,75. Полученные ранее значения для правила 1 - 0,6 и правила 2 - 0,7 следует умножить на соответствующие коэффициенты ослабления 0,65 и 0,75, что дает значение 0,39 для правила 1 и 0,525 для правила 2. Применяя формулу уточнения Шортлиффа, получаем
МД[кредит: правило 1, правило 2] = 0,39+0,255 ∙0,61=0,71025.
Попытки Шортлиффа дать теоретическое обоснование этим методам были не слишком убедительны. Однако опыт использования предложенных приемов в системе MYCIN и при решении финансово-экономических задач дал хорошие результаты.
Трудности с методом Байеса. Несмотря на полезное использование теоремы Байеса, ее применение требует знания многих вероятностей. Например, метод Байеса позволяет определить вероятность экономического явления (спад, подъем, кризис и т.п.) определенной причины:
,
где сумма по i распространяется на все экономические явления;
Di - i-е явление; E - свидетельство; P(E) - априорная вероятность; P(E|Di) - условная вероятность того, что будет свидетельство (причина) при наличии экономического явления Di.
Обычно невозможно определить полные значения этих вероятностей на все случаи жизни для одного предприятия. На практике свидетельство накапливается по частям. Это требует значительного времени и стоимости, особенно когда требуются проверки. Эти факторы времени, стоимости и потенциального риска к предприятию обычно ограничивают число тестов, выполняемых для хорошей диагностики.
Удобная форма теоремы Байеса выражает накопление свидетельств по частям:
,
где E2 - новое свидетельство, добавляемое к существующему свидетельству E1, чтобы сформировать новое свидетельство:
E=E1ÙE2 .
Хотя формула является точной, все эти вероятности обычно неизвестны. Такая ситуация становится тем хуже, чем больше частей свидетельства накапливается и чем больше требуется вероятностей.
Доверие и недоверие. Кроме проблемы накопления всех условных вероятностей для метода Байеса, другая важная проблема появляется в связи с доверием и недоверием. Прежде всего, доверие противоположно недоверию и поэтому P(H)+P(H')=1 и P(H)=1-P(H').
Для случая апостериорной гипотезы, которая связана со свидетельствами E:
. | 12.1 |
Однако, исследование показателей с выражением знаний в форме (12.1).
является исключительно нежелательным.
Например, рассмотрим следующее правило:
ЕСЛИ
1) клиент имеет постоянную работу;
2) клиент имеет адекватную прибыль;
3) клиент имеет адекватное имущество
ТО степень доверия тому, что кредитная закладная будет одобрена, равна 0,7, т.е.
, | 12.2) |
где Ei, i=1,2,3 соответствует трем условиям в правиле.
Формула (12.2) эксперта может оказаться непростой для инженера по знаниям и поэтому последний использует также формулу (12.3):
(12.3) |
Нежелание эксперта согласиться с уравнением (12.3) показывает, что эти числа 0,7 и 0,3 являются подобными доверию, а не вероятностям.
Меры доверия и недоверия. В системе MYCIN уровень уверенности
был определен как разность между мерой доверия и недоверия:
(12.4) |
где CF - фактор уверенности в гипотезе H при выполнении свидетельства E, MB - мера увеличения доверия гипотезе H при наличии свидетельства E, MD - мера увеличения недоверия гипотезе H при наличии свидетельства E.
Фактор уверенности позволяет комбинировать меру доверия и недоверия в единственное число.
Комбинирование мер доверия и недоверия в одно число имеет два применения. Первое, фактор уверенности может быть использован для упорядочения гипотез по их важности. Например, если предприятие имеет некоторые причины, свидетельствующие о возможных экономических явлениях, тогда экономическое явление с уровнем CF будет тем, которое первым исследовано путем упорядочения проверок.
Меры доверия и недоверия были определены в терминах вероятностей следующим образом:
(12.5)
Теперь max{0, 1} всегда равен 1 и min{0, 1} равен 0. Смысл записи 1 и 0 в терминах max и min состоит в том, чтобы показать формальную симметрию между MD и MB.
Уравнения (12.5) для MB и MD различаются только в замене max на min и наоборот. В соответствии с этими определениями некоторые характеристики указаны в табл.12.1.
Таблица 12.1. Некоторые характеристики MB, MD, CF
Характеристики | Значения |
Пределы | 0 £ MB £ 1 0 £ MD £ 1 -1 £ CF £ 1 |
Уверенность в истинности гипотезы P(H'|E)=1 | MB=1 MD=0 CF=-1 |
Уверенность в ложности гипотезы | MB=0 MD=1 CF=-1 |
Отсутствие свидетельства P(H|E)=P(H) | MB=0 MD=0 CF=0 |
Фактор уверенности CF указывает чистое доверие гипотезе, учитывая некоторое свидетельство. Положительное значение CF означает, что свидетельство поддерживает гипотезу, поскольку MB>MD. Значение CF=1 означает, что свидетельство окончательно доказывает гипотезу. Значение CF=0 означает одну из двух возможностей. Первая, значение CF=MB-MD может означать, что MB=MD=0, т.е. свидетельство отсутствует. Вторая, возможность, если MB=MD и оба значения не равны нулю. Результат в этом случае означает, что уверенность отвергается неуверенностью.
Отрицательное значение CF означает, что свидетельство благоприятствует отрицанию гипотезы, поскольку MB<MD. То есть недоверие гипотезе превышает доверие ей. CF=-70% означает, что недоверие гипотезе на 70% больше, чем доверие ей. CF=70% - доверие гипотезе на 70% больше, чем недоверие.
Заметим, что важна только разность между значениями по отдельности. Например,
CF=0,6-0=0,7-0,1.
Факторы уверенности позволяют эксперту выражать доверие, используя значение недоверия:
CF(H,E)+CF(H',E)=0,
Это означает, что свидетельство, поддерживающее гипотезу, уменьшает поддержку отрицания гипотезы на равное число, так что сумма всегда равна нулю.
Например, закладная одобряется, если
CF(H|E)=0,7, CF(H'|E)=-0,7,
которое означает:
1) я уверен на 70%, что будет одобрена закладная, если мой рейтинг высокий;
2) я уверен на -70%, что не будет одобрена закладная, если мой рейтинг низкий.
Отметим, что -70% может иметь место, так как факторы уверенности определены на интервале -1£ CF(H, E)£1, где нуль означает отсутствие свидетельства. Таким образом, значения, больше нуля благоприятствуют гипотезе, в то время как значения меньше нуля благоприятствуют отрицанию гипотезы. Утверждения 1) и 2) эквивалентны использованию факторов уверенности, аналогичных тому факту, что “да” - это отрицание “нет”. Значения CF могут быть выбраны вопросами: “Насколько вы уверены в том, что “высокий” рейтинг поможет одобрению закладной, если свидетельство подтверждает гипотезу?” или “Насколько вы уверены в том, что ваш “высокий” рейтинг поможет одобрению закладной?” Ответ 70% на каждый вопрос будет CF(H|E)=70% и CF(H'|E)=-70%.
Вычисления с использованием факторов уверенности. Хотя первоначальное определение фактора уверенности было CF=MB - MD, были трудности с этим определением, так как одна часть неподкрепленного свидетельства может управлять утверждением многих других частей свидетельства. Например, десять частей свидетельства могут произвести MB=0,999, одна неподтвержденная часть с MD=0,799.
CF=0,999 - 0,799=0,2.
В системе MYCIN для посылки правила должно быть CF>0,2.
Игнорирование порога привело бы к активации многих правил с малым значением CF или его отсутствием, что существенно уменьшило бы эффективность системы.
Определение CF в MYCIN было изменено и имело вид:
,
чтобы ослабить влияние одной части неподтверждения свидетельства. При таком определении MB=0,999 и MD=0,799 получаем значение
,
которое сильно отличается от ранее полученного значения 0,2 и таким образом не активизирует правило, поскольку не более, чем 0,2. Здесь значение 0,995 является причиной активации правила.
В системе MYCIN способы для комбинирования свидетельства в посылке правила показаны в табл. 12.2.
Таблица 12.2. Правила системы MYCIN для комбинирования предшествующего свидетельства элементарных выражений
Свидетельство E | Уверенность в посылке |
E1 и E2 | min{CF(H,E1),CF(H,E2)} |
E1 или E2 | max{CF(H,E1),CF(H, E2)} |
не E | -CF(H, E) |
Например, если логическое выражение для комбинирования свидетельств имеет вид:
(E1 И E2 И E3) ИЛИ (E4 И НЕ E5),
то свидетельство E может быть вычислено как:
E=max{min{E1, E2, E3}, min{E4, -E5}}.
Для значений E1-=0,9; E2=0,8; E3=0,3; E4=-0,5; E5=-0,4 получаем результат E=max{min{0,9, 0,8, 0,3}, min{-0,5, (-0,4)}} = max{0,3, -0,5} = 0,3
Вычисление фактора уверенности для правила
ЕСЛИ E, ТО H
задается формулой
(12.6) |
где CF(E,e) - фактор уверенности свидетельства E, компенсирующего посылку правила при неопределенном свидетельстве е; CF(H, E) - фактор уверенности гипотезы в предположении, что свидетельство известно с уверенностью, когда CF(E, e)=1;
CF(H, e) - фактор уверенности гипотезы, который основывается на уверенности в свидетельстве e.
Таким образом, если все свидетельства в посылке известны с уверенностью, то формула для фактора уверенности гипотезы имеет вид
,
поскольку CF(E, e)=1.
В качестве примера этих факторов уверенности рассмотрим CF для закладной в правиле, которое мы обсуждали выше, где фактор уверенности гипотезы при наступлении некоторого события равен CF(H,E)=CF(H,E1ÙE2ÙE3)=0,7 и он также называется фактором затухания.
Фактор затухания базируется на предположении, что все свидетельства E1, E2, E3 известны с уверенностью. То есть
где e наблюдаемое свидетельство, ведущее к заключению, что Ei известны с уверенностью. Эти факторы CF аналогичны условным вероятностям P(E,e) свидетельства в системе ПРОСПЕКТОР.
Трудности с системой ПРОСПЕКТОР появляются, когда все свидетельства неизвестны с определенностью. Интерполяция формулы в системе ПРОСПЕКТОР была использована для случая неопределенного события. В случае системы MYCIN основная формула (12.6) используется для определения значения CF, поскольку CF(H,E1ÙE2ÙE3)=0,7 небольшое значение для неопределенного свидетельства.
Например, определим, что
CF(E1, e)=0.5,
CF(E2, e)=0.6,
CF(E3,e)=0.3,
тогда
CF(E,e)=CF(E1ÙE2ÙE3,e)=min{CF(E1,e), CF(E2,e), CF(E3,e)}=min{0.5, 0.6, 0.3}.
Поскольку CF посылки, CF(E,e)>0.2, то посылка рассматривается истинной и таким образом правило активируется. Фактор заключения будет равен
CF(H, e)=CF(E, e) ∙CF(H, e)=0,3 ∙0,7=0,21.
Предположим, что другое правило так же включает ту же гипотезу, но с другим фактором уверенности. Факторы уверенности правил, включающих одинаковые гипотезы, вычисляются путем функции комбинирования для уже определенных факторов уверенности:
где формула для CFcombin зависит от знака имеющихся факторов. Функция комбинирования для более чем двух факторов применяется путем повторного вычисления по формуле (12.7) n факторов и (n+1) факторов:
.
если оба больше нуля
Предположим, что третье правило имеет такое же заключение, но с CF3=-0,4. Тогда вторая формула (12.7) дает результат
.
Формула (12.7) допускает коммутативность события, т.е. CFcombin(X, Y)=CFcombin(Y, X), и таким образом порядок получения свидетельств не влияет на результат.
Вместо того, чтобы хранить отдельно значения MD и MB для каждой гипотезы система MYCIN хранит текущее значение CFcombin для каждой гипотезы и комбинирует его с новым свидетельством в соответствии с формулой (12.7).
Трудности с фактором уверенности. Несмотря на успешное практическое применение факторов уверенности в системе MYCIN, имеются трудности с их теоретическим обоснованием. Хотя факторы уверенности и используют теорию вероятностей и теорию возможностей в качестве теоретического фундамента, все же они были построены для специального случая. Главным преимуществом факторов уверенности была простота вычислений, посредством которых неопределенность могла быть распространена в системе. Факторы уверенности также позволяют легко понять и четко отделить доверие от недоверия.
Однако имеются и проблемы с фактором CF. Одна из проблем состоит в том, что значения CF могут быть противоположны условным вероятностям. Например, если P(H1)=0,8, P(H2)=0,2 P(H1|E)=0,9, P(H2|E)=0,6, то CF(H1,E)=0,5 и CF(H2|E)=0,75.
Поскольку одна из целей CF - упорядочить гипотезы в соответствии с причинами, то противоречие с гипотезой будет состоять в том, чтобы иметь высокую вероятность P(H|E) и низкий фактор уверенности CF(H|E).
Вторая главная проблема с фактором CF состоит в том, что в общем случае P(H|e)¹P(H|i)∙P(i|e), где i - некоторая промежуточная гипотеза, базирующаяся на свидетельстве E, и еще фактор уверенности двух правил в цепи вывода вычисляются как независимые вероятности CF(H, e)=CF(H,i) ∙CF(i, e).
Эта формула истинна только в специальном случае, когда статистическая популяция со свойством H содержится в популяции со свойством i и что содержится в популяции со свидетельством e. Успех системы MYCIN в игнорировании этих проблем состоит, вероятно, в выполнении короткой цепи вывода и использовании простых гипотез.