MYCIN ("МИЦИН"), TEIRESIAS, EMYCIN- 1976 г.

ТЕМА ИИ – 9. Примеры ЭС

Лекция ИИ-9.1/2009

КЛАССИЧЕСКИЕ ЭС.

ПР0ИЗВОДСТВЕННЫЕ СИСТЕМЫ ИСКУССТВЕННОГГО ИНТЕЛЛЕКТА (ПСИИ)

КЛАССИЧЕСКИЕ ЭС

1. DENDRAL (Стефанюк, Попов/23)

Химия - одна из первых областей, в кот-х ИИ нашел прямое практическое применение.

Основа нового направления - "экспертные системы" - была заложена разработкой в середине 60-х гг в ВЦ Стэнфордского ун-та системы "Эвристический Дендрал" (Heuristic Dendral), кот-я осущ-сь в рамках Стэнфордского проекта, прод-ся 16 лет: 1965 - 1981.

У истоков разработки - Э. Фейгенбаум, Дж. Ледерберг (1985 - Ноб. премя за работы по генетике бактерий), в дальн-м подключился Б. Букхенен и др.

Цель разработки - создание программы, которая используя богатые знания по химии, заложенные в компьютер,

была бы способна воссоздать структурную формулу сложного органического соединения (т.е. структуру его молекулы) на основе его химической формулы и экспериментальных данных, полученных с пом. масс-спектрометра и характеризующих массы фрагментов молекул исследуемого вещества (т.е. на основе масс-спектрограммы данного вещества).

 

Эта задача относится к классу задач интерпретации и требует для своего решения высокой квалиф-ции.

 

1. ОРГАНИЗАЦИЯ ЗНАНИЙ

ЗНАНИЯ в этой ЭС состоят из структур молекул (химических структур), ограничений и правил.

Структуры молекул предст-ся в виде графов, где:

вершины - атомы, дуги - связи между атомами.

Ограничения предст-ся в виде подграфов, наличие которых в структуре молекулы запрещено.

Правила, с помощью которых генерируются возможные структуры молекул.

Они имеют форму "ситуация - действие", где "ситуация" и "действие" представлены в виде подграфов.

 

2. ПРОЦЕДУРА ВЫВОДА - эвристический поиск в три этапа:

"план - генерация - проверка".

 

(1) На этапе "ПЛАН" опред-ся

(возможно, с использованием входных данных от масс-спектрометра и известной химической ф-лы вещества- Е.Т.)

(а) пространство поиска решений [т.е. среди каких структур молекул надо искать структуру молекулы испытываемого вещества.- Е.Т.]

(б) ограничения, касающиеся допустимых структур молекул (т.е. решений), соответствующие входным данным, полученным от масс-спектрометра. Эти ограничения представлены в виде ЗАПРЕЩЕННЫХ СТРУКТУР (т.е. подграфов).

 

(2) На этапе "ГЕНЕРАЦИЯ" порождаются ВСЕ возмож-е стр-ры молекул (решения), удовлетв-щие ограничениям, т.е. не содержащие запрещенных подграфов (польз-ль может задавать дополнит-е ограничения).

При поиске структур примен-ся стратегия, "направляемая данными" (Попов- п.5.2, с. 124).

 

(3)На этапе "ПРОВЕРКА" осущ-ся отбор ЛУЧШИХ из предложенных решений (структур молекул):

из структур молекул, полученных на этапе "ГЕНЕРАЦИЯ", т.е. удовлетворяющих ограничениям, отбираются те, которые наиболее точно соотв-вуют исходным данным, полученным с пом. масс-спектрометра.

 

В первых версиях ЭС:

- минимальные объяснительные способности,

- простейший язык общения,

- трудоемкий и слабо автоматизир-й процесс приобретения знаний.

Затем была спец-но разр-на с-ма "Мета-Дендрал", кот-я автоматизир-ет процесс приобретения правил для ЭС ДЕНДРАЛ (Хейес-Рот и др. "Постороение ЭС" с. 19)

Возникают вопросы:

Почему ЭС разработана впервые - в химии?

Для химии харарктерны задачи, кот-е имеют дело не с числовыми, а с символьными данными и для решения кот-х требуется применять в первую очередь рассуждения, а не числовые выкладки.

Проект ДЕНДРАЛ - адресовался именно к таким задачам (характерным для химии), в кот-х числовые манипуляции играют второстепенную роль, а наиболее трудной частью явл-ся логические рассуждения.

Авторы исходили из того, что при тех же исх-х данных опытный химик может воссоздать стр-ру соединения,

но тратит 2-4 недели, т.е. способ решения з-чи человеку в принципе известен, но его применение слишком трудоемко.

 

Почему такие з-чи не были сформулир-ны для ЭВМ раньше?

1) предстояло выявить способ решения таких задач, используемый человеком

2) главная особенность и трудность - невычислительный характер таких задач.

 

Для преодоления этой проблемы и создания ЭС потребовалось использ-е всех методов, накопленных в области ИИ и позв-щих применять ВЫЧИСЛИТ. ТЕХНИКУ для решения НЕВЫЧИСЛИТ-Х ЗАДАЧ, а именно:

- методов построения логических рассуждений (док-во теорем),

- методов описания, представления и манипулир-ния в ЭВМ с символьными структурами с пом спциальных языков программир-я типа ЛИСП,

- методов описания, предст-ния и манипулир-ния ЗНАНИЯМИ.

 

Разр-ка с-мы ДЕНДРАЛ – это первая попытка уйти от "игрушечных" задач. Она считается блестящим рез-татом в области ИИ.

Кач-во решений этой ЭС обычно выше, чем у спец-та, ее использ-е ускоряет работу спец-та и ей и до сих пор пользуются химики всего мира с пом. сетей ЭВМ.

MYCIN ("МИЦИН"), TEIRESIAS, EMYCIN- 1976 г.

(Попов/24-25 и Гл. 2:34 -54)

MYCIN

С этого м-та развитие ЭС приобрело стремительный характер.

Авторы проекта ДЕНДРАЛ попытались выделить ту часть программы, кот-я явл-ся предметно независимой,в рез-те чего в конце 60-х - начале 70-х ггбыла создана ЭС МИЦИН (MYCIN), предназначенная для решения задач постановки диагноза и определения методов лечения инфекционных заболеваний крови.

Она должна консультировать врача при установлении диагноза и выдачи рекомендаций больным. В дальн-м область применения была расширена на ряд др-гих заболеваний.

При разр-ке ЭС MYCIN ставились след-е треб-ния:

Пр-ма дол-на

1)быть полезной для польз-ля - врача, т.е. давать засл-е доверия реком-ции, не уступ-щие рек-циям спец-та, и быть удобной в экспл-ции;

2) быть ориентир-на на приобретение и модиф-цию знаний;

3) уметь вести диалог, в ходе кот-го объяснять получ-й резт;

4) быть инстр-том, помогающим врачу, а не заменяющим его.

Пример ситуации использ-ния ЭС.

В ходе оперции пац-ту занесена инф-ция, а леч-щий врач не явл-ся спец-м в области инф-х заболеваний и ему треб-ся реком-ция по леч-ю такого забол-ния.

Установление возбудит-ля болезни и точное уст-ние диагноза треб-ет дост. длит-го времени (анализы) - порядка 48 часов, а лечение должно нач-ся немедленно. Выбор: назначить ср-во широкого действия либо специфич-е ср-во с риском не угадать. Предпочтение - первому. Анализ таких сит-ций в США: в теч года пениц-н был прописан каждому четвертому, но в 90% случаев в этом не было необх-ти.

 

ОРГАНИЗАЦИЯ ЗНАНИЙ

ЗНАНИЯ раздел-ся на ФАКТЫ и ПРАВИЛА.

ФАКТЫ предст-ны в виде троек

- "объект- атрибут (т.е. свойство объекта) –значение атрибута",

Каждой из таких "троек" присвоен нек-й коэфф-т определенности (КО)

ПРАВИЛА (их общее число -ок. 400) предст-ны в виде системы продукций в форме "УСЛОВИЕ – ДЕЙСТВИЕ".

УСЛОВИЕ предст-но на языке исчисления предикатов (как булевское выражение предикатных ф-ций, применимых к фактам), а "действие" - факт или операция над фактом.

(P & Q Ú R) M ® Z

Факту, напр., Z, получ-му в рез-те выполнения продукции, присваивается коэффициент оределенности (КО), кот-й выраб-ся по определ-м правилам на основе КО фактов, входящих в условие. Если этот КО менее некот-го принятого порог-го значения, то он приним-ся равным нулю.

 

ПРОЦЕДУРА ВЫВОДА - исчерпывающий поиск, "направляемый целями" (вывод в системе продукций)

Попов- п.5.2

Системе известно 100 заболеваний.

При постановке диагноза система осуществляет поиск в направлении ОТ ЦЕЛИ (т.е. искомого диагноза) к ДАННЫМ.

Базовая стратегия - "поиск в глубину":

система просматривает правые части продукций (т.е. "действия" или "заключения") и выделяет те из них, которые содержат заключения о каком-либо диагнозе (т.е. ЦЕЛИ).

Таким образом формируется множество ВСЕХ правил, в заключении которых устанавливается какой-либо диагноз (ЦЕЛЬ).

Пусть множество таких правил - {X}.

Затем для всех правил множества {X} система выясняет выясняется, истинны ли УСЛОВИЯ выполнения этих заключений, т.е. ЦЕЛЕЙ (представленные левыми частями продукций).

Если для некоторого условия неизвестно, ИСТИННО ли оно, то входящие в это условие факты рассматриваются как подцели (т.е. новые цели) и процесс повторяется:

выбираются ВСЕ правила, в заключении (т.е. в правой части ) которых имеются эти подцелии т. д. , пока не будет установлена ИСТИННОСТЬ одной из целей (диагнозов), Возможно, что ни одна из целей не окажется истинной.

В рез-те будет найден путь (если он сущ-ет), приводящий от фактов, опис-щих условие задачи, к диагнозу (подробнее - Попов/п. 2.3, с.41).

 

Диалог с врачом: на ограниченном англ-м языке(простой лингв-й процессор - дост-но понимать смысл предл-ний на ур-не ключевых слов) .

Объясн-е спос-ти: система анализирует процесс получения решения и отвечает на вопросы ПОЧЕМУ был использован некий факт или КАК этот факт был установлен (Попов/с.44).

Система обл-ет спос-тью модифиц-ть знания и приобретать новые.

Для развития объяснит-х спос-тей и автоматизации приобретения знаний построена инструм-ная с-ма TEIRESIAS.

EMYCIN

Для того, чтобы использовать этот подход для более широкого круга польз-лей авторы проекта MYCINвыделили "в чистом виде" идеи, заложенные в этой прог-мме.

В рез-те была создана ПЕРВАЯ "ПУСТАЯ ЭС", т.е. "оболочка" или инструментальная с-ма, названная EMYCIN (Empty MYCIN - пустая MYCIN).

Это версия MYCIN, не завис-щая от проблемной области, т.е. базовая с-ма для решения задач диагностики. Она позволяет применять процедуры вывода к такой предметной обл-ти, знания о которой могут быть записаны в виде правил MYCIN.

Об ЭС MYCIN. См. подробнее: П. Джексон/с. 72-80;

Попов-1987/с. 34-54 – оч. подробно

3. PROSPECTOR- 1979 -81(Попов/25)

Геология. Задача - помочь геологу определить наличие месторождения определенной руды на основе анализа геологич-ких данных. Достигла стадии промышленной системы.

Кач-во решений не уступает решениям спец-та.

С пом этой ЭС найдено месторождение молибдена стоимостью ок. 100 млн долл.

ЗНАНИЯ предст-ны в виде моделей, каждая из кот-х соотв-ет месторождению опред-го типа.

При этом используются правила вида "условие -действие".

"Условие" и Действие" – это утверждения о проблемной области , которые могут быть истинными или ложнвми.

"Условие" явл-ся булевской комбинацией утверждений. "Действие" состоит из одного утверждения.

Для работы с неопределенными знаниями с каждым утверждением сопоставляется значение вероятности, оценивающее степень истинности данного утверждения.

Вероятность простого утверждения, т.е. не сод-щего булевские операции, опред-ся из ответов польз-ля (или по правилу Байеса).

Вероятность логического утверждения, т.е. сод-щего булевские операции, вычисляется на основе вер-тей компонент этого утверждения по определ-м правилам (правилам Заде для нечетких множ-в).

 

ПРОЦЕДУРА ВЫВОДА

Возможен поиск, "направляемый ЦЕЛЯМИ" (как в MYCIN) или "направляемый ДАННЫМИ" (от ДАННЫХ к ЦЕЛИ).

Общение польз-ля с ЭС – с пом. обмена простыми предложениями англ. яз.

см. Попов/ с. 25-26

 

………………………..ДРУГИЕ ЭС ..........................

4.CADUCEUS (Попов/26) - публ-ция 1977

Пробл. область - Диагностика внутренних болезней.

Содержит инф-ю о 500 болезнях (80% всех изв-х терапевтических заболеваний)

 

5. Коммерческая ЭС R1 1980

Конфигурация ВС VAX 11/780 ф-мы DEC по заказу польз-ля

Попов/с27

6. Инструм-е с-мы OPS 5, ROSIE, HEARSAY III, RLL

Попов/с. 28-33

…………………………………………………………………………………………..