Класифікація рівнів розуміння

Логічні моделі.

Мережні моделі.

Продукційні моделі.

Сценарії.

2. Інтелектуальний інтерфейс.

 

Класифікація моделей подання знань

Логічні моделі

Постановка і рішення будь-якої задачі завжди пов'язані з її "зануренням" у відповідну предметну область. Так, вирішуючи завдання складання розкладу обробки деталей на металорізальних верстатах, ми втягуємо в предметну область такі об'єкти, як конкретні верстати, деталі, інтервали часу і загальні поняття "верстат", "деталь", "тип верстата" і т.п. Всі предмети і події, які становлять основу загального розуміння необхідної для рішення задачі інформації, називаються предметною областю. Уявно предметна область уявляється такою, що складається з реальних або абстрактних об'єктів, званих сутностями.

Сутності предметної області перебувають у певних відносинах одна з одною (асоціаціях), які також можна розглядати як сутності і включати в предметну область. Між сутностями спостерігаються різні відносини подібності. Сукупність подібних сутностей становить клас сутностей, що є новою сутністю предметної області.

Відносини між сутностями виражаються за допомогою суджень. Це уявно можлива ситуація, що може мати місце для пропонованих сутностей або не мати місця. У мові (формальній або природній) судженням відповідають речення. Судження і речення також можна розглядати як сутності й включати в предметну область.

Мови, призначені для опису предметних областей, називаються мовами подання знань. Універсальною мовою подання знань є природна мова. Однак використання природної мови в системах машинного подання знань стикається з великими труднощами через властиві їй нерегулярності, двозначності і т.п. Але головна перешкода полягає у відсутності формальної семантики природної мови, що мала б досить ефективну операційну підтримку.

Для подання математичного знання в математичній логіці давно користуються логічними формалізмами – головним чином обчисленням предикатів, що мають ясну формальну семантику й операційну підтримку в тому розумінні, що для них розроблені механізми доведення. Тому доведення предикатів було першою логічною мовою, яку застосували для формального опису предметних областей, пов'язаних з рішенням прикладних задач.

Описи предметних областей, виконані в логічних мовах, називаються логічними (формальними) моделями.

Мережні моделі

Під сутністю будемо розуміти об'єкт довільної природи. Цей об'єкт може існувати в реальному світі. У цьому випадку він буде називатися П-сутністю. У базі знань йому відповідає деякий опис, повнота якого визначається тією інформацією, яку ІС має про П-сутності. Таке подання в базі знань називається М-сутністю. Зазначимо, що можуть існувати М-сутності, для яких у навколишньому для ІС світі немає відповідних П-сутностей. Такі М-сутності являють собою абстрактні об’єкти, отримані в результаті операцій типу узагальнення всередині бази знань.

Поділ на два типи сутностей дозволяє використати в мережних моделях ідеї, уперше сформульовані в теорії семіотичних моделей і заснованому на них ситуаційному керуванні. Під семіотичними моделями проблемних областей буде розумітися комплекс процедур, які дозволяють відображати в базі знань П-сутності і їхні зв'язки, які фіксуються в проблемній області інженером по знаннях, у сукупність зв'язаних між собою М-сутностей. Спосіб інтерпретації взаємозалежних П-сутностей буде називатися денотативною семантикою, а спосіб інтерпретації взаємозалежних М-сутностей – конотативною семантикою.

П-сутність відносно відповідної їй у базі знань М-сутності називається денотатом або референтом цієї М-сутності, а М-сутність відносно вихідної П-сутності – її десигнатом, ім'ям, міткою, ідентифікатором і т.п. Десигнат – це найпростіший елемент у мережній моделі. Він входить до класу термінальних об'єктів мережної моделі. Термінальним об'єктом називається М-сутність, яка не може бути розкладена на більш прості сутності. Інші М-сутності називаються похідними об'єктами або похідними М-сутностями.

Перелік термінальних об'єктів, які можуть утворювати класи або типи, задається при проектуванні ІС. Ними можуть бути цілі дійсні числа, ідентифікатори, рядки, списки й т.п. Семантика термінальних об'єктів визначається набором припустимих процедур, які оперують із ними, наприклад: арифметичні дії над числами, порівняння між собою рядків або ідентифікаторів, операції введення-виведення, що включають необхідні трансформації подання, і т.д.

Продукційні моделі

Продукції наряду із фреймами є найбільш популярними засобами подання знань в ІС. Продукції, з одного боку, близькі до логічних моделей, що дозволяє організовувати на них ефективні процедури доведення, а з іншого боку, більш наочно відображають знання, ніж класичні логічні моделі. У них відсутні тверді обмеження, характерні для логічних доведень, що дає можливість змінювати інтерпретацію елементів продукції.

У загальному вигляді під продукцією розуміється вираз наступного виду:

(i); Q; Р; А=>В; N.

Тут i – ім'я продукції, за допомогою якого дана продукція виділяється із усієї множини продукцій. В якості імені може виступати деяка лексема, яка відображає суть даної продукції (наприклад, "купівля книги" або "набір коду замка"), або порядковий номер продукції в їхній множині, що зберігається в пам'яті системи.

Елемент Q характеризує сферу застосування продукції. Такі сфери легко виділяються в когнітивних структурах людини. Наші знання ніби "розкладені по поличках". На одній "поличці" зберігаються знання про те, як треба готовити їжу, на іншій – як добратися до роботи і т.п. Поділ знань на окремі сфери дозволяє заощаджувати час на пошук потрібних знань. Такий же поділ на сфери в базі знань ІС доцільний при використанні для подання знань продукційних моделей.

Основним елементом продукції є її ядро: А=>В. Інтерпретація ядра продукції може бути різною і залежить від того, що стоїть ліворуч і праворуч від знака секвенції =>. Звичайне читання ядра продукції виглядає так: ЯКЩО A, ТО B, більш складні конструкції ядра допускають у правій частині альтернативний вибір, наприклад, ЯКЩО А, ТО B1, ІНАКШЕ B2. Секвенція може витлумачуватися у звичайному логічному сенсі як знак логічного проходження В із чистого А (якщо А не є чистим виразом, то про В нічого сказати не можна). Можливі й інші інтерпретації ядра продукції, наприклад A описує деяку умову, необхідну для того, щоб можна було зробити дію В.

Елемент Р – є умова застосовності ядра продукції. Зазвичай Р являє собою логічний вираз (як правило, предикат). Коли Р приймає значення "істина", то ядро продукції активізується. Якщо Р фальшиве, то ядро продукції не може бути використано. Наприклад, якщо в продукції "НАЯВНІСТЬ ГРОШЕЙ; ЯКЩО ХОЧЕШ КУПИТИ РІЧ X, ТО ЗАПЛАТИ В КАСУ ЇЇ ВАРТІСТЬ І ВІДДАЙ ЧЕК ПРОДАВЦЕВІ" умова застосовності ядра продукції фальшива, тобто грошей немає, то застосувати ядро продукції неможливо.

Елемент N описує постумови продукції. Вони актуалізуються тільки в тому випадку, коли ядро продукції реалізувалося. Постумови продукції описують дії і процедури, які необхідно виконати після реалізації В. Наприклад, після покупки деякої речі в магазині необхідно в описі товарів, наявних у цьому магазині, зменшити кількість речей такого типу на одиницю. Виконання N може відбуватися не відразу після реалізації ядра продукції.

Якщо в пам'яті системи зберігається деякий набір продукцій, то вони утворять систему продукцій. У системі продукцій повинні бути задані спеціальні процедури керування продукціями, за допомогою яких відбувається актуалізація продукцій і вибір для виконання тієї або іншої продукції із числа актуалізованих.

У ряді ІС використовуються комбінації мережних і продукційних моделей подання знань. У таких моделях декларативні знання описуються в мережному компоненті моделі, а процедурні знання – у продукційному. У цьому випадку говорять про роботу продукційної системи над семантичною мережею.

Сценарії

Особливу роль у системах подання знань грають стереотипні знання, що описують відомі стандартні ситуації реального світу. Такі знання дозволяють відновлювати інформацію, пропущену в описі ситуації, пророкувати появу нових фактів, які можна очікувати в даній ситуації, встановлювати зміст походження ситуації з погляду більш загального ситуативного контексту.

Для опису стереотипного знання використовуються різні моделі. Серед них найпоширенішими є сценарії. Сценарієм називається формалізований опис стандартної послідовності взаємозалежних фактів, що визначають типову ситуацію предметної області. Це можуть бути послідовності дій або процедур, що описують способи досягнення цілей діючих осіб сценарію (наприклад, обід у ресторані, відрядження, політ літака, вступ до ВНЗ). В ІС сценарії використовуються в процедурах розуміння природно-мовних текстів, планування поведінки, навчання, прийняття рішень, керування змінами середовища й ін.

 

Інтелектуальний інтерфейс

Припустимо, що на вхід ІС надходить текст. Будемо говорити, що ІС розуміє текст, якщо вона дає відповіді, правильні з погляду людини, на будь-які питання, що ставляться до того, про що говориться в тексті. Під "людиною" розуміється конкретна людина-експерт, якій доручено оцінити здатності системи до розуміння. Це вносить частку суб'єктивізму, тому що різні люди можуть по-різному розуміти ті самі тексти.

Класифікація рівнів розуміння

В існуючих ІС можна виділити п'ять основних рівнів розуміння і два рівні метарозуміння.

Перший рівень характеризується схемою, яка показує, що будь-які відповіді на питання система формує тільки на основі прямого змісту, введеного з тексту. Якщо, наприклад, у систему введений текст: "У вісім ранку, після сніданку, Петя пішов до школи. О другій годині він повернувся додому. Після обіду він пішов гуляти", то на першому рівні розуміння система зобов'язана вміти відповідати правильно на питання типу: "Коли Петя пішов до школи?" або "Що зробив Петя після обіду?". У лінгвістичному процесорі відбувається морфологічний, синтаксичний і семантичний аналіз тексту і питань, що ставляться до нього. На виході лінгвістичного процесора має бути внутрішнє подання тексту і питань, з якими може працювати блок доведення. Використовуючи спеціальні процедури, цей блок формує відповіді. Інакше кажучи, уже розуміння на першому рівні вимагає від ІС певних засобів подання даних і доведення на цих даних.

На другому рівні додаються засоби логічного доведення, засновані на інформації, що міститься в тексті. Це різноманітні логіки тексту (часова, просторова, каузальна і т.п., які здатні породити інформацію, явно відсутню в тексті. Для нашого прикладу на другому рівні можливе формування правильних відповідей на питання типу: "Що було раніше: відхід Петі до школи чи його обід?" або "Гуляв Петя після повернення зі школи?" Тільки побудувавши часову структуру тексту, ІС зможе відповісти на подібні питання.

Схема ІС, за допомогою якої може бути реалізований другий рівень розуміння, має ще одну базу знань. У ній зберігаються закономірності, які ставляться до часової структури подій, можливої їхньої просторової організації, каузальної залежності і т.п., а логічний блок має всі необхідні способи роботи із псевдофізичними логіками.

Третій рівень. До засобів другого рівня додаються правила поповнення тексту знаннями системи про середовище. Ці знання в ІС, як правило, носять логічний характер і фіксуються у вигляді сценаріїв або процедур іншого типу. На третьому рівні розуміння ІС повинна дати правильні відповіді на питання типу: "Де був Петя о десятій ранку?" або "Звідки Петя повернувся о другій годині дня?" Для цього треба знати, що означає процес "перебування у школі" і, зокрема, що цей процес є безперервним і що суб'єкт, який бере участь у ньому, увесь час перебуває "у школі".

Схема ІС, у якій реалізується розуміння третього рівня, зовні не відрізняється від схеми другого рівня. Однак у логічному блоці повинні бути передбачені засоби не тільки для чисто дедуктивного доведення, але й для доведення за сценаріями.

Три перерахованих рівні розуміння реалізовані у всіх практично працюючих ІС. Перший рівень і частково другий входять до різноманітних систем спілкування природною мовою.

Наступні два рівні розуміння реалізовані в існуючих ІС лише частково.

Четвертий рівень. Замість тексту тут використовується розширений текст, який зароджується лише при наявності двох каналів одержання інформації. По одному в систему передається текст, по іншому – додаткова інформація, відсутня в тексті. При людській комунікації роль другого каналу, як правило, грає зір. Більше одного каналу комунікації мають інтелектуальні роботи, які володіють зором.

Зоровий канал комунікації дозволяє фіксувати стан середовища "тут і зараз" і вводити в текст спостережувану інформацію. Система стає здатною до розуміння текстів, у які введені слова, прямо пов'язані з тією ситуацією, у якій зароджується текст. На більш низьких рівнях розуміння не можна зрозуміти, наприклад, текст: "Подивіться, що зробив Петя! Він не повинен був брати це!" При наявності зорового каналу процес розуміння стає можливим.

При наявності четвертого рівня розуміння ІС здатна відповідати на питання типу: "Чому Петя не повинен був брати це?" або "Що зробив Петя?" Якщо питання, що надійшло в систему, відповідає третьому рівню, то система видає потрібну відповідь. Якщо для відповіді необхідно залучити додаткову ("екзегетичну") інформацію, то внутрішнє подання тексту і питання передається в блок, який здійснює співвіднесення тексту з тією реальною ситуацією його зародження, яка доступна ІС по зоровому або якому-небудь іншому каналу фіксації ситуації зовнішнього світу.

П'ятий рівень. Для відповіді на цьому рівні ІС крім тексту використовує інформацію про конкретного суб'єкта, що є джерелом тексту, і загальну інформацію, що зберігається в пам'яті системи (знання про організацію спілкування, про цілі учасників спілкування, про норми участі в спілкуванні). Теорія, що відповідає п'ятому рівню, це так звана теорія мовних актів.

Була звернена увага на те, що будь-яка фраза не тільки позначає якесь явище дійсності, але й поєднує в собі три дії: локуцію, іллокуцію і перлокуцію. Локуція – це говоріння як таке, тобто ті дії, які людина зробила, щоб висловити свою думку. Іллокуція – це дія за допомогою говоріння: питання, спонукання (наказ або прохання) і твердження. Перлокуція – це дія, якою мовець намагається здійснити деякий вплив на слухаючого: "лестити", "дивувати", "умовляти" і т.д. Мовний акт можна визначити як мінімальну осмислену (або доцільну) одиницю мовного поводження. Кожен мовний акт складається з локутивного, іллокутивного й перлокутивного акту.

Для четвертого й п'ятого рівнів розуміння цікаві результати за невербальними (несловесними) компонентами спілкування і психологічних принципів, що лежать в основі спілкування. Крім того, до правил поповнення тексту входять правила доведення, що спираються на знання про даний конкретний суб'єкт спілкування, якщо такі знання в системи є. Наприклад, система може довіряти даному суб'єктові, вважаючи, що породжуваний ним текст щирий, але може не довіряти йому й розуміти текст, корегуючи його у відповідності зі своїми знаннями про суб'єкт, що зародив текст. Знання такого типу повинні спиратися на психологічні теорії спілкування, які поки розвинені недостатньо.

Наприклад, на вхід системи надходить текст: "Ніна обіцяла незабаром прийти". Якщо про Ніну в системи немає ніякої інформації, то вона може звернутися до бази знань і використати для оцінки часового покажчика "незабаром" деяку нормативну інформацію. Із цієї інформації можна довідатися, що з великою часткою впевненості "незабаром" не перевищує півгодини. Але в системі може бути спеціальна інформація про ту Ніну, про яку мова йде у вхідному тексті. У цьому випадку система, одержавши потрібну інформацію з бази знань, може приготуватися, наприклад, до того, що Ніна швидше за все прийде не раніше ніж через годину.

Перший метарівень. На цьому рівні відбувається зміна вмісту бази знань. Вона поповнюється фактами, відомими системі і, які утримуються в тих текстах, що в систему введені. Різні ІС відрізняються одна від одної характером правил зародження фактів стосовно знань. Наприклад, у системах, призначених для експертизи в області фармакології, ці правила спираються на методи індуктивного доведення і розпізнавання образів. Правила можуть бути засновані на принципах ймовірностей, розмитих доведень і т.п. Але у всіх випадках база знань виявляється апріорно неповною. У таких ІС виникають труднощі з пошуком відповідей на запити. Зокрема, у базах знань стає необхідним немонотонне доведення.

Другий метарівень. На цьому рівні відбувається породження метафоричного знання. Правила породження знань метафоричних рівнів, використовувані для цих цілей, являють собою спеціальні процедури, що спираються на доведення за аналогією і асоціацію. Відомі в цей час схеми доведення за аналогією використовують, як правило, діаграму Лейбніца, яка відбиває лише окремий випадок міркувань за аналогією. Ще більш бідні схеми асоціативних міркувань.

Якщо розглядати рівні і метарівні розуміння з погляду архітектури ІС, то можна спостерігати послідовне нарощування нових блоків і ускладнення реалізованих ними процедур. На першому рівні досить лінгвістичного процесора з базою знань, що ставляться тільки до самого тексту. На другому рівні в цьому процесорі виникає процедура логічного доведення. На третьому рівні необхідна база знань. Поява нового каналу інформації, що працює незалежно від вихідного, характеризує четвертий рівень. Крім процедур, пов'язаних з роботою цього каналу, з'являються процедури, що погоджують між собою результати роботи двох каналів, які інтегрують інформацію, одержувану по кожному з них. На п'ятому рівні розвиток одержують різноманітні способи доведення на знаннях і даних. На цьому рівні стають важливими моделі індивідуального і групового поводження. На метарівнях виникають нові процедури для маніпулювання знаннями, яких не було на більш низьких рівнях розуміння. І цей процес носить відкритий характер. Розуміння в повному обсязі – якась, очевидно, недосяжна мрія. Але розуміння на рівні "побутового розуміння" людей в ІС цілком досяжне.

Існують і інші інтерпретації феномену розуміння. Можна, наприклад, оцінювати рівень розуміння за здатністю системи до пояснення отриманого результату. Тут можливі не тільки рівні пояснення, коли система пояснює, що вона зробила, наприклад, на основі введеного до неї тексту, але й рівень обґрунтування (аргументації), коли система обґрунтовує свій результат, показуючи, що він не суперечить тій системі знань і даних, якими вона володіє. На відміну від пояснення обґрунтування завжди пов'язане із сумою фактів і знань, які визначаються на даний момент існування системи. І текст, що вводиться для розуміння, в одних станах може бути сприйнятий системою як щирий, а в інших – як помилковий. Крім пояснення і обґрунтування можлива ще одна функція, пов'язана з розумінням текстів, – виправдання. Виправдати щось означає, що виведені твердження не суперечать тій системі норм і цінностей, які закладені в ІС. Існуючі ІС типу експертних систем, як правило, здатні давати пояснення і лише частково обґрунтування. У повному обсязі процедури обґрунтування і виправдання ще не реалізовані.