Активные индивидуальные методы

Текстологические методы

С извлечением знаний из текстов мы сталкиваемся ежедневно. Этот способ обычно всегда предшествует коммуникативным методам, подготавливая инженера по знаниям и знакомя его с терминологией и основными идеями.

Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении специальных текстов из учебников, монографий, статей и других носителей профессиональных знаний.

Задачу извлечения знаний из текстов можно сформулировать как задачу понимания и выделения смысла текста. Сам текст на естественном языке является лишь проводником смысла, а замысел и знания автора лежат во вто­ричной структуре (то есть смысловой структуре текста).

Рассмотрим этапы одной из возможных методик анали­за текстов с целью извлечения и структурирования знаний.

1. Составление "базового" списка литературы для ознакомления с предметной областью и чтение литературы по списку.

2. Первое знакомство с текстом (беглое прочтение) с выписыванием незна­комых слов.

3. Консультации со специалистами или привлечение справочной литерату­ры для их понимания.

4. Внимательное (второе) прочтение текста с выписыванием наборов клю­чевых слов (НКС), т. е. выделение "смысловых вех" (компрессия текста).

5. Определение связей между НКС, разработка семантической структуры текста в форме графа или "сжатого" реферата (здесь фактически происходит формирование поля знаний).

6. Третье прочтение текста и коррекция поля знаний при необходимости.

Коммуникативные методы

Определение:

Пассивные методы извлечения знаний включают методы, где ведущая роль в процессе извлечения знаний передается эксперту, а инженер по знаниям только фиксирует его рассуждения, используемые во время работы по принятию реше­ний.

Согласно классификации к этой группе относятся:

Ø наблюдения;

Ø анализ протоколов "мыслей вслух";

Ø лекции.

Наблюдения

В процессе наблюдений инженер по знаниям находится непосредственно ря­дом с экспертом во время его профессиональной деятельности или имитации этой деятельности. При подготовке к сеансу извлечения знаний эксперту необходимо объяснить цель наблюдений и попросить эксперта максимально комментировать свои действия.

Во время сеанса аналитик записывает все действия эксперта, его реплики и объяснения. Полезной может оказаться и видеозапись в реальном масштабе времени, если эксперт согласится. Непременное условие этого метода — невмешательство аналитика в работу эксперта.

Существуют две основные разновидности проведения наблюдений:

Ø наблюдение за реальным процессом;

Ø наблюдение за имитацией процесса.

Обычно используются обе разновидности. Сначала инженеру по знаниям полезно наблюдать за реальным процессом, чтобы глубже понять предмет­ную область и отметить все внешние особенности процесса принятия реше­ния.

Наблюдение за имитацией процесса проводят обычно также за рабочим ме­стом эксперта, но сам процесс деятельности запускается специально для аналитика.

Наблюдения за имитацией проводят также и в тех случаях, когда наблюде­ния за реальным процессом по каким-либо причинам невозможны (напри­мер, профессиональная этика врача-психиатра может не допускать присут­ствия постороннего на приеме).

Наблюдения — один из наиболее распространенных мето­дов извлечения знаний на начальных этапах разработки. Обычно он приме­няется не самостоятельно, а в совокупности с другими методами.

Анализ протоколов "мыслей вслух"

Протоколирование "мыслей вслух", или "вербальные отчеты", отличаются от наблюдений тем, что эксперта просят не просто прокоммен­тировать свои действия и решения, но и объяснить, как это решение было найдено, т. е. продемонстрировать всю цепочку своих рассуждений. Во вре­мя рассуждений эксперта все его слова, весь "поток сознания" протоколиру­ется инженером по знаниям, при этом полезно отметить даже паузы и меж­дометия.

Вопрос об использовании для этой цели диктофонов явля­ется дискуссионным, поскольку диктофон иногда парализующе действует на эксперта, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.

Основной трудностью при протоколировании "мыслей вслух" является принципиальная сложность для любого человека объяснить, как он думает. При этом существуют экспериментальные психологические доказательства того факта, что люди не всегда в состоянии достоверно описывать мысли­тельные процессы. Кроме того, часть знаний, хранящихся в невербальной форме (например, знания типа "как завязывать шнурки"), вообще слабо коррелируют с их словесным описанием.

Расшифровка полученных протоколов производится инженером по знаниям самостоятельно, с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное протоколирование "мыслей вслух" является одним из наиболее эффективных методов извлечения знаний.

От инженера по знаниям метод "мысли вслух" требует тех же умений, что и метод наблюдений. Обычно "мысли вслух" дополняются потом одним из активных методов для реализации обратной связи между интерпретацией инженера по знаниям и представлениями эксперта.

Лекции

Лекция является самым старым способом передачи знаний.

В лекции эксперту предоставлено много степеней свободы для самовыраже­ния; при этом необходимо сформулировать эксперту тему и задачу лекции.

Опытный лектор может заранее структурировать свои знания и ход рассуждений. От инженера по знаниям в этой ситуации требуется лишь грамотно законспек­тировать лекцию и в конце задать необходимые вопросы.

Искусство написания конспекта лекции заключается в "помехоустойчивости". То есть это умение записывать главное, опускать второстепенное, выделять фрагменты знаний (параграфы, подпараграфы), записывать только осмысленные предложения, уметь обобщать.

Хороший вопрос по ходу лекции помогает и лектору, и слушателю. Серьез­ные и глубокие вопросы могут существенно поднять авторитет инженера по знаниям в глазах эксперта.

Опытный лектор знает, что все вопросы можно условно разбить на три группы:

Ø умные вопросы, углубляющие лекцию;

Ø глупые вопросы или вопросы не по существу;

Ø провокационные вопросы.

Если инженер по знаниям задает вопросы второго типа, то возможны две реакции. Вежливый эксперт будет разговаривать с таким аналитиком как с ребенком. Заносчивый эксперт просто выйдет из контакта, не желая терять время. Если же инженер по знаниям захочет продемонстрировать свою эрудицию вопросами третьего типа, то ничего, кроме раздражения и отчуждения, он, по-видимому, в ответ не получит.

Продолжительность лекции рекомендуется стандартная — от 80 до 100 минут с перерывом 5—10 минут в середине лекции. Курс обычно от двух до пяти лекций.

Метод извлечения знаний в форме лекций, как и все пассивные методы, используют в начале разработки как эффективный способ быстрого погружения инженера по знаниям в предметную область.

Активные индивидуальные методы

Активные индивидуальные методы извлечения знаний на сегодняшний день — наиболее распространенные. В той или иной степени к ним прибе­гают при разработке практически любой ЭС.

К основным активным методам можно отнести:

· анкетирование;

· интервью;

· свободный диалог.

Во всех этих методах активную функцию выполняет инженер по знаниям, который пишет сценарий и режиссирует сеансы извлечения знаний.

Анкетирование

Анкетирование представляет собой самый жесткий метод, т. е. наиболее стандартизирован­ный. В этом случае инженер по знаниям заранее составляет вопросник или анкету и использует для опроса нескольких экспертов. В этом состоит основное преимущество анкетирования.

Сама процедура может проводиться двумя способами:

Ø аналитик вслух задает вопросы и сам заполняет анкету по ответам эксперта;

Ø эксперт самостоятельно заполняет анкету после предварительного инструктирования.

При использовании второго способа у эксперта появляется неограниченное время на об­думывание ответов, что может являться преимуществом в некоторых ситуациях.

Разработка анкеты для применения данного метода является важнейшим элементом, определяющим эффективность извлечения знаний. Для успешного проведения анкетирования разработано несколько общих рекомендаций для составления анкет. Эти рекомендации являются универсальными, т. е. не зависят от предметной области.

Инженерам по знаниям рекомендуется пользоваться этими рекомендациями для повышения эффективности применения данного метода.

Интервью

Под интервью понимается специфическая форма общения инженера по знаниям и эксперта, в которой инженер по знаниям задает эксперту се­рию заранее подготовленных вопросов с целью извлечения знаний о пред­метной области. Наибольший опыт в проведении интервью накоплен в журналистике и социологии. Большинство специалистов этих областей отмечают, тем не менее, крайнюю недостаточность теоретических исследований по тематике интервьюирования.

Интервью очень близко тому способу анкетирования, когда аналитик сам заполняет анкету, занося туда ответы эксперта. Основное отличие интервью в том, что оно позволяет аналитику опускать ряд вопросов в зависимости от ситуации, вставлять новые вопросы в анкету, изменять темп, разнообразить ситуацию общения.

Свободный диалог

Свободный диалог – это метод извлечения знаний в форме беседы инженера по знани­ям и эксперта, в котором нет жесткого регламентированного плана и во­просника.

Это определение не означает, что к свободному диалогу не надо готовиться. Напротив, внешне свободная и легкая форма этого метода тре­бует высочайшей профессиональной и психологической подготовки.

Так, в одном из исследований по технике ведения профессиональных жур­налистских диалогов было эксперимен­тально доказано, что одобрительное и поощрительное "хмыканье" интер­вьюера увеличивает длину ответов респондента.

В свободном диалоге важно также выбрать правильный темп или ритм бесе­ды: без больших пауз, т. к. эксперт может отвлечься, но и без гонки, иначе быстро утомляются оба участника, и нарастает напряженность, кроме того, некоторые люди говорят и думают очень медленно. Умение чередовать раз­ные темпы, напряжение и разрядку в беседе существенно влияет на ре­зультат.

Подготовка к диалогу так же, как и к другим активным методам извлечения знаний, включает составление плана для проведения сеанса извлечения знаний.

Активные групповые методы

К групповым методам извлечения знаний относятся:

Ø экспертные игры;

Ø дискуссии за "круглым столом" с участием нескольких экспертов;

Ø "мозговые штурмы".

Основное достоинство групповых методов — это возможность одновремен­ного получения знаний от нескольких экспертов, взаимодействие кото­рых вносит в этот процесс элемент принципиальной новизны от наложения разных взглядов и позиций.

"Круглый стол"

Метод «круглого стола» предусматри­вает обсуждение какой-либо проблемы из выбранной предметной области, в котором принимают участие с равными правами несколько экспертов. Обычно вначале участники высказываются в определенном порядке, а затем переходят к живой свободной дискуссии. Число участников дискуссии колеблется от трех до пяти — семи.

От инженера по знаниям подготовка "круглого стола" потребует дополнительных усилий: как организационных (определение места, времени, обстановки и т. д.), так и психологических (умение вставлять уместные реплики, чувство юмора, память на имена, способность избегать конфликтные ситуации и т. д.).

Ход беседы за круглым столом удобно записывать на диктофон, а при расшифровке и анализе результатов учитывать этот эффект, а также взаим­ные отношения участников.

Задача дискуссии — коллективно, с разных точек зрения, под различными углами исследовать спорные гипотезы предметной области. Обычно эмпи­рические области богаты таким дискуссионным материалом. На "круглый стол" обычно приглашают представителей разных научных направлений и разных поколений, это также уменьшает опасность получения односторон­них однобоких знаний.

По ходу дискуссии важно проследить, чтобы слишком эмоциональные и разговорчивые эксперты не подменили тему обсуждения, и чтобы критика позиций друг друга была обоснованной.

"Мозговой штурм"

"Мозговой штурм" или "мозговая атака" — один из наиболее распростра­ненных методов раскрепощения и активизации творческого мышления.

Впервые этот метод был использован в 1939 г. в США как способ получения новых идей в условиях запрещения критики.

Замечено, что боязнь критики мешает творческому мышлению, поэтому основная идея штурма — это отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки высказанных идей.

Как правило, штурм длится недолго (около 40 минут). Участникам (до 10 человек) предлагается высказывать любые идеи (шутливые, фантастиче­ские, ошибочные) на заданную тему. Обычно выска­зывается более 50 идей.

Регламент – до 2 минут на выступление. Самый инте­ресный момент штурма — это наступление пика, когда происходит непроизвольная генерация гипотез участниками. Этот пик имеет теоретическое обоснование в работах выдающегося швейцарского психолога и психиатра 3. Фрейда о бессозна­тельном.

При последующем анализе всего лишь 10—15% идей оказываются разумными, но среди них бывают весьма оригинальные. Оценивает резуль­таты обычно группа экспертов, не участвовавшая в генерации.

Ведущий "мозгового штурма" — инженер по знаниям — должен свободно владеть аудиторией, подобрать активную группу экспертов — "генераторов", не блокировать плохие идеи, так как они могут служить катализаторами хороших. Искусство ведущего — это искусство задавать вопросы аудитории, стимулируя генерацию новых идей.

Основной девиз штурма — "чем больше идей, тем лучше". Фиксация хода сеанса — традиционная (составление протокола или с помощью диктофона).

Экспертные игры

Понятие экспертной игры или игры с экспертами в целях извлечения зна­ний восходит к трем источникам — это:

- деловые игры, широко используе­мые при подготовке специалистов и моделировании;

- диагностические игры;

- компьютерные игры, все чаще применяемые в обучении.

В настоящее время в психолого-педагогических науках нет развитой теоре­тической концепции деловых игр и других игровых методов обучения. Тем не менее на практике эти игры широко используются. Под деловой игрой чаще всего понимают эксперимент, где участникам предлагается производ­ственная ситуация, а они на основе своего жизненного опыта, своих общих и специальных знаний и представлений принимают решения.

Решения анализируются, и вскрываются закономерности мышления участ­ников эксперимента. Именно эта анализирующая часть деловой игры по­лезна для получения знаний. И если участниками такой игры становятся эксперты, то игра из деловой превращается в экспертную. Из трех основных типов деловых игр (учебных, планово-производственных и исследователь­ских) к экспертам ближе всего исследовательские, которые используются для анализа систем, проверки правил принятия решений.

Диагностическая игра — эта та же деловая игра, но применяемая конкретно для диагностики методов принятия решения в медицине. Эти игры возникли при исследовании способов передачи знаний от опытных врачей новичкам.

Плодотворность моделирования реальных ситуаций в играх подтверждается сегодня практически во всех областях науки и техники. Они развивают ло­гическое мышление, умение быстро принимать решения, вызывают интерес у экспертов.

Идея использовать компьютеры в деловых играх известна давно. В настоящее время, когда компьютерные игры взяли в плен практически всех пользователей персональных ЭВМ, стала очевидной особая притягательность такого рода игр.

Игры иногда полезны для развлечения экспертов перед сеансом извлечения знаний. Кроме того, очевидно, что экспертные игры могут успешно применяться для непосредственного извлечения знаний. Однако разработка и программная реализация такой игры потребуют существенных вложений временных и денежных ресурсов.

Вкратце охарактеризуем основные косвенные коммуникативные методы извлечения знаний.

Многомерное шкалирование — метод анализа и визуализации данных с помощью расположения точек, соответствующих изучаемым объектам, в пространстве меньшей размерности чем пространство признаков объектов.

Иерархическая кластеризация - один из методов упорядочивания данных, визуализация которых обеспечивается с помощью графов.

Кластерный анализ - многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о некоторой выборке объектов, и затем объединяющая объекты в сравнительно однородные группы.

Факторный анализ - многомерный метод, применяемый для изучения взаимосвязей между значениями переменных.

Анализ репертуарных решеток - методика исследования индивидуальной категориальной структуры личности, предложенная в 1950-х американским психологом Джорджем А. Келли (1905-1967) для изучения того, как человек воспринимает, интерпретирует, оценивает и прогнозирует свой жизненный опыт и окружающий мир.

Анализ РР используется в различных областях практической деятельности: психологии и психодиагностике, психиатрии, социологии, педагогике, рекламе, дизайне, политике, менеджменте, профконсультировании, лингвистике, истории, риторике и т.д.

Анализ РР позволяет выявлять значимые для специалиста признаки (конструкты), определять силу и направленность связей между ними и строить из них связную систему.

Далее перейдем к рассмотрению моделей приобретения знаний. Процесс приобретения знаний можно разбить на следующие задачи:

 

Связь данных и знаний

Данные — это информация, полученная в результате наблюдений или измерений отдельных свойств, характеризующих объекты, процессы и явления предметной области.

n данные как результат измерений и наблюдений;

n данные на материальных носителях информации (таблицы, справочники);

n структуры данных в виде диаграмм, графиков;

n данные в компьютере на языке описания данных;

n базы данных на машинных носителях информации.

Знания — это выявленные в результате практической деятельности и профессионального опыта закономерности предметной области.

n знания в памяти человека как результат обучения, воспитания, мышления;

n знания на материальных носителях (инструкции, учебники, методические пособия);

n поле знаний (условное описание основных объектов предметной области, их атрибутов и закономерностей);

n знания, описанные на языках представления знаний;

n база знаний на машинных носителях информации.

 

В настоящее время декларативные языки программирования часто называют языками ИИ. Это происходит потому, что в декларативной программе не предписывается выполнения определенной последовательности действий, а лишь дается разрешение их совершать. Вследствие этого, программа сама находит некоторый способ достижения поставленной цели, причем часто таких способов может быть несколько.

В рамках наук об ИИ существуют десятки способов представления знаний для различных предметных областей. Большинство из них может быть сведено к следующим классам:

· продукционные модели

· семантические сети

· фреймы

· формальные логические модели.

На практике редко удаётся обойтись рамками одной модели при разработке ИИС, поэтому представление знаний получается сложным.

 

Перейдем к рассмотрению общей классификации моделей представления знаний.

Следует сразу сказать, что модели представления знаний в литературе часто смешивают с методами представления знаний, то есть используются два разных названия для характеристики одного и того же элемента.

 

Для представления глубинных знаний
Для представления поверхностных знаний

К формально-логическим моделям относят классическую теорию исчисления предикатов 1-го порядка. Чаще всего эти логические модели строятся при помощи декларативных языков логического программирования, наиболее известным представителем которых является язык Пролог (Prolog).

Начало истории языка относится к 70-м годам XX века. Интерес к Прологу поднимался и затихал несколько раз, энтузиазм сменялся жестким неприятием. Наибольшее внимание Пролог привлек к себе как к языку будущего во время разработок японской национальной программы «Компьютеры пятого поколения» в 1980-х годах, когда разработчики надеялись, что с помощью Пролога можно будет сформулировать новые принципы, которые приведут к созданию компьютеров более высокого уровня интеллекта. Неправильная оценка этой перспективы явилась одной из причин неудачи проекта.

В настоящее время Пролог, несмотря на неоднократные пессимистические прогнозы, продолжает развиваться в разных странах и вбирает в себя новые технологии и концепции, а также парадигмы императивного программирования.

Рассмотрим еще одну классификацию моделей представления знаний в виде таблицы. В первоисточнике эта таблица названа как Методы представления знаний.

Далее по ходу лекций мы подробно разберем все явные методы представления знаний и частично затронем неявные методы представления знаний.

Разработка первых систем ИИ начиналась со становления формальных языков представления знаний, к которым относятся исчисление высказываний и предикатов. Основная идея этого подхода – сохранение истинности операций на корректно построенных выражениях.

Так происходило развитие явных методов представления знаний: от теории исчисления высказываний к развитию ассоционистских теорий смысла.

Далее остановимся более подробно на теориях исчисления высказываний и предикатов.