Фреймы визуальных образов

Недостатки семантических сетей.

Семантическая сеть - это ориентированная графовая структура, каждая вершина которой отображает некоторое понятие (объект, процесс, ситуацию), а ребра графа соответствуют отношениям типа "это есть", "принадлежать", "быть причиной", "входить в", "состоять из", "быть как" и аналогичным между парами понятий. На семантических сетях используются специальные процедуры вывода: пополнение сети, наследование свойств, поиск по образцу и др. Достоинство семантических сетей - наглядность представления знаний, с их помощью удобно представлять причинно-следственные связи между элементами (подсистемами), а также структуру сложных систем. Недостаток таких сетей - сложность вывода, поиска подграфа, соответствующего запросу. В семантических сетях нет специальных средств, позволяющих определить временные зависимости, поэтому временные значения и события трактуются как обычные понятия. Произвольная структура и различные типы вершин и связей усложняют процедуру обработки информации. Стремление устранить эти недостатки послужило причиной появления особых типов семантических сетей: синтагматические цепи, сценарии, фреймы и т.п.

 

Фреймы. Основные понятия.

Фреймовая модель основана на концепции Марвина Мински, основателя лаборатории искусственного интеллекта и представляет собой систематизированную психологическую модель памяти человека и его сознания. Фрейм – структура данных для представления некоторого концептуального объекта. Информация, относящаяся к фрейму, содержится в составляющих его слотах. Слот может быть терминальным (листом иерархии) или представлять собой фрейм нижнего уровня. Каждый фрейм состоит из произвольного числа слотов, причем несколько из них обычно определяются самой системой для выполнения специфических функций, а остальные определяются пользователем.

Фреймы образуют иерархию. Иерархия во фреймовых моделях порождает единую многоуровневую структуру, описывающую либо объект, если слоты описывают только свойства объекта, либо ситуацию или процесс, если отдельные слоты являются именами процедур, присоединенных к фрейму и вызываемых при его актуализации. Формально фрейм – это тип данных вида: F=<N, S1, S2, S3>, N – имя объекта, S1 множество слотов, содержащих факты, определяющие декларативную семантику фрейма, S2 множество слотов, обеспечивающих связи с другими фреймами (каузальные, семантические и т. д.), S3 множество слотов, обеспечивающих преобразования, определяющие процедурную семантику фрейма. Фреймы подразделяются на: фрейм-экземпляр – конкретная реализация фрейма, описывающая текущее состояние в предметной области; фрейм-образец – шаблон для описания объектов или допустимых ситуаций предметной области; фрейм-класс – фрейм верхнего уровня для представления совокупности фреймов образцов.

 

Фреймы визуальных образов.

В качестве простейшего примера, иллюстрирующего представление знаний с помощью фреймов, рассмотрим приведенную в работе М.Минского возможную систему фреймов для элементарного зрительного образа - куба. В соответствии с использованным в работе А.Гузмана(1967) символическим представлением тел правильной формы с помощью "областей" и "связей" между ними можно допустить, что результатом разглядывания куба является структура, подобная показанной на рис.П1а. Эту структуру можно идентифицировать с фреймом куба при разглядывании его с соответствующей позиции. Области A, E и B являются терминалами фрейма, задания для которых соответствуют возможным деталям или обозначениям на видимых с данной позиции гранях куба. Если позиция наблюдения куба перемещается вправо, то грань А исчезает из поля зрения и становится видимой грань С. Если бы потребовалось провести полный анализ этого нового визуального образа, необходимо было бы: 1) утратить знания о грани А, 2) повторно воспринять (с помощью соответствующих "вычислений") образ грани В, 3) воспринять образ новой грани С.

Однако, поскольку известно, что произошло перемещение позиции наблюдения вправо, можно сохранить знания о грани В в виде задания терминалу левой грани нового фрейма куба, соответствующего новой позиции наблюдения. Кроме того, чтобы сохранить знания и о грани А, можно ввести дополнительный терминал невидимой грани, относящийся к этому новому фрейму, как это показано на рис.П1б.

При возвращении на начальную позицию наблюдения оказывается возможным восстановить визуальный образ куба без каких-либо новых "вычислений". Для этого достаточно "вызвать" из памяти первый фрейм. Очевидно, полезно сохранить знания и о грани С, для чего можно ввести дополнительный терминал этой невидимой грани в первом фрейме (рис.П1б).

Можно продолжить эту процедуру построения системы фреймов, соответствующую перемещению точки наблюдения вокруг куба. Это привело бы к получению более широкой системы фреймов, в которой каждый фрейм соответствует своей позиции наблюдения куба. На рис.П1в показана система фреймов, состоящая из трех фреймов, каждый из которых представляет визуальный образ, получающийся в одной из трех позиций наблюдения. Две из этих позиций соответствуют перемещению вправо и влево на 45° относительно третьей позиции; указатели между фреймами соответствуют перемещениям точки наблюдения. Важно обратить внимание на выявленное в этом примере важное свойство представления ситуации с помощью системы фреймов. Оно состоит в том, что различные фреймы, входящие в систему, используют один и тот же терминал, соответствующий одной и той же физической черте, которая видна из различных позиций наблюдения. Это позволяет заранее сосредоточить в одном месте информацию о свойствах известных объектов независимо от позиций наблюдения, которых, особенно для предметов сложной формы, может быть очень много. В результате экономится память и сокращается процесс восприятия при изменении позиций наблюдения, так как память уже располагает необходимой информацией и время затрачивается лишь на "извлечение" ее из памяти.

Сами же системы фреймов, по-видимому, сформированы в памяти не для визуальных образов каждого возможного предмета, а для обычно используемых "основных форм", которые, вступая в различные комбинации, образуют системы фреймов для новых случаев. Это создает дополнительные возможности экономии памяти. Так же, как и в случае отдельных заранее сформированных терминалов, принадлежащих фрейму, наличие в памяти заранее заготовленного набора систем фреймов ускоряет процесс восприятия, так как новый образ не приходится строить заново, а только извлекать его из памяти и "приспосабливать" к действительности.

 

Фреймы-сценарии.

Любые знания о мире можно представить себе в виде некоторых общих универсальных фрагментов, которым соответствуют свои системы фреймов и из которых можно формировать новые системы фреймов, соответствующие некоторым новым представлениям.

Представление знаний о мире с помощью фреймов оказывается весьма плодотворным при объяснении механизмов понимания человеком естественного языка, рассуждении, повествований, наблюдаемых действий другого лица и т. д. По-видимому, оно будет полезным и при разработке искусственных механизмов реализации вышеперечисленных функций с помощью ЭВМ.

В работе М.Минского в этом случае предлагается строить знания о мире в виде фреймов-сценариев. Фрейм-сценарий по М.Минскому представляет собой типовую структуру для некоторого действия, понятия события и т. п., включающую характерные элементы этого действия понятия, события. Например, фрейм-сценарий для события, состоящего в праздновании дня рождения ребенка, включает следующие элементы, которые можно трактовать как узлы фрейма, заполненные заданиями отсутствия: Одежда: воскресная, самая лучшая; Подарок: должен понравиться.

Для объяснения быстрого понимания человеком ситуации, представляемой сценарием, в работе Р.Шенка, Р.Абельсона(l975) предлагается отождествлять терминалы фрейма-сценария с наиболее характерными вопросами, обычно связанными с этой ситуаций. Ответы на эти вопросы полезно получить для понимания данной ситуации. По существу фрейм-сценарий в этом случае является собранием вопросов, которые необходимо задать относительно некоторой гипотетической ситуации, и способов ответа на них. Для того чтобы попять действие, о котором рассказывается или которое наблюдается, человек часто вынужден задать такие вопросы: "Кто осуществляет действие (агент)?", "Какова цель действия (намерение)?", "Каковы последствия (эффект)?", "На кого это действие влияет (получатель)?", "Каким образом оно произведено (инструмент)?".

Относительно понимания вещей, отличающихся от действий, задают несколько иные вопросы, и эти вопросы могут быть значительно меньше локализованы, чем в случае понимания действий, например: "Почему они говорят это мне?", "Каким образом я могу выяснить больше об X?", "Каким образом это поможет в решении проблемы?" и т.д. По рассказу спрашивают, какова тема, каково отношение автора, какое главное событие, кто является главным героем и т. д. По мере того, как на каждый вопрос дается предварительный ответ, из памяти могут вызываться новые фреймы, соответствующие ситуациям, которые возникают в результате ответов на вопросы. Вопросы - терминалы этих новых фреймов становятся в свою очередь активными.

Следует отметить, что число вопросов, связанных с фреймом неопределено, и на первый взгляд кажется, что для понимания ситуации их может быть очень много. Однако на практике оказывается достаточным задать весьма мало вопросов, чтобы разобраться в ситуации.

Разные люди могут задавать разное число вопросов относительно одной и той же ситуации. Число и характер этих вопросов в большой степени зависят от базы знаний относительно обсуждаемого объекта у того или иного индивидуума. Может оказаться, что полное понимание не будет достигнуто из-за отсутствия у человека необходимой системы фреймов, объединяющих знания об обсуждаемом предмете.

Однако, когда необходимая база знаний существует, а относительно обыденных понятий, действий, рассуждений она есть у любого человека, то для понимания ситуации обычно достаточно не очень большое количество вопросов. Это весьма принципиальное обстоятельство, благодаря которому на интуитивном уровне мы приходим к весьма обнадеживающему для практики положению, состоящему в том, что большое количество реальных ситуаций, возникающих при понимании языка, рассуждении, действий можно понять, получив ответы на ограниченный круг вопросов. Это косвенно подтверждает возможность построения относительно простых моделей мира в данном случае с помощью фреймов, достаточных для принятия решений в этих ситуациях.

В случае фреймов-сценариев маркеры терминалов фрейма становятся более сложными, чем это было в случае фреймов визуальных образов, и определяют рекомендации относительно того, каким образом надо отвечать на вопросы, т.е., заполнять терминал заданием. Каждый терминал должен содержать рекомендации относительно того, каким образом найти его задание - ответ на вопрос. Задания отсутствия или перечень возможных ответов на вопросы являются самыми простыми особыми случаями таких рекомендаций. По-видимому, человек может иметь иерархический набор таких рекомендаций подобно схемам предпочтения, предложенным в работе Дж.Уилкса(1973).

В соответствии с подходом М. Минского полное и всестороннее представление каждой ситуации типа событие, действие, рассуждение и т.п. подобно представлению визуального образа и осуществляется с помощью не одного, а системы фреймов. Каждый фрейм, системы соответствует одной из возможных точек зрения на ситуацию, представляемую системой фреймов, подобно тому, как один из визуальных фреймов системы представляет визуальный образ из некоторой одной точки наблюдения. Различные фреймы системы представляют различные пути использования одной и той же информации, находящейся на общих терминалах. Как и в "визуальной ситуации", человек, понимая или передавая мысль, "выбирает" один из фреймов. Этот выбор "по существу" состоит в выборе вопросов, которые, нужно задать относительно рассматриваемой ситуации.

В интерпретации Р.Шенка, Р.Абельсона(1975) сценарий представляет собой последовательность действий, которые описывают часто встречающиеся ситуации. В этой последовательности действий используется принцип каузальной связи, т. е. результатом каждого действия являются условия, при которых может произойти следующее действие.

Каждый сценарий имеет исполнителей ролей. Он имеет различные интерпретации, отражающие точки зрения различных исполнителей. Таким образом, его можно рассматривать как систему фреймов.

Количество сценариев, отражающих возможные ситуации, встречающиеся в реальной жизни, огромно. Сюда относится и упомянутый выше день рождения ребенка и игра в футбол, занятия в школе и т. д.

Возможно также, что обычная последовательность действий может нарушаться. Имеется по крайней мере три характерных случая такого нарушения. Первый - это отклонение, которое представляет собой прерывание последовятельности действий сценария другим сценарием. Другие два случая называются препятствием и ошибкой. Препятствие имеет место тогда, когда кто-то или что-то мешает обычному действию ила отсутствует какое-то условие, необходимое для выполнения действия. Ошибка появляется тогда, когда действие завершается не так, как требуется. В принципе после каждого элементарного действия сценария могут возникнуть препятствия и ошибки, поэтому в сценарий вводятся различные наборы вопросов типа "а что если...", ответ на которые необходимо получать после каждого элементарного действия. При положительном ответе на один из них в сценарии предусматриваются новые действия, устраняющие препятствия и ошибки. Например, в сцене II сценария "ресторан", если официантка не замечает посетителя, он попытается встретиться с ней взглядом или окликнуть её.

Таким образом, сценарий - не просто цепь событий, а скорее связанная каузальная цепочка действий. Он может разветвляться на множество возможных путей, которые сходятся в особо характерных для сценария точках - элементарных действиях. Для того чтобы знать, когда пользоваться сценарием, нужны заголовки. Эти заголовки определяют обстоятельства, при которых обращаются к данному сценарию.