Различные подходы к построению систем ИИ

За все время развития сформировалось три подхода к построению систем ИИ.

Первый подход подразумевает использование структуры и механизмов работы человеческого мозга в качестве объекта исследования, а конечной целью ставит раскрытие всех тайн мышления как процесса. Для успешного выполнения исследований в этой области необходимо несколько этапов: построение моделей на основе психофизиологических данных, проведение экспериментов с ними, выдвижение новых гипотез относительно механизмов интеллектуальной деятельности, совершенствование моделей и т. д.

Во втором же подходе объектом исследования выступает непосредственно сам ИИ. Суть исследования заключается в моделировании интеллектуальной деятельности с помощью вычислительных машин. Конечная цель данного подхода – создание такого программного обеспечения, которое позволит вычислительным машинам справляться с интеллектуальными задачами как минимум не хуже человека.

Наконец, третий подход ориентирован на создание смешанных человеко-машинных, или, как еще говорят, интерактивных интеллектуальных систем, позволяющих создать симбиоз возможностей естественного и искусственного интеллекта. Важнейшими проблемами в этих исследованиях являются оптимальное распределение функций между естественным и искусственным интеллектом и организация диалога между человеком и машиной.

Хоть данные подходы и являются достаточно разными, такое разделение не является историческим, когда одно мнение постепенно сменяет другое, различные подходы появляются и сейчас. Кроме того, поскольку по-настоящему полных систем ИИ все еще не было создано, нельзя однозначно утверждать, что какой-то подход является правильным, а какой-то ошибочным.

Для начала следует уделить внимание логическому подходу. Причина его возникновения не ясна, ведь человек не использует в своей деятельности исключительно логические размышления. Все дело в том, что, именно способность производить логические размышления очень сильно отличает человека от животных.

В основе этого подхода лежит Булева алгебра. Любой, даже начинающий программист, должен быть уже знаком с ней и с логическими операторами еще с тех пор, когда использовал свой первый оператор IF. Свое дальнейшее развитие Булева алгебра получила в виде исчисления предикатов — в котором она расширена за счет введения предметных символов, отношений между ними, кванторов существования и всеобщности.

Подавляющее большинство систем ИИ, построенных по логическому принципу, представляют собой машины доказательства теорем. При этом, исходные данные хранятся в базе данных в виде аксиом, а правила логического вывода - как отношения между ними. В каждой подобной машине обязательно есть блок генератора цели, а система вывода пытается доказать эту цель как теорему. Если цель доказана, то трассировка примененных правил позволяет получить цепочку действий, необходимых для реализации поставленной цели. Мощность такой системы определяется возможностями генератора целей и машиной доказательства теорем.

Можно утверждать, что выразительности алгебры высказываний недостаточно для полноценной реализации ИИ, но следует вспомнить, основополагающей единицей хранения информации всех существующих на данный момент ЭВМ является бит — ячейка памяти, которая может хранить только 0 и 1. Таким образом, было бы логично предположить, что все, что что поддается реализации на ЭВМ, можно реализовать и в виде логики предикатов. Хотя здесь ничего не говорится о том, за какое время.

Для того, чтобы придать логическому подходу больше выразительности, можно использовать такое сравнительно новое направление, как нечеткая логика. Ее ключевая особенность заключается в том, что кроме стандартных да/нет (1/0), истинность выражения в ней может принимать еще и про межуточные значения — не знаю (0.5), пациент скорее жив, чем мертв (0.75), пациент скорее мертв, чем жив (0.25). Этот подход более приближен к принципу мышления человека, ведь мы редко даем абсолютно однозначные ответы. Но, есть и исключительные ситуации, такие как экзамен или контрольная, где будут приниматься только ответы из области классической булевой алгебры.

Большая часть логических методов имеет серьезный недостаток – большую трудоемкость, поскольку во время поиска доказательства не исключен полный перебор вариантов. Именно поэтому данный метод требует тщательной проработки и оптимизации вычислительного процесса, а хорошая работа обычно гарантируется при сравнительно небольшом размере базы данных.

Под структурным подходом под структурным подходом построения ИИ часто подразумевается моделирование структуры человеческого мозга. Одной из первых таких попыток был перцептрон Френка Розенблатта. Основополагающей структурной единицей моделирования в перцептронах (как и в большинстве других вариантов моделирования мозга) является нейрон.

Есть и более поздние модели данной системы, получившие название "нейронные сети" (НС). Их следует различать по строению отдельных нейронов, по топологии связей между ними и по алгоритмам обучения. Среди наиболее известных сейчас вариантов НС можно назвать НС с обратным распространением ошибки, сети Хопфилда, стохастические нейронные сети.

Одной из наиболее успешных областей применения НС являются задачи распознавания образов, зачастую сильно зашумленных, но, имеются и примеры успешного применения НС для построения собственно систем ИИ.

Модели, построенные по образу и подобию человеческого мозга зачастую имеют не слишком большую выразительность, легкое распараллеливание алгоритмов, и связанную с этим достаточно высокую производительность параллельно реализованных НС. Кроме того, у них есть еще одно свойство, позволяющее говорить о сильном их приближении к человеческому мозгу — нейронные сети могут функционировать даже в том случае, если их информация об окружающей среде является неполной. Это позволяет им давать не только абсолютно однозначные ответы на поставленные вопросы, что до их создания было свойственно лишь человеку.

Эволюционный подход также получил достаточно широкое распространение. При построении систем ИИ по данному подходу следует уделить особое внимание созданию начальной модели, и правилам, по которым она будет изменяться (эволюционировать). Методы создания начальной модели могут быть весьма различны. Это может быть и НС, и набор логических правил и любая другая модель. Когда мы непосредственно запускаем компьютер, он, на основании правил проверки моделей отбирает самые лучшие из них, на основании которых по самым различным правилам генерируются новые модели, из которых опять выбираются самые лучшие и т. д.

Можно с уверенностью сказать, что эволюционных моделей как таковых не существует, а существуют только эволюционные алгоритмы обучения, но модели, полученные при эволюционном подходе, имеют некоторые отличительные и свойственные только им особенности, что позволяет выделить их в отдельный класс.

В эти особенности входят перенесение большей части усилий разработчика с построения модели на алгоритм ее модификации и то, что полученные модели практически не сопутствуют извлечению новых знаний о среде, окружающей систему ИИ, то есть она становится как бы вещью в себе.

Не менее часто используемый подход к построению систем ИИ — имитационный. Данный подход является классическим для кибернетики с одним из ее базовых понятий — "черным ящиком" (ЧЯ). ЧЯ — устройство, программный модуль или набор данных, структура и содержание которого остаются неизвестными, однако, известны спецификации его входных и выходных данных. Объект, поведение которого имитируется, как раз и представляет собой такой "черный ящик". Нам не важно, что у него и у модели внутри и как он функционирует, главное, чтобы наша модель в аналогичных ситуациях вела себя точно так же.

Таким образомэта модель симулирует другое свойство человека — способность копировать некоторые действия, не вдаваясь в подробности, зачем это нужно. Данная способность часто экономит нам время, особенно в период раннего развития.

Основным недостатком имитационного подхода является низкая информационная способность большинства моделей, построенных с его помощью.

С черным ящиком связана одна очень интересная идея. В ее основе лежит вопрос о возможности вечной жизни. Представим себе, что за нами наблюдает какое-то устройство, которое следит за тем, что в каких ситуациях мы делаем, говорим. Это устройство собирает только информацию, поступающую к нам на вход (зрение, слух, вкус, тактильные, вестибулярные и т. д.) и информацию, которую мы выводим (речь, движение и др.). В данном случае человек является типичным «черным ящиком». Далее это устройство пытается создать новую модель таким образом, чтобы при определенных сигналах на входе, она выдавала бы на выходе те же данные, что и человек. Если создание такой модели будет успешным, то для всех посторонних наблюдателей такая модель будет той же личностью, что и реальный человек. То есть, эта модель будет генерировать те же мысли и идеи, что и человек, который был ее прототипом, но механизмы генерации этих мыслей и идей могут быть таковы, что, в отличие от человеческого тела, данная модель сможет существовать вечно

Можно пойти еще дальше и скопировать эту модель и получить брата близнеца с точно такими же "мыслями".

Хотя можно утверждать, что эта модель только для других будет являться исходным человеком, а внутри нее будет пустота. Копируются только внешние атрибуты, а реальный человек после смерти уже не сможет думать, его сознание погаснет или "покинет этот мир". Что ж, это так. Но, если задуматься, что же такое сознание, можно прийти к выводу, что оно представляет собой сравнительно небольшую надстройку над нашим подсознанием, которая следит за активностью некоторых центров головного мозга, таких как центр речи, конечной обработки зрительных образов, после чего "возвращает" эти образы на начальные ступени обработки данной информации. При этом происходит повторная обработка этих образов, мы как бы видим и слышим, что думает наш мозг. При этом появляется возможность мысленного моделирования окружающей действительности при нашем "активном" участии в данном процессе. И именно наш процесс наблюдения за деятельностью этих немногих центров является тем, что мы называем сознанием. Если мы "видим" и "слышим" наши мысли, мы в сознании, если нет, то мы находимся в бессознательном состоянии.

Если бы получилось смоделировать работу этих "сознательных" нервных центров (работа которых правда основана на деятельности всего остального мозга) в качестве одного черного ящика, и работу "супервизора" в качестве другого черного ящика, то можно было бы с уверенностью говорить, что данная модель думает, причем так же, как и человек. Но, на данный момент, получить данные о работе этих нервных центров не представляется возможным, поскольку пока еще не существует устройства, позволяющего наиболее полно собирать информацию о деятельности мозга в течение очень долгого периода и при этом не мешать ни деятельности самого мозга, ни жизни его носителя.

Подводя итог, хотелось бы отметить, что на практике граница между разными способами построения ИИ достаточно сильно размыта. Нередко встречаются смешанные системы, где часть работы выполняется по одному принципе, а часть совершенно иному.