Средства создания экспертных систем и СППР

К инструментальным средствам создания экспертных систем и СППР относятся:

• нейронные сети

• нечеткие множества

• генетические алгоритмы

Нейронные сети

Нейронные сети – раздел технологий искусственного интеллекта, в котором для обработки информации используются явления, аналогичные происходящим в нейронах живого существа

Нейронная сеть – это совокупность связанных узлов, моделирующих структуру биологического нейрона.

Выделяются многослойные и однослойные нейронные сети.

Нейронные сети применяются для классифицирования и распознавания входных сигналов по заранее обученной схеме. Процесс обучения сети состоит в подборе весовых коэффициентов.

Область применения нейронных сетей: чтение печатных текстов, распознавание ручного и печатного шрифтов, контроль качества на производстве, классификация дефектов, прогнозирование курсов валют и ценных бумаг, фармакология, военная техника и т.д.

Нечеткие множества

Нечеткие множества используются для обработки нечетких данных. Они описывают приближенные рассуждения и используют логические операции – объединения, пересечения, конъюнкции и отрицания.

Нечеткие множества апеллируют лингвистическими переменными (да, нет, может быть),

которые задают нечеткие понятия (интервал). Принадлежность интервалу определяется распределением вероятностей или функцией принадлежности.

Операции

Пересечение Множеств - новое множество, образованное из двух данных множеств А и B пересечением А и B, если новое множество содержит элементы, которые содержатся в А и в B одновременно.

Объединение Множеств - новое множество, образованное из двух данных наборов А и B объединение А и B, если новое множество содержит все элементы, которые содержатся в А или в B или в обоих одновременно.

Отрицание Множеств - новое множество, содержащее все элементы, которые находятся в области исследования, но не в множестве А отрицанием A.

Лингвистическая Переменная - пятерка (X, T (X), U, G, М,), где X - имя переменной, T(X) - члены множества, то есть множество имен лингвистических значений X, U - область исследования, G - грамматика, чтобы генерировать имена, и М - множество семантических правил для связи каждого X со значением.

 

• Нечёткие множества, определяющие значение переменной “возраст

• Формирование нечётких множеств

Функции принадлежности бывают: треугольная, прямоугольная, трапецеидальная, логистическая.

Нечеткие множества используются для описания неопределенных ситуаций в области управления финансами, управления производством, инвестиционного анализа и СППР.

Генетический алгоритм

Генетический алгоритм — это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путём случайного подбора, комбинирования и вариации искомых параметров с использованием механизмов, напоминающих биологическую эволюцию.

Генетические алгоритмы применяются для решения следующих задач:

• Оптимизация функций

• Оптимизация запросов в базах данных

• Разнообразные задачи на графах (задача коммивояжёра, раскраска, нахождение паросочетаний)

• Настройка и обучение искусственной нейронной сети

• Задачи компоновки

• Составление расписаний

• Игровые стратегии

• Теория приближений

• Искусственная жизнь

• Биоинформатика (свёртывание белков)

Понятия Генетического алгоритма

• Популяция – множество поиска решений

• Ген - задача

• Хромосома – признаки, критерии задачи или цели

Операции ГА

• Мутация – случайное изменение признаков

• Селекция – целенаправленное изменение признаков (хромосом)

• Скрещивание – комбинирование признаков в пределах заданной группы

• Отбор – выбор лучших вариантов признаков (хромосом) по функциям полезности

5. Перспективы использования технологий искусственного интеллекта

• OLAP online analytical processing, аналитическая обработка данных в реальном времени

• Data Mining – интеллектуальная обработка знаний

OLAP— технология статистической и графической обработки информации, включающая составление и динамическую публикацию отчётов.

Используется аналитиками для быстрой обработки данных и сложных запросов к базам данных. Служит для подготовки бизнес-отчётов по продажам, маркетингу, для управления.

OLAP – это технологи, которые не реализуют попытки моделировать естественный интеллект человека,

а лишь расширяются его способности, используя возможности современных ЭВМ и БД.

OLAP-структура, созданная из рабочих данных, называется OLAP-куб. Куб создаётся из соединения таблиц с применением схемы звезды или схемы снежинки. OLAP-куб содержит в себе базовые данные и информацию об измерениях (агрегатах). Куб потенциально содержит всю информацию, которая может потребоваться для ответов на любые запросы.

Интеллектуальный анализ данных (Data Mining) — это процесс обнаружения в «сырых» ранее неизвестных данных, нетривиальных, но практически полезных и доступных для интерпретации знаний и необходимых для принятия решений в различных сферах человеческой деятельности.

Методы Data Mining разделяются на:

• статистические (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов);

• кибернетические (искусственные нейронные сети, эволюционное программирование, генетические алгоритмы, ассоциативная память, нечеткая логика, деревья решений, системы обработки экспертных знаний).

Задачи, решаемые Data Mining:

• Классификация — отнесение входных объектов, событий, наблюдений к одному из заранее известных классов.

• Кластеризация — разделение множества входных объектов, событий, наблюдений на группы (кластеры) по степени «похожести» друг на друга.

• Сокращение описания — для визуализации данных, лаконизма моделей, упрощения счета и интерпретации, сжатия объемов собираемой и хранимой информации.

• Ассоциация — поиск повторяющихся образцов (например, поиск «устойчивых связей в корзине покупателя» — вместе с пивом часто покупают орешки).

• Прогнозирование

• Анализ отклонений (например, выявление нетипичной ситуации).

• Визуализация – графическое или любое другое наглядное представление знаний

Типичный алгоритм решения задач методами Data Mining:

1. Формирование гипотезы;

2. Сбор данных;

3. Подготовка данных (фильтрация);

4. Выбор модели;

5. Подбор параметров модели и алгоритма обучения;

6. Обучение модели (автоматический поиск остальных параметров модели);

7. Анализ качества обучения, если неудовлетворительный - переход на п. 5 или п. 4;

8. Анализ выявленных закономерностей, если неудовлетворительный - переход на п. 1, 4 или 5.

• Структура BI-системы

BI-системы – это СППР или программные средства, использующие методы искусственного интеллекта.

Архитектура BI-системы включает:

• корпоративное хранилище и витрины данных, систематизирующие данные из различных источников;

• системы доступа к данным, интеграции обработки данных (ETL, Enterprise Data Integration/EDI);

• средства очистки и стандартизации данных (Data Quality/DQ);

• OLAP-системы представления информации в удобном виде;

• единые метаданные и инфраструктура БД (Metadata/Infrastructure);

• аналитические инструменты Data Mining и средства KDD (Knowledge Discovery in Databases - поиска знаний в БД)

 

 

Тема 7