Средства создания экспертных систем и СППР
К инструментальным средствам создания экспертных систем и СППР относятся:
• нейронные сети
• нечеткие множества
• генетические алгоритмы
Нейронные сети
Нейронные сети – раздел технологий искусственного интеллекта, в котором для обработки информации используются явления, аналогичные происходящим в нейронах живого существа
Нейронная сеть – это совокупность связанных узлов, моделирующих структуру биологического нейрона.
Выделяются многослойные и однослойные нейронные сети.
Нейронные сети применяются для классифицирования и распознавания входных сигналов по заранее обученной схеме. Процесс обучения сети состоит в подборе весовых коэффициентов.
Область применения нейронных сетей: чтение печатных текстов, распознавание ручного и печатного шрифтов, контроль качества на производстве, классификация дефектов, прогнозирование курсов валют и ценных бумаг, фармакология, военная техника и т.д.
Нечеткие множества
Нечеткие множества используются для обработки нечетких данных. Они описывают приближенные рассуждения и используют логические операции – объединения, пересечения, конъюнкции и отрицания.
Нечеткие множества апеллируют лингвистическими переменными (да, нет, может быть),
которые задают нечеткие понятия (интервал). Принадлежность интервалу определяется распределением вероятностей или функцией принадлежности.
Операции
Пересечение Множеств - новое множество, образованное из двух данных множеств А и B пересечением А и B, если новое множество содержит элементы, которые содержатся в А и в B одновременно.
Объединение Множеств - новое множество, образованное из двух данных наборов А и B объединение А и B, если новое множество содержит все элементы, которые содержатся в А или в B или в обоих одновременно.
Отрицание Множеств - новое множество, содержащее все элементы, которые находятся в области исследования, но не в множестве А отрицанием A.
Лингвистическая Переменная - пятерка (X, T (X), U, G, М,), где X - имя переменной, T(X) - члены множества, то есть множество имен лингвистических значений X, U - область исследования, G - грамматика, чтобы генерировать имена, и М - множество семантических правил для связи каждого X со значением.
• Нечёткие множества, определяющие значение переменной “возраст
• Формирование нечётких множеств
Функции принадлежности бывают: треугольная, прямоугольная, трапецеидальная, логистическая.
Нечеткие множества используются для описания неопределенных ситуаций в области управления финансами, управления производством, инвестиционного анализа и СППР.
Генетический алгоритм
Генетический алгоритм — это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путём случайного подбора, комбинирования и вариации искомых параметров с использованием механизмов, напоминающих биологическую эволюцию.
Генетические алгоритмы применяются для решения следующих задач:
• Оптимизация функций
• Оптимизация запросов в базах данных
• Разнообразные задачи на графах (задача коммивояжёра, раскраска, нахождение паросочетаний)
• Настройка и обучение искусственной нейронной сети
• Задачи компоновки
• Составление расписаний
• Игровые стратегии
• Теория приближений
• Искусственная жизнь
• Биоинформатика (свёртывание белков)
Понятия Генетического алгоритма
• Популяция – множество поиска решений
• Ген - задача
• Хромосома – признаки, критерии задачи или цели
Операции ГА
• Мутация – случайное изменение признаков
• Селекция – целенаправленное изменение признаков (хромосом)
• Скрещивание – комбинирование признаков в пределах заданной группы
• Отбор – выбор лучших вариантов признаков (хромосом) по функциям полезности
5. Перспективы использования технологий искусственного интеллекта
• OLAP online analytical processing, аналитическая обработка данных в реальном времени
• Data Mining – интеллектуальная обработка знаний
OLAP— технология статистической и графической обработки информации, включающая составление и динамическую публикацию отчётов.
Используется аналитиками для быстрой обработки данных и сложных запросов к базам данных. Служит для подготовки бизнес-отчётов по продажам, маркетингу, для управления.
OLAP – это технологи, которые не реализуют попытки моделировать естественный интеллект человека,
а лишь расширяются его способности, используя возможности современных ЭВМ и БД.
OLAP-структура, созданная из рабочих данных, называется OLAP-куб. Куб создаётся из соединения таблиц с применением схемы звезды или схемы снежинки. OLAP-куб содержит в себе базовые данные и информацию об измерениях (агрегатах). Куб потенциально содержит всю информацию, которая может потребоваться для ответов на любые запросы.
Интеллектуальный анализ данных (Data Mining) — это процесс обнаружения в «сырых» ранее неизвестных данных, нетривиальных, но практически полезных и доступных для интерпретации знаний и необходимых для принятия решений в различных сферах человеческой деятельности.
Методы Data Mining разделяются на:
• статистические (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов);
• кибернетические (искусственные нейронные сети, эволюционное программирование, генетические алгоритмы, ассоциативная память, нечеткая логика, деревья решений, системы обработки экспертных знаний).
Задачи, решаемые Data Mining:
• Классификация — отнесение входных объектов, событий, наблюдений к одному из заранее известных классов.
• Кластеризация — разделение множества входных объектов, событий, наблюдений на группы (кластеры) по степени «похожести» друг на друга.
• Сокращение описания — для визуализации данных, лаконизма моделей, упрощения счета и интерпретации, сжатия объемов собираемой и хранимой информации.
• Ассоциация — поиск повторяющихся образцов (например, поиск «устойчивых связей в корзине покупателя» — вместе с пивом часто покупают орешки).
• Прогнозирование
• Анализ отклонений (например, выявление нетипичной ситуации).
• Визуализация – графическое или любое другое наглядное представление знаний
Типичный алгоритм решения задач методами Data Mining:
1. Формирование гипотезы;
2. Сбор данных;
3. Подготовка данных (фильтрация);
4. Выбор модели;
5. Подбор параметров модели и алгоритма обучения;
6. Обучение модели (автоматический поиск остальных параметров модели);
7. Анализ качества обучения, если неудовлетворительный - переход на п. 5 или п. 4;
8. Анализ выявленных закономерностей, если неудовлетворительный - переход на п. 1, 4 или 5.
• Структура BI-системы
BI-системы – это СППР или программные средства, использующие методы искусственного интеллекта.
Архитектура BI-системы включает:
• корпоративное хранилище и витрины данных, систематизирующие данные из различных источников;
• системы доступа к данным, интеграции обработки данных (ETL, Enterprise Data Integration/EDI);
• средства очистки и стандартизации данных (Data Quality/DQ);
• OLAP-системы представления информации в удобном виде;
• единые метаданные и инфраструктура БД (Metadata/Infrastructure);
• аналитические инструменты Data Mining и средства KDD (Knowledge Discovery in Databases - поиска знаний в БД)
Тема 7