Методы поддержки принятия управленческих решений на основе информационных технологий
Поддержка принятия решений с помощью информационных технологий, включая анализ и выработку альтернатив, в СППР осуществляется следующими методами:
• информационный поиск;
• интеллектуальный анализ данных;
• извлечение (поиск) знаний в базах данных;
• рассуждение на основе прецедентов;
• имитационное моделирование;
• генетические алгоритмы;
• искусственные нейронные сети;
• искусственный интеллект.
Информационный поиск (information retrieval) – это процесс поиска неструктурированной документальной информации и наука об этом поиске. Термин "информационный поиск" был впервые введен Кельвином Муром в 1948 г. Процесс поиска включает в себя последовательность операций, направленных на сбор, обработку и предоставление необходимой информации заинтересованным лицам. В общем случае поиск информации состоит из четырех этапов;
1) определение (уточнение) информационной потребности и формулировка информационного запроса;
2) установление совокупности возможных держателей информационных массивов (источников);
3) извлечение информации из выявленных информационных массивов;
4) ознакомление с полученной информацией и оценка результатов поиска.
Различают поиск: полнотекстовый – по всему содержимому документа; по метаданным – по неким атрибутам документа, поддерживаемым системой (название документа, дата создания, размер, автор и т.д.); по изображению – по содержанию изображения.
Информационный поиск осуществляется следующими методами: адресный – процесс поиска документов по чисто формальным признакам, указанным в запросе; семантический – процесс поиска документов по их содержанию; документальный – процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя; фактографический – процесс поиска фактов, соответствующих информационному запросу.
Интеллектуальный анализ данных (data mining) – это выявление скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных. Термин "data mining" введен Г. Пятецким-Шапиро в 1989 г. Такой анализ предусматривает решение задач классификации, моделирования и прогнозирования, кластеризации, сокращения описания, ассоциации, анализа отклонений, визуализации и др.
Извлечение (поиск) знаний в базах данных (knowledge discovery in databases) – это процесс обнаружения полезных знаний в базах данных. Эти знания могут быть представлены в виде закономерностей, правил, прогнозов, связей между элементами данных и др. Главным инструментом поиска знаний в процессе извлечения в базах данных являются аналитические технологии data mining, реализующие задачи классификации, кластеризации, регрессии, прогнозирования, предсказания и т.д. Процесс извлечения знаний в базах данных включает в себя выполнение последовательности операций, необходимых для поддержки аналитического процесса. К ним относятся: консолидация данных; подготовка анализируемых выборок данных (в том числе обучающих); очистка данных от факторов, мешающих их корректному анализу; трансформация – оптимизация данных для решения определенной задачи; анализ данных; интерпретация и визуализация результатов анализа, их применение в бизнес-приложениях.
Рассуждение на основе прецедентов (case-based reasoning) – еще один метод поддержки принятия решений с помощью информационных технологий. Прецедент – случай, имевший место ранее и служащий примером или оправданием для последующих случаев подобного рода. Вывод на основе прецедентов является подходом, позволяющим решить новую задачу, используя или адаптируя решение уже известной задачи. Как правило, такие методы рассуждений предусматривают четыре основных этапа, образующие так называемый цикл рассуждения на основе прецедентов, или CBR-цикл. Существует целый ряд методов извлечения прецедентов и их модификаций: метод ближайшего соседа (nearest neighbor); метод извлечения прецедентов на основе деревьев решений; метод извлечения прецедентов на основе знаний; метод извлечения с учетом применимости прецедентов. Помимо рассмотренных методов для извлечения прецедентов могут успешно применяться и другие методы, например аппарат искусственных нейронных сетей.
Имитационное моделирование – это метод, позволяющий строить модели, описывающие процессы так, как они проходили бы в действительности. Такую модель можно "проиграть" во времени как для одного испытания, так и заданного их множества. При этом результаты будут определяться случайным характером процессов. По этим данным можно получить достаточно устойчивую статистику.
Различают следующие виды имитационного моделирования: агентное – направление в имитационном моделировании, которое используется для исследования децентрализованных систем; дискретно-событийное – подход к моделированию, предлагающий абстрагироваться от непрерывной природы событий и рассматривать только основные события моделируемой системы, такие как "ожидание", "обработка заказа", "движение с грузом", "разгрузка" и др.; системная динамика – парадигма моделирования, где для исследуемой системы строятся графические диаграммы причинных связей и глобальных влияний одних параметров на другие во времени, а затем созданная на основе этих диаграмм модель имитируется на компьютере. В число популярных систем имитационного моделирования входят: AnyLogic, Arena, еМ-Plant, Powersim, GPSS.
Генетический алгоритм (genetic algorithm) – это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путем последовательного подбора, комбинирования и вариации искомых параметров с использованием механизмов, напоминающих биологическую эволюцию. Генетический алгоритм является разновидностью эволюционных вычислений (evolutionary computation). Его отличительная особенность состоит в акценте на использование оператора "скрещивания", который производит операцию рекомбинации решений-кандидатов, роль которой аналогична роли скрещивания в живой природе. Генетические алгоритмы служат главным образом для поиска решений в очень больших, сложных пространствах поиска.
Искусственные нейронные сети – это математические модели, а также их программные или аппаратные реализации, построенные по принципу организации и функционирования биологических нейронных сетей – сетей нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге при мышлении, и при попытке смоделировать эти процессы. Первой такой моделью мозга был перцептрон. Впоследствии эти модели стали использовать в практических целях, как правило, в задачах прогнозирования. С точки зрения машинного обучения нейронная сеть представляет собой частный случай методов распознавания образов, дискриминантного анализа, методов кластеризации и т.п. С математической точки зрения обучение нейронных сетей – это многопараметрическая задача нелинейной оптимизации. С точки зрения кибернетики нейронная сеть используется в задачах адаптивного управления и как алгоритмы для робототехники. С точки зрения развития вычислительной техники и программирования нейронная сеть – способ решения проблемы эффективного параллелизма, а с точки зрения искусственного интеллекта она является основой философского течения коннективизма и главным направлением в структурном подходе по изучению возможности построения (моделирования) естественного интеллекта с помощью компьютерных алгоритмов.
Искусственный интеллект (artificial intelligence) – это наука и разработка интеллектуальных машин и систем, особенно интеллектуальных компьютерных программ, направленных на то, чтобы попять человеческий интеллект. При этом используемые методы не обязаны быть биологически правдоподобны. Но проблема состоит в том, что неизвестно, какие вычислительные процедуры мы хотим называть интеллектуальными. Ученые исследовали только некоторые механизмы интеллекта, поэтому под интеллектом в пределах этой науки имеют в виду только вычислительную часть способности достигнуть целей в мире. Если в основе работы СППР лежат методы искусственного интеллекта, то говорят об интеллектуальной СППР.