Информационные технологии в информационно-аналитической деятельности

ТЕМА 8. ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИЕ ТЕХНОЛОГИИ и СИСТЕМЫ.

Аналитические технологии

Информационные технологии в информационно-аналитической деятельности.

Архитектура информационно-аналитической системы.

Информационное хранилище и технология анализа данных.

Задачи и содержание оперативного (OLAP) анализа. Признаки OLAP-системы.

Системы бизнес-интеллекта (business intelligence).

8.6. Рынок инструментальных средств ИАС.

Информационно-аналитические технологии.

Аналитические технологии.

Аналитические технологии – это методики, которые на основе каких-либо моделей, алгоритмов, математических теорем позволяют по известным данным оценить значения неизвестных характеристик и параметров.

Простейший пример аналитической технологии – теорема Пифагора, которая позволяет по длинам сторон прямоугольника определить длину его диагонали. Эта технология основана на известной формуле с22+b2.

Другим примером аналитической технологии являются способы, с помощью которых обрабатывает информацию человеческий мозг. Даже мозг ребенка может решать задачи, неподвластные современным компьютерам, такие как распознавание знакомых лиц в толпе или эффективное управление несколькими десятками мышц при игре в футбол. Таким образом, человеку для решения этих задач необходимы дополнительные методики и инструменты.

Аналитические технологии нужны в первую очередь людям, принимающим важные решения – руководителям, аналитикам, экспертам, консультантам. Доход компании в большой степени определяется качеством этих решений – точностью прогнозов, оптимальностью выбранных стратегий.

С помощью аналитических технологий строятся системы, позволяющие существенно повысить эффективность решений.

Для того, чтобы алгоритм был применим, необходимо, чтобы данная задача полностью описывалась определенной детерминированной моделью (некоторым набором известных функций и параметров). В таком случае алгоритм дает точный ответ. Например, для применимости теоремы Пифагора следует проверить, что треугольник – прямоугольный.

На практике часто встречаются задачи, связанные с наблюдением случайных величин – например, задача прогнозирования курса акций. Для подобных задач не удается построить модели, поэтому применяется принципиально иной, вероятностный подход.

Параметры вероятностных моделей – это распределения случайных величин, их средние значения, дисперсии и т.д. Как правило, эти параметры изначально неизвестны, а для их оценки используются статистические методы, применяемые к выборкам наблюдаемых значений (историческим данным).

Такого рода методы также предполагают, что известна некоторая вероятностная модель задачи.

Приведем примеры реальных задач:

Имеется инвестиционный капитал, который нужно распределить среди 10 проектов. Для каждого проекта задана функция зависимости прибыли от объема вложения. Требуется найти наиболее прибыльный вариант распределения капитала, при условии, что заданы минимальный и максимальный объем инвестиций для каждого проекта.

Традиционное решение: Чаще всего решение в данном случае принимает руководитель, основываясь только на личных впечатлениях о проектах. Размеры упущенной выгоды при этом не подсчитывают, и неоптимальность решения может остаться незамеченной. В случае, если руководитель поручает аналитикам выбрать наиболее прибыльный вариант, применяются математические методы оптимизации.

В последние 10 лет идет активное развитие аналитических систем нового типа. В их основе – технологии искусственного интеллекта, имитирующие природные процессы, такие как деятельность нейронов мозга или процесс естественного отбора.

Наиболее популярными и проверенными из этих технологий являются нейронные сети и генетические алгоритмы. Первые коммерческие реализации на их основе появились в 80-х годах и получили широкое распространение в развитых странах.

Нейронные сети являются имитациями мозга, поэтому с их помощью успешно решаются разнообразные «нечеткие» задачи – распознавание образов, речи, рукописного текста, выявление закономерностей, классификация, прогнозирование.

В таких задачах, где традиционные технологии бессильны, нейронные сети часто выступают как единственная эффективная методика решения.

Генетические алгоритмы – это специальная технология для поиска оптимальных решений, которая успешно применяется в различных областях науки и бизнеса. В этих алгоритмах используется идея естественного отбора среди живых организмов в природе, поэтому они называются генетическими. Генетические алгоритмы часто применяются совместно с нейронными сетями, позволяя создавать предельно гибкие, быстрые и эффективные инструменты анализа данных.

 

Информационные технологии в информационно-аналитической деятельности.

С развитием информационно-аналитических технологий закономерно связываются успехи и обеспечение устойчивости хода политических, социальных и экономических преобразований.

Аналитические возможности создаваемых информационных систем и технологий, как правило, связывают со сложным математическим моделированием управленческих ситуаций, требующим объективных критериев оценки конечного результата.

Информационные и коммуникационные технологии оказывающие огромную помощь в рутинной работе государственных органов, называются«аналитическими».

Например, информационно-справочная система на персональной ЭВМ, позволяющая за несколько секунд найти электронную карточку с нужной информацией, отредактировать ее и красиво представить благодарный пользователь именуется «аналитическим».

Конкретная практика (особенно последних лет) подтверждает необходимость поиска при проведении аналитических исследований нетрадиционных методов использования информационных технологий в процессах подготовки и принятия решений. Создание и внедрение таких методов предполагает обязательный учет следующих факторов:

1) принципиальной информационной открытости технологий подготовки и принятия управленческих решения;

2) необходимости поддержки информационными технологиями процессов постановки управленческих задач;

3) большой формальной неопределенности целей и субъективности критериев оценки принимаемых решений;

4) наличия в информационно–аналитических технологиях явных элементов интуитивного характера;

5) существенного влияния девиационных процессов на подготовку и принятие управленческих решений.

Зачастую эффективность внедрения информационных технологий в проблемную область аналитических исследований связывают с возможностями интеллектуальных информационных систем, особенно их наиболее важного класса – экспертными системами, основанными на знаниях (системами знаний) и позволяющими при принятии решений в определенных проблемных областях заменять высококвалифицированных экспертов.

Однако успехи внедрения экспертных систем во многом обязаны достижению определенной замкнутости представления исследуемой проблемной области. Малое относительное количество эффективно реализованных (на примере Японии) проектов экспертных систем – тому подтверждение. Основные успехи внедрения интеллектуальных и экспертных систем достигаются преимущественно в достаточно замкнутых проблемных областях, – там, где знания экспертов допускают отчуждение в виде некоторой параметрически управляемой инструментальной оболочки и априорно созданной базы знаний. В таких системах возможность оперативного изменения базы знаний сильно ограничена, поскольку может привести к невосстанавливаемому нарушению работоспособности системы.

Аналитическая же деятельность принципиально не допускает замкнутости информационной технологии. Здесь она должна быть ориентирована на возможность:

1. динамического внесения в нее новых знаний экспертами и лицами, принимающими решения – конечными пользователями;

2. ситуационного использования постоянно изменяющейся информации в больших и оперативно доступных базах данных.

Технология в рассматриваемой проблемной области принципиально должна быть информационно открыта. Следствием этого, наиболее сложно учитываемым при создании информационно–аналитической технологии, является ее некритичность к требованию непротиворечивости обрабатываемых информации и знаний.

Традиционная практика разработки сложных математических моделей и информационных технологий для поддержки принятия решений преимущественно ориентируется на процессы, в которых постановка задач и критерии оценка результатов их решений формулируются до внедрения этих технологий в деятельность госоргана.

Реальная практика аналитических исследований для принятия решений органами государственной власти и управления (особенно в области политических и социально-экономических проблем), сталкивается с ситуацией, когда значительную трудность составляет постановка задачи и формулирование цели аналитического исследования.

На вопрос об «аналитичности» информационной технологии лучше всего ответить через введение понятия «степени аналитичности информационной технологии». Естественно, при желании любой кропотливый исследователь эту степень может выразить количественно, например, введя соответствующее оценочное пространство и метрику.

При разработке технологии аналитических исследований ставится цель некоторым образом регламентировать процессы обработки информации, чтобы с использованием компьютеров, а также закономерностей обработки информации существенно повысить эффективность исследований, а в некоторых случаях – реализовать ранее недоступные аналитические процессы.

Различают мониторинговые, инициируемые и кумулятивные аналитические исследования. Дадим краткую характеристику:

1. Мониторинговые исследования предназначены для длительного аналитического слежения за развитием определенной ситуации с целью обеспечения возможности априорного синтеза управленческих решений, имеющих, в частности, профилактический или упреждающий характер. Технология особенно хорошо может быть разработана для мониторинговых исследований, поскольку в них достаточно четко регламентируются отдельные этапы обработки информации. Главное здесь – строгая ориентация на конкретную постановку задачи, группу аналитиков и экспертов, обеспечивающих целенаправленную содержательную обработку информации. Принимая во внимание, что в аналитических службах одновременно ведется несколько мониторинговых исследований, а источников информации может быть достаточно много, технологию организации ее сбора и аналитической обработки можно представить поэтапно.

На первых этапах в аналитической службе осуществляются прием, регистрацию и первичную обработку поступающей информации.

Далее необходимо обеспечить привязку полных текстов поступивших в электронном виде документов к регистрационным данным и автоматически загрузить их в информационно-поисковую систему, позволяющую в последующем оперативно найти необходимые фрагменты текстов документов не только по регистрационным данным, но и по содержанию.

На следующем этапе аналитических исследований дополнительно выявляется тематическая или проблемная (с привязкой к конкретной задаче) ориентация поступившей информации, проводится ее распределение по соответствующим рубрикам. Как правило, эту работу выполняют вручную высококвалифицированные специалисты, знающие и даже участвующие в исследованиях. Она связана с содержательным осмыслением поступившей информации и определением необходимости ее использования в том или ином исследовании. Главное здесь – обеспечить максимальную полноту подборки информации по каждой решаемой в аналитической службе проблеме.

В целом же аналитические материалы в процессе мониторинга подготавливают эксперты-аналитики. Однако и здесь значительное место, особенно на заключительном этапе, занимают диалоговые технологические средства редактирования и визуального графического представления информации. Эти технологические компоненты используются в любом аналитическом исследовании и заслуживают отдельного рассмотрения.

2. Инициируемые аналитические исследования проводятся аналитическими службами по ранее незапланированным поручениям руководства или в результате выявления при проведении мониторинговых исследований новых проблемных ситуаций. Инициируемые исследования нами выделены в отдельный вид для акцентирования внимания на начальных стадиях новых исследований. Инициируемые исследования отличаются от мониторинговых существенно большим влиянием факторов неопределенности целей и субъективности критериев оценки принимаемых решений, необходимости поддержки информационно-аналитической технологией процесса постановки задачи.

Для выявления и формулирования характеристик исследуемой ситуации целесообразно использовать технологии поддержки принятия решений, помогающие структурировать проблему, обеспечить требуемый анализ и оценку альтернативных характеристик ситуации с учетом их субъективно-интуитивных оценок экспертами-аналитиками. К ним относятся, например, системы АСТРИДА, МАУД, ЗАПРОС, ориентированные на работу в режиме диалога с конечным пользователем – лицом, принимающим решения.

3. Кумулятивные исследования характеризуются высокими требованиями к оперативности их проведения (включая развертывание и завершение), применением специализированных методов обработки экспертной информации.

Для всех видов исследований предполагается проведение многостороннего анализа изучаемой ситуации с учетом истории ее развития, результатов исследований похожих ситуаций, а также использованием широкого спектра адекватных теоретических подходов и эвристических приемов. Остановимся более подробно на каждом из перечисленных видов.

Специфика этих исследований состоит в том, что они проводятся на основе совещательно-ситуационной автоматизированной обработки информации группами руководителей и/или экспертов-аналитиков.

Для разработки кумулятивных информационно–аналитических технологий сейчас необходима жесткая интеграция усилий в следующих областях исследований:

· методология групповых экспертных процедур,

· анализ конструкторской активности экспертов,

· рефлексивный анализ,

· компьютерный анализ данных,

· оценка устойчивости управления хаотичными процессами и слабоопределенными ситуациями,

· разработка средств мультимедийного представления и семантически-содержательной обработки русскоязычной информации.

В результате проведенного анализа можно сделать следующие выводы:

1. Аналитические исследования в проблемных областях, охватываемых аналитическими службами федеральных органов власти, в большинстве случаев характеризуются рядом факторов, не позволяющих эффективно использовать для их информационно-технологической поддержки традиционные подходы к компьютерному анализу и моделированию ситуаций.

2. Факторами, ограничивающими эффективность применения в аналитических исследованиях традиционных информационных технологий, являются: информационная открытость этих технологий, необходимость поддержки ими процессов постановки задач, большая неопределенность целей и субъективность критериев оценки принимаемых решений, наличие в технологиях элементов интуитивного характера, существенное влияние девиационных процессов на подготовку и принятие решений.

3. Для разработки перспективных информационно-аналитических технологий необходима жесткая интеграция усилий российских исследователей в следующих проблемных областях: методология групповых экспертных процедур, анализ конструкторской активности экспертов, рефлексивный анализ, компьютерный анализ данных, оценка устойчивости управления нечеткими и слабоопределенными ситуациями, мультимедийного представления и семантически–содержательной обработки русскоязычной информации.

4. Имеющегося научно-практического потенциала сейчас достаточно для эффективного поэлементного развертывания компонентов информационно–аналитических технологий в российских федеральных органах власти и управления. Это подтверждается результатами опытного внедрения отдельных компонентов.