Проектирование систем оперативного анализа данных

Современные системы поддержки принятия решений и информационные системы руководителей основаны на применении специализированных информационных хранилищ (ИХ) и технологий оперативного анализа данных (OLAP) .

ИХ представляет собой базу обобщенной информации, формируемую из множества внешних и внутренних источников, на основе которой выполняются статистические группировки и интеллектуальный анализ данных.

По сравнению с базами данных для оперативной обработки транзакций (транзакционных БД) ИХ обеспечивают более гибкое и простое формирование произвольных справочно-аналитических запросов, а также применение специализированных методов статистического и интеллектуального анализа данных.

В основе информационного хранилища лежит понятие многомерного информационного пространства или гиперкуба (рис. 12.7).

Рис. 12.7. Многомерная организация информационного хранилища.

В его ячейках которого хранятся анализируемые числовые показатели (например, объемы оборота, издержек, инвестиций и т.д.). Измерениями (осями) гиперкуба являются признаки анали­за (например, время, группа продукции, регион, тип процесса, тип клиента и др.). При хранении признаки анализа отделяются от фактических данных, образуя так называемую инвертированную организацию хранения данных или структуру данных типа «звезда».

К особенностям хранимой информации в ИХ относятся:

· интеграция или обобщение данных в ИХ из транзакционных баз данных по всем бизнес-процессам и структурным подразделениям предприятия в виде единого многомерного информационного пространства. Например, организуется хранение показателей объемов производства, сбыта, сервиса и т.д. в продуктовом, территориальном, отраслевом, временном и других разрезах;

· произвольность агрегации данных на основе отделения от фактических данных независимых и равноправных измерений информационного пространства (признаков анализа информации, разрезов) в виде иерархий агрегации. Например, региональный признак анализа представляется в виде иерархии агрегации: «область - район - город - село», временной признак «год - квартал - месяц - день» и т.д.;

· обязательное хранение временного признака в данных, даю­щего возможность отслеживать динамику изменения показа­телей в течение длительного периода времени;

· непротиворечивость данных во всех используемых источни­ках в течение определенного периода времени (например, дня), которая позволяет обеспечить единую точку зрения всех пользователей на экономическую систему;

· обеспечение множества представлений структуры информационного хранилища для различных категорий пользователей: руководителей, аналитиков, менеджеров направлений деятельности. Отбор набора показателей и признаков анализа определяет предметную ориентированность информационного хранилища или организацию витрин данных.

С технологической точки зрения к архитектуре ИХ предъявляются общие требования [104].

· Единообразно определенная структура многомерных данных с равноправными измерениями информационного пространства.

· Пользователь не должен знать о том, где хранятся данные, как они организованы и как обрабатываются.

· Поддержка многопользовательского режима оперативного анализа в среде «клиент-сервер».

· Легкая адаптация к новым информационным потребностям путем добавления новых показателей и измерений.

· Автоматическое обновление информации из оперативных баз данных.

· Выполнение запросов без ограничений на количество измерений и уровней их агрегации примерно с одинаковым временем реакции на запрос.

· Удобный, «интуитивный» интерфейс пользователя, обеспечивающий простоту манипулирования данными. Архитектура системы оперативного анализа данных представлена на рис. 12.8.

Рассмотрим состав основных подсистем информационного хранилища.