OLAP-технологии и отчетность
На основе данных хранилищ осуществляются различные виды анализа и формирование отчетности.
Средства отчетности обеспечивают формирование, генерацию и доставку любых видов регламентированных и нерегламентированных отчетов.
OLAP-системы (On-Line Analytical Processing) представляют инструмент для анализа больших объемов данных в режиме реального времени на основе гибкого просмотра, получения произвольных срезов данных и выполнения аналитических операций детализации, свертки, сравнения во времени и др. Если системы регламентированной отчетности позволяют ответить на вопрос: "Каков доход предприятия за последний квартал?", то OLAP-системы дают ответ на вопрос: "Какого поставщика выгодно выбрать и почему?"
Требования к OLAP-системам сформулированы в тесте FASMI (Fast Analysis of Shared Multidimensional Information – быстрый анализ разделяемой многомерной информации):
• Fast (быстрый) – предоставление результатов анализа за приемлемое время (обычно не более пяти секунд), пусть даже ценой менее детального анализа;
• Analysis (анализ) – возможность осуществления любого логического и статистического анализа, характерного для данного приложения, и его сохранения в доступном для конечного пользователя виде;
• Shared (разделяемый) – многопользовательский доступ к данным с поддержкой соответствующих механизмов блокировок и средств авторизованного доступа;
• Multidimensional (многомерный) – многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий;
• Information (информация) – возможность обращаться к любой нужной информации независимо от ее объема и места хранения.
В многомерных ХД наряду с исходными данными хранятся агрегированные данные, с целью сокращения времени выполнения сложных запросов, приводящих к большим объемам вычислений по детальным данным.
Все OLAP-системы делятся на три класса по типу исходной БД.
1. MOLAP (Multidimensional OLAP) – многомерный OLAP (используются многомерные БД). Применение целесообразно при условии не слишком высоких объемов исходных данных для анализа, стабильном наборе информационных измерений, а также в тех случаях, когда время ответа системы на нерегламентированные запросы является наиболее критичным параметром.
2. ROLAP (Relational OLAP) – реляционный OLAP (используются реляционные БД). Получили распространение две основные схемы реализации: схема "звезда" и схема "снежинка". Достоинства: в большинстве корпоративных ХД используются реляционные СУБД и инструменты ROLAP работают непосредственно над ними; наличие больших возможностей защиты данных и разграничения прав доступа пользователей. Недостаток – меньшая по сравнению с MOLAP производительность.
3. HOLAP (Hybrid OLAP) – гибридный OLAP. Используются как многомерные, так и реляционные базы данных: наиболее востребованные агрегированные бизнес-показатели хранятся в многомерном пространстве, а ресурсоемкие детальные данные – в реляционном. В качестве недостатков можно выделить: сложности синхронизации регламентов загрузки, модификации алгоритмов согласования и верификации моделей консолидации, распределения прав доступа к информационным ресурсам системы.
Достоинствами OLAP-систем являются:
• простота использования и восприятия сводных таблиц;
• полнота аналитических данных;
• полная и легкая настройка отчета пользователем без привлечения программиста;
• возможность детализировать отчет в процессе анализа данных;
• быстрое формирование отчетов;
• непротиворечивость данных между отчетами;
• консолидация информации из разных БД;
• повышенная защита данных.
Большинство OLAP-систем в качестве источников данных использует корпоративные хранилища данных.