Сравнение OLTP-систем и хранилищ данных

 

СУБД, созданная для поддержки оперативной обработки транзакций (OLTP), обычно рассматривается как непригодная для организации хранилищ данных, поскольку к этим двум типам систем предъявляются совершенно разные требования. Например, OLTP-системы проектируются с целью обеспечения максимально интенсивной обработки транзакций, тогда как хранилища данных – прежде всего для обработки единичных произвольных запросов. Сравнение основных характеристик типичных OLTP-систем и храни­лищ данных приведено ниже (табл. 2).

Организация обычно имеет несколько различных OLTP-систем, предназначенных для поддержки таких бизнес-процессов, как контроль товарных запасов, выписка счетов клиентам, продажа товаров. Эти системы генерируют оперативные данные, которые являются очень подробными, текущими и подверженными изменениям. OLTP-системы оптимизированы для интенсивной обработки транзакций, которые проектируются заранее, многократно повторяются и связаны преимущественно с об­новлением данных. В соответствии с этими особенностями данные в OLTP-системах организованы согласно требованиям конкретных бизнес-приложений и позволяют принимать повседневные решения большому количеству параллельно работающих пользователей-исполнителей.

В противоположность сказанному выше в организации обычно имеется только одно хранилище данных, которое содержит исторические, подробные, обобщенные до определенной степени и практически неизменяемые данные (т.е. новые данные могут только добавляться). Хранилища данных предназначены для обработки относительно небольшого количества транзакций, которые имеют непредсказуемую природу и тре­буют ответа на произвольные, неструктурированные и эвристические запросы. Информация в хранилище данных организована в соответствии с требованиями возможных запросов и предназначена для поддержки принятия долговременных страте­гических решений относительно небольшим количеством руководящих работников.

Хотя OLTP-системы и хранилища данных имеют совершенно разные характеристики и создаются для различных целей, все же они тесно связаны в том смысле, что OLTP-системы являются источником информации для хранилища данных. Основная проблема при организации этой связи заключается в том, что поступающие из OLTP-систем данные могут быть несогласованными, фрагментированными, подверженны­ми изменениям, содержащими дубликаты или пропуски. Поэтому до помещения в хранилище данные должны быть “очищены”.

OLTP-системы не предназначены для получения быстрого ответа на произвольные запросы. Они также не используются для хранения устаревших исторических дан­ных, которые требуются для анализа тенденций. OLTP-системы, в основном, постав­ляют огромное количество “сырых” данных, которые не так-то легко поддаются анали­зу. С помощью хранилищ данных можно получить ответы на запросы, более слож­ные, чем запросы с простейшими обобщениями следующего типа: “Какова средняя цена объектов недвижимости в крупнейших городах Великобритании?” Для храни­лищ данных характерны совсем другие запросы, примеры который приведены ниже.

• Какие типы объектов недвижимости продаются по ценам выше средней цены объектов недвижимости в крупнейших городах Великобритании и как эти данные коррелируют с демографическими данными?

• Какие три района в обслуживаемых городах были наиболее популярны с точки зрения аренды объектов недвижимости в 1997 году и как эти дан­ные связаны с данными за предыдущих два года?

• Какова месячная выручка от продажи объектов недвижимости в каждом отделе­нии компании в сравнении с аналогичными показателями годичной давности?

• Какая связь наблюдается между ежегодной выручкой в каждом отделении ком­пании и общим

 

Файл материалов

Приложение 1