Складові сховищ даних та їх характеристика

Враховуючи те, що сховища даних є новою технологію, яка розвивається, існують різні підходи до викладення структури. сховища даних вклю­чає до свого складу такі компоненти

Менеджер завантаженнявиконує функції диспетчеризації щодо регулярності завантаження нових даних до сховища даних згідно зі встановленим регламентом. Оскільки джерелом даних можуть бути різні OLTP-системи, функції менеджера заванта­ження також полягають в очищенні, конвертації та приведенні даних до заданого виду їх представлення в СД.

Менеджер сховищавиконує операції аналізу та управлін даними. Це такі основні операції: аналіз узгодженості та несун речності даних; перетворення та переміщення даних з тимчасон го сховища в основні таблиці СД; створення індексів; денорма.і зація даних у разі її необхідності; агрегація (узагальнення) дани резервне копіювання та архівування даних.

Детальні (оперативні) дані— ця складова містить усі де льні дані, які визначені схемою сховища даних. Це можуть б як первинні дані найнижчого рівня деталізації, так і узагальне до певного рівня деталізації.

Агреговані дані— ця компонента містить дані, які попе дньо оброблені менеджером сховища з метою їх часткового глибокого узагальнення. У цій частині зберігаються певним ч ном відсортовані та згруповані дані, необхідні для виконання питів.

Ця частина сховища є тимчасовою і змінною, оскільки во постійно модифікується у відповідь на зміни запитів. Необхі ність цієї компоненти пов'язана з підвищенням продуктивно виконання запитів. Узагальнені дані поновлюються по мірі на ходження нових даних до системи. Частково узагальнені дані це результат певного узагальнення та агрегації детальних дан Глибоко узагальнені дані отримуються на основі узагальнення ча ково узагальнених даних.

Репозитарій метаданих— це інформація про дані, що збе гаються в СД.

Менеджер запитів— це складова сховища, яка виконує опе­рації, пов'язані з управлінням запитів користувачів. Ця компоне­нта реалізується, як правило, на базі СКБД, що підтримує схови­ще даних, а також сховища даних і програш власної рззробки.

 

Або

 

Основними елементами даних, які зберігаються в схо­вищі даних, є:

• показники (змінні);

« виміри та їх ієрархія;

• факти.

Основними задачами проектування сховищ даних є визначення кандидатів на змінні, факти та виміри. Для цього застосовуються кілька підходів, кожен з яких характеризується певною послідов­ністю ідентифікації основних елементів моделі. Згідно з послідов­ністю ідентифікації елементів сховища даних можна визначити та­кі підходи до визначення основних елементів сховища даних:

Підхід «від запиту».Передусім визначаються змінні, потім виміри, пов'язані зі змінними, а надалі формуються факти. Цей підхід називається «від запиту», оскільки він орієнтований на­самперед на аналітичні запити до сховища даних. Тобто визна­чення елементів сховища даних виконується на основі аналізу запитів користувачів-аналітиків.

Підхід, орієнтований на бізнес.Визначаються факти, потім виміри, а на завершення змінні. Цей підхід називається орієнтова­ним на бізнес, оскільки спочатку аналізується предметна область, для якої будується сховище даних, і визначаються основні бізнес-події, які необхідно відобразити в сховищі як факти, а вже потім з'ясовуються виміри та змінні, що характеризуватимуть ці факти.

Підхід «від джерела». Визначаються виміри, далі змінні, а вже потім факти. Цей підхід називається орієнтованим на джере­ло даних. Тобто при проектуванні сховища даних відштовхує­мось від існуючих моделей баз даних, які будуть виступати осно­вним джерелом наповнення даними сховища.

У реальній дійсності при проектуванні сховищ даних може бу­ти використана комбінація цих усіх підходів. Оскільки йдеться про визначення кандидатів на виміри, змінні та факти, то, наприклад, спочатку може бути застосовано підхід «від бізнесу». Використо­вуючи його, вивчається предметна область і з'ясовуються бізнес-події, які необхідно відображати у вигляді фактів, а потім визна­чаються виміри та змінні, що їх характеризують. Далі проводиться опитування майбутніх користувачів і виявляється перелік аналіти­чних запитів, які можуть бути поставленими до майбутнього схо­вища. На основі аналізу запитів користувачів проводиться уточ­нення фактів, змінних та вимірів, які були отримані при вивченні предметної області. 1 нарешті, отриманий перелік кандидатів на змінні факти та виміри уточнюється з використанням підходу «від джерела».