Особливості проектування розподілених баз даних

(добавить із ст. 246)

При проектуванні розподіленої бази даних насамперед потрібно вибрати архітектуру розподіленої бази даних і визначити правила доступу до даних і правила її адміністрування. Встановлення правил адміністрування гарантує коректність роботи системи.

Найпростіший варіант архітектури, який виключає можливість виникнення конфліктів, полягає в тому, що серед усіх вузлів, які зберігають одну і ту саму копію якихось даних, вибирають один, що має право на внесення змін, інші вузли лише мають доступ до цієї копії без права внесення змін. Цей варіант можуть вибрати банк і його філії, коли останнім дозволяється переглянути певні дані головної контори без права внесення змін.

Другим варіантом архітектури, який також гарантує, що конфлікти не виникнуть, є динамічна передача права модифікації від сервера до сервера. При цій архітектурі кожний елемент даних має спеціальний додатковий атрибут, у якому можна вказати дозвіл на внесення змін при передаванні даних між серверами.

Питання :

1. Технологія логічного проектування БД в середовищі Erwin.

2. Поняття розподіленої бази даних (РБД) та особливості технології роботи з РБД.

3. Характеристика стратегій розподілу даних в розподіленій БД.

4. Особливості технології функціонування розподілених баз даних.

5. Особливості проектування розподілених баз даних.

 

Передумови розробки концепції сховищ даних.

Необхідність розробки нової концепції сховищ даних обумовлена такими факторами:

· Системи підтримки прийняття рішень,що грунт.-ся на формув.-ні аналітичних запитів,почали конфлікт-и з трансакційними сис-ми оперативної обробки даних(OLTP-системи).Що призвело до нестачі ресурсів.

· Реалізація аналітич-х звітів на основі традиц-х БД займає дуже багато часу,що призводить до затримок.Так як для аналіт-х звітів переважно потрібні не первинні оперативні дані, а певним чином узагальнені, структуровані.

· На підпр-ві функц-є кілька OLTP-систем,кожна з яких має окрему БД. У них використ-ся різні структури даних,способи кодування,одиниці вимір-ня. Що призводить до проблеми узгодженості даних.

· Для вирішення оперативних аналіт-х задач недостатньо інформації,що зберіг-я в БД. Необхідні архівні дані, що містять результати роботи за попередні календарні періоди. Також,часто виникає потреба в зовн-х джерелах(дані про клієнтів, конкурентів, політ, соціологічні, демографічні та ін).

Перелічені вище фактори створили передумови для розробки різновиду БД, що назив.сховищем даних.

Архітектура сховищ даних.

Сховища даних залежно від підходів до побудови їх архітектури поділ.на:

· Віртуальне СД (Основою є репозитарій метаданих,який описує місце розташ-ня даних в оперативних сис-х,структуру даних, методи агрегації та завантаж-я даних та ін..Це СД скл.з оперативних сис-м та с-ми управл.запитами. Під час викон-я запиту викон-ся пошук та вибірка необх. даних з оперативних сис-м.Потім обєдн-ся необх.чином і видаються користувачеві. Недоліки: низька продуктивність виконання запитів, відсутність єдиної структури полів,кодів і ключів. Переваги: максимальне викор-я існуючого апаратного забезпеч-я.)

· СД на основі семантичної інтеграції предм-х областей(сховище поділено на певні розділи, кожен з яких характ.-є окрему ПО, але проект-ся вони за єдиними правилами, що гарантує легкість їх обєднання. Недоліком є відсутність сис-ми управл-ня запитами, внаслідок чого на виконання запитів витрач-ся значний час, оскільки необх., щоб СКБД обєднала дані з різних ПО в одну заг.табл)

· СД із сис-мою управл-я запитами до предм-х обл.(наявність блоку «управління запитами» спрощує вирішення проблеми семантичної інтеграції областей, але залиш-ся недолік,що виявляється у значному часі виконання запитів до різних ПО. )

· Монолітне сховище(це репозитарій усіх доступних на даний момент оперативних даних, які представлені на найвищому рівні деталізації і нормалізації. Дані із монолітного сховища надходять у допоміжне сховище, а потім пердаються у робоче сховище. Перевагою є гнучкість для використ-ня спеціалістами. Недоліки: дуже велика кількість рівнів і значна надлишковість, що ускладнює супроводження.)

· СД на основі стандартного архіву даних(Процес семантичної інтеграції і проміжне сховище замінюються стандартним архівом-це стаціонарне інтегроване середовище,що вміщує інформац.для всіх СППР. Недоліком є високі витрати памяті та підвищені вимоги до супроводж-ня.)