Етапи проектування сховища даних

На тему

”Моделювання за допомогою CASE-пакету

AllFussion Modeling Suite.

Проектування сховищ даних у середовищі CASE-засобу ERwin”

з навчальної дисципліни

“Технології сховищ даних та знань”

Ірпінь 2015


Комплекс лабораторних робіт з курсу “Технології сховищ даних та знань” створено відповідно до робочої програми курсу для підготовки бакалавра за напрямом підготовки 6.050101 “Комп'ютерні науки” галузі знань 0501 "Інформатика та обчислювальна техніка" (варіативна компонента "Інформаційні управляючі системи і технології" (за галузями), затвердженої у 2006 році.

 

Автор: С.Д.Постіл, канд.техн. наук, доцент

Зміст

 

1. Лабораторна робота № 1. Освітні та професійні стандарти в галузі інформаційних технологій (мета, завдання, хід роботи)..……………………..4

 

2. Лабораторна робота № 2. Розробка ескізного концептуального

проекту багатомірного сховища даних "Індивідуальна система"

на основі індивідуального завдання [10] (мета, завдання, хід

роботи)…………………………………………………………………………. 5

 

3. Лабораторна робота № 3 Моделювання сховища даних на прототипі

за допомогою CASE-пакету AllFussion Modeling Suite (мета, завдання,

хід роботи)…………………………………………………………………….. 6

 

4.Особливості проектування сховищ даних у середовищі CASE-засобу

ERwin пакету AllFussion Modeling Suite……………………………………….. 7

3.1. Етапи проектування сховища даних…………………………………... … 7

3.2. Створення нової моделі сховища даних………………………………….. 7

3.3. Створення сутностей та робота з моделлю………………………….. 10

3.4. Заповнення сутностей атрибутами…………………………………... ….. 11

3.5. Побудова зв'язків………………………………………………………….. 11

3.6. Встановлення параметрів таблиць сховища даних……………………...12

3.6.1. Особливості вкладки Dimensional ……………………………………...12

3.6.2. Вибір типу правил маніпулювання даними………………………… 13

3.7. Визначення мета даних…………………………………………………… 15

3.7.1. Документування інформації про джерела даних………………………15

3.7.2. Внесення додаткової інформації про методи………………………….16

3.8. Друк звіту…………………………………………………………………...16

3.9. Питання для самоперевірки………………………………………………. 19

 

5. Лабораторна робота № 4. Проектування сховищ даних на основі

ескізного проекту у середовищі CASE-засобу ERwin

(мета, завдання, хід роботи)………………………………………………. 20

 

6. Література…………………………………………………………………..21


ЛАБОРАТОРНА РОБОТА № 1

Тема роботи:

Освітні та професійні стандарти в галузі інформаційних технологій

Мета роботи:

Ø ознайомитись з освітніми стандартами;

Ø ознайомитись зі стандартами проектування, реалізації та експлуатації інформаційних систем;

Ø ознайомитись з вимогами до освіти, навчання та досвіду роботи фахівця в залежності від рівня кваліфікації;

Ø освоїти методологію встановлення рівня знань, умінь та навичок в залежності від задач діяльності, які освоює студент при виконанні лабораторних, курсових та дипломних робітдля різних категорій працівників в ІТ.

Завдання:

1. Ознайомитись з освітніми стандартами (Сервер//Постіл/ТСПП/Л_1).

2. Ознайомитись із стандартами проектування, реалізації та експлуатації інформаційних систем.

3. Ознайомитись із основними концепціями оцінки якості ПЗ.

4. Ознайомитись з вимогами до освіти, навчання та досвіду роботи фахівця з розробки ПЗ в залежності від рівня кваліфікації [19].

5. Встановити код та назву класу професій за класифікатором професій ДК 003:2010 освітньої спеціальності відповідно до варіанту (Додаток 1, Файл Додоток_Л1).

6. Встановити рівні кваліфікації (за галузевою рамкою кваліфікації) в залежності від задач діяльності фахівця з розробки ПЗ для різних функціональних областей (Додаток 2, Файл Додоток_Л1).

7. Чи освоює їх студент при виконанні лабораторних, курсових та дипломних робіт?

8. Ознайомитись з класифікатором задач діяльності та трудових функцій фахівця з розробки програмного забезпечення.

9. Встановити трудові функції (код, назва) в залежності від функціональних областей для різних задач діяльності фахівця з розробки ПЗ (Додаток 2, Файл Додоток_Л1).

10. Чи освоює їх студент при виконанні лабораторних, курсових та дипломних робіт.

11. Встановити рівень знань, умінь та навичок в залежності від задач діяльності для різних трудових функцій (Додаток 3, Файл Додоток_Л1).

12. Чи освоює їх студент при виконанні лабораторних, курсових та дипломних робітдля фахівця з розробки ПЗ [19].

Хід роботи:

1. Оформлення звіту за допомогою MS Word, де повинні найти відображення:

Ø титульний листок; прізвище, ініціали і № групи студента;

Ø тема і мета роботи;

Ø письмові відповіді згідно виконаної роботи по 1-12 завданнях;

Лабораторна робота № 2

Тема роботи: Розробка ескізного концептуального проекту багатомірного сховища даних "Індивідуальна система" на основі індивідуального завдання [10].

Мета роботи: Виробити навики ескізного проектування багатомірного сховища даних для OLAP системи.

Завдання:

1. Розробити в паперовому варіанті ескізний проект сховища даних для OLAP системи за темою індивідуального завдання [7], як продовження дослідження обраної предметної області при виконанні лабораторних робіт в попередніх курсах.

Хід роботи:

2. Виконання роботи згідно завдання.

 

3. Оформлення звіту за допомогою MS Word, де повинні найти відображення:

Ø титульний листок; прізвище, ініціали і № групи студента;

Ø тема і мета роботи;

Ø паперовий варіант проекту сховища даних для OLAP системи за темою індивідуального завдання;

Ø відповідь на контрольні питання.

Контрольні питання

1. Способи та підходи до проектування сховищ даних

Ø Способи проектування сховищ даних

Ø Підходи до проектування сховищ даних

2. Визначення основних елементів сховища даних

Ø Підходи до визначення основних елементів сховища даних

Ø Визначення та вимоги до змінних

Ø Визначення ступеня деталізації змінних

Ø Визначення та вимоги до вимірів

Ø Визначення та вимоги до фактів

3. Вимірне моделювання сховищ даних (співвідношення вимірів і показників)

4. Визначення метаданих при проектуванні сховищ даних

Ø Мотивації (мета) створення та розвитку сховища даних (навіщо?)

Ø Дії, які виконуються з даними при їх завантаженні (як?)

Ø Місце розташування даних (де?)

Ø Користувачі, які використовують сховище даних (хто?)

Ø Моменти завантаження та обчислення підсумкових даних (коли?)

Ø Сутності або наповнення сховища даних (що?).

Лабораторна робота № 3

Тема роботи: Моделювання сховища даних на прототипі за допомогою CASE-засобу ERwin пакету AllFussion Modeling Suite.

 

Мета роботи: вивчити концепцію та функціональні можливості сучасних CASE-засобів для проектування сховищ даних на прикладі пакета ERwin.

 

Завдання:

1. На прикладі задачі "Реалізація" ознайомитись з особливостями проектування сховищ даних у середовищі CASE-засобу ERwin пакету AllFussion Modeling Suite:

Ø запуск пакета;

Ø створення нової моделі сховища даних;

Ø створення сутностей та робота з моделлю;

Ø заповнення сутностей атрибутами;

Ø побудова зв'язків;

Ø встановлення параметрів таблиць сховища даних (особливості вкладки Dimensional, вибір типу правил маніпулювання даними);

Ø визначення метаданих (документування інформації про джерела даних, внесення додаткової інформації про методи);

Ø друк звіту.

Хід роботи:

1. Виконання роботи згідно завдання.

 

2. Оформлення звіту за допомогою MS Word, де повинні найти відображення:

Ø титульний листок; прізвище, ініціали і № групи студента;

Ø тема і мета роботи;

 

Ø роздруківка побудованої студентом моделі прототипу сховища даних на фізичному рівнях у середовищі ERwin за допомогою меню File/Print Setup та File/Print (обов'язково з наявним текстовим блоком, у якому вказане ПІБ студента та номер групи);

 

Ø роздруківка згенерованого звіту (згідно з п.8Етапу проектування сховища даних).

 

Ø відповідь на контрольні питання.

3. Особливості проектування сховищ даних

у середовищі CASE-засобу ERwin пакету AllFussion Modeling Suite

Етапи проектування сховища даних

Для проектування сховища даних необхідно виконати наступну послідовність дій:

запуск пакета, створення нової моделі сховища даних, створення сутностей та робота з моделлю, заповнення сутностей атрибутами, побудова зв'язків, встановлення параметрів таблиць сховища даних (особливості вкладки Dimensional, вибір типу правил маніпулювання даними), визначення метаданих (документування інформації про джерела даних, внесення додаткової інформації про метод), друк звіту.

Запуск пакета. Запуск пакета здійснюється з середовища ОС Windows завдяки завантаженню через кнопочне меню «Пуск» за таким форматом: Пуск/ Программы/ Computer Associates/ AllFusion/ ERwin Data Modeler r.7/ ERwin Data Modeler r.7.

Після запуску пакета автоматично відкриється вікно діалогу, у якому слід обрати опцію: Open an existing file - для вибору та відкриття вже створеної моделі - мал.1 та натиснути кнопку ОК.

 

Мал. 1. Початкове діалогове вікно пакета AllFusion ERwin Data Modeler

 

3.2. Створення нової моделі сховища даних.

Для створення нової моделі слід обрати пункт меню File/New або натиснути піктограму [], після чого відкриється вікно Create Model - Select Template. Для вибору методології моделювання сховища даних треба у відкритому вікні Create Model - Select Template вибрати:

в опції New Model Type тип моделі Physical;

в опції Target Database тип Database і версію, ОК (мал.2);

Мал. 2. Діалогове вікно AllFusion DM типу моделей і СУБД

 

Перший шлях вибору вимірного моделювання сховищ даних (до натискування кнопки ОК): у відкритому вікні Create Model - Select Template за допомогою кнопки BrowseFile System обрати запропонований шаблон сховища даних:

C:\ProgramFiles\ComputerAssociates/ AllFusion DM Tempiate\Dimens.ert.

Використовуємо інший шлях для вибору вимірного моделювання сховищ даних - за допомогою головного меню Model/Model Properties - відкриється вікно для опису властивостей моделі.

З пропонованого набору вкладок, з погляду на мету лабораторної роботи, нас цікавлять дві вкладки: General та Notation.

Спочатку на вкладці Notation (Мал.3) слід пересвідчитися, що активована методологія вимірного моделювання (Dimensional Modeling).

 

Мал. 3. Вкладка нотацій діалогового вікна властивостей моделі

На вкладці General (Мал. 4) вводимо ім'я моделі сховища даних, ПІБ автора моделі.

Важливо активізувати групу опцій Enable Modeling Features, яка надає вимірної функціональності розглядуваній моделі (специфічні ролі таблиць у сховищі даних, іконки, специфічні рівні відтворення тощо).

Зокрема, активізація прапорця Displayconformance warnings вмикає автоматичну перевірку коректності вимірної моделі і видає на екран діагностичні повідомлення у таких випадках порушення синтаксису:

Ø таблиця факту не є у зв'язку дочірньою;

Ø консольна таблиця не є у зв'язку з батьківською;

Ø установлений ідентифікуючий зв'язок між консольною таблицею й таблицею фактів.

 

Обрана методологія передбачає відтворення зв'язків діагональними лініями (Diagonal), не ортогональними (ця опція встановлюється за допомогою меню Format/Stored Display Settings у групі Relationship lines).

 

 

 

Мал. 4. Вкладка загальних властивостей моделі

 

3.3. Створення сутностей та робота з моделлю.

Для роботи з моделлю в AllFusion DM ERwin існує такий перелік панелей інструментів (Мал. 5):

 

 

Мал. 5. Перелік панелей інструментів ERwin

 

За допомогою випадаючого списку перемкнемо ERwin на роботу з фізичним рівнем моделі, оскільки саме на цьому рівні наочно відтворюються можливі ролі таблиць у сховищі даних:

 

- таблиця фактів (fact table);

- таблиця вимірів (dimensional table);

- консольна таблиця (outrigger table).

 

Отже, через активізацію піктограми створення незалежної таблиці [] створюємо в робочій області ERwin спроектовані сутності та наповнюємо їх атрибутами, встановлюючи зв'язки (з урахуванням методології побудови сховища даних).