Методи подання даних у XML-документах
Існує декілька методів подання даних у XML-документах [3]: відображення на основі шаблону; відображення на основі моделі. В разі відображення на основі шаблону між документом і БД не існує наперед визначеної однозначної відповідності. Кожного разу за потреби перенесення даних у XML- документ створюється шаблон, у який вставляються спеціальні команди, що опрацьовуються програмами перенесення даних. У відображеннях на основі моделей дані у XML-документі подаються відповідно до наперед визначеної моделі даних. Цей підхід має значні переваги за простотою - документ містить лише структуровані дані і нічого зайвого. Гнучкість використання для різноманітних задач досягається інтеграцією із засобами перетворення XML-документів як XSLT [4]. Сучасні реляційні СКБД переважно підтримують об’єктно-реляційну модель відображення даних в XML. У цьому відображенні дані у XML-документі моделюються деревом об’єктів, специфічних для цього типу документів. Типи елементів з атрибутами та вміст елементів переважно моделюються класами. Класи відображаються у таблиці (відношення), скалярні властивості - в колонки (атрибути).
11. Що таке дані?
Дані – це повідомлення, які несуть інформацію про навколишній світ, і які людина може запам’ятати або зберегти на певному носії. При цьомузберігається не сам предмет або явище, а дані про нього.
Розрізняють числові, текстові, графічні, звукові та відеодані. Наприклад, у магазині ти можеш з етикетки прочитати такі дані про товар: назва (текстові дані), ціна (числові дані), розмір (числові дані), виробник (текстові дані), дата виготовлення (дані про число, місяць та рік). Можна встановити колір та форму товару (графічні дані).
Дані — це сукупність відомостей, які зафіксовані на деякомуносії для збереження, передавання та опрацювання.
Дані фіксуються не тільки за допомогою органів чуття людини,а й за допомогою різних пристроїв.
Наприклад, коли легкоатлет перетинаєфінішну смугу, то його результат визначається за допомогоюсекундоміра (числові дані), відеокамери (відеозображення — відеодані), фотокамер (фотознімки — графічнідані), записом у протоколі(текстові дані) тощо.
У інформатиці дані символізують інформацію, що представлена у вигляді необхідному для її опрацювання автоматичними засобами. Для цього інформацію кодують за допомогою знаків (алфавіт) відповідно до правил певного синтаксису. У сучасних машинах використовується двійковий метод запису даних за допомогою 0 та 1 (алфавіт з двох цифр). Для полегшення роботи для людини двійковий код перекодовується у зрозуміліші числа, букви тощо.
Дані є інформацією лише тоді, коли вони несуть значення у заданому контексті. Наприклад: кодом міжнародного телефонного зв'язку є набір знаків +38, тобто це дані, про інформацію ми можемо говорити лише за наявності відомості про назву країни, що відповідає цьому коду.
Дані розрізняють на:
• структуровані (наприклад: база даних, XML-документ),
• не структуровані (наприклад: текстовий документ),
• тимчасові.
Структуровані дані відносно легко піддаються машинній обробці, на відміну від них автоматична обробка неструктурованих даних не завжди можлива або можлива лише неточна.
Важливими проблемами у інформатиці, особливо у розподілених системах,— є синхронізація даних, а в управлінні даними — стрімке зростання кількості даних.
12. Що таке база даних?
База даних — це засіб збирання й впорядкування даних. Бази даних можуть містити відомості про людей, товари, замовлення тощо. Багато баз даних починаються як список у текстовому редакторі або електронній таблиці.
Головним завданням БД є гарантоване збереження значних обсягів інформації та надання доступу до неї користувачеві або ж прикладній програмі. Таким чином БД складається з двох частин: збереженої інформації та системи управління нею. З метою забезпечення ефективності доступу записи даних організовують як множину фактів (елемент даних).
Класифікація БД за моделлю даних:
• ієрархічні,
• мережеві,
• реляційні,
• об'єктні,
• об'єктно-орієнтовані,
• об'єктно-реляційні.
Класифікація БД за технологією фізичного зберігання:
• БД у вторинній пам'яті (традиційні);
• БД в оперативній пам'яті (in-memory databases);
• БД у третинній пам'яті (tertiary databases).
Класифікація БД за вмістом:
• географічні.
• історичні.
• наукові.
• мультимедійні.
Класифікація БД за ступенем розподіленості:
• централізовані (зосереджені);
• розподілені.
Окреме місце в теорії та практиці займають просторові (англ. spatial), темпоральні (temporal) і просторово-часові (spatial-temporal) БД.
13. Які існують основні методи інтеграції даних?
• Консолідація
У разі консолідації дані витягуються з джерел, і поміщаються в Сховище даних. Процес заповнення Сховища складається з трьох фаз - витяг, перетворення, завантаження (Extract, Transformation, Loading - ETL). У багатьох випадках саме ETL розуміють під терміном «інтеграція даних». Ще одна поширена технологія консолідації даних - управління змістом корпорації (enterprise content management, скор. ECM). Більшість рішень ECM спрямовані на консолідацію і управління неструктурованими даними, такими як документи, звіти та web-сторінки.
• Федералізація
У федеративних БД фізичного переміщення даних не відбувається: дані залишаються у власників, доступ до них здійснюється при необхідності (при виконанні запиту). Спочатку федеративні БД припускали створення у кожному з n вузлів n-1 фрагментів коду, що дозволяє звертатися до будь-якого іншого вузла. При цьому федеративні БД відокремлювали від медіаторів. При використанні медіатора створюється загальне уявлення (модель) даних. Медіатор - посередник, що підтримує єдиний користувальницький інтерфейс на основі глобального представлення даних, що містяться в джерелах, а також підтримку відображення між глобальним і локальним уявленнями даних.
• Поширення даних
Додатки поширення даних здійснюють копіювання даних з одного місця в інше. Ці програми зазвичай працюють в оперативному режимі і виробляють переміщення даних до місць призначення, тобто залежать від певних подій. Оновлення в первинній системі можуть передаватися в кінцеву систему синхронно або асинхронно. Синхронна передача вимагає, щоб оновлення в обох системах відбувалися під час однієї і тієї ж фізичної транзакції. Незалежно від використовуваного типу синхронізації, метод поширення гарантує доставку даних у систему призначення. Така гарантія - це ключовий відмітна ознака поширення даних. Більшість технологій синхронного поширення даних підтримують двосторонній обмін даними між первинними і кінцевими системами. Прикладами технологій, що підтримують поширення даних, є інтеграція корпоративних додатків (Enterprise application integration, скор. EAI) і тиражування корпоративних даних (Еnterprise data replication, скор. EDR). Від федеративних БД цей спосіб відрізняє двостороннє поширення даних.
• Сервісний підхід
Сервісно-орієнтована архітектура SOA (Service Oriented Architecture), успішно застосовується при інтеграції додатків, застосовна і при інтеграції даних. Дані також залишаються у власників і навіть місцезнаходження даних невідомо. При запиті відбувається звернення до певних сервісів, які пов'язані з джерелами, де знаходиться інформація та її конкретна адреса.
Інтеграція даних об'єднує інформацію з кількох джерел таким чином, щоб її можна було показати клієнту у вигляді сервісу. Сервіс - це не запит в традиційному сенсі звернення до даних, скоріше, це витяг деякої бізнес-сутності (або сутностей), яке може бути виконане сервісом інтеграції через серію запитів та інших сервісів.
14. Що таке консолідація інформаційних ресурсів та консолідація даних?
Консолідація – це один з методів інтеграції даних. Це односпрямований процес, тобто дані з декількох джерел зливаються в Сховище, але не поширюються з нього назад в розподілену систему. Часто консолідовані дані є основою для додатків бізнес-аналітики (Business Intelligence, BI), OLAP-додатків.
При використанні цього методу зазвичай існує деяка затримка між моментом оновлення інформації в первинних системах і часом, коли дані зміни з'являються в кінцевому місці зберігання. Кінцеві місця зберігання даних, що містять дані з великими часами відставання (наприклад, більше одного дня), створюються за допомогою пакетних додатків інтеграції даних, які витягують дані з первинних систем з певними, заздалегідь заданими інтервалами. Кінцеві місця зберігання даних з невеликим відставанням оновлюються за допомогою оперативних додатків інтеграції даних, які постійно відстежують і передають зміни даних з первинних систем в кінцеві місця зберігання.
У разі консолідації дані витягуються з джерел, і поміщаються в Сховище даних. Процес заповнення Сховища складається з трьох фаз - витяг, перетворення, завантаження (Extract, Transformation, Loading - ETL). У багатьох випадках саме ETL розуміють під терміном «інтеграція даних». Ще одна поширена технологія консолідації даних - управління змістом корпорації (enterprise content management, скор. ECM). Більшість рішень ECM спрямовані на консолідацію і управління неструктурованими даними, такими як документи, звіти та web-сторінки.
15. Що таке інформаційна система?
Інформацíйна систéма (англ. Information system) — сукупність організаційних і технічних засобів для збереження та обробки інформації з метою забезпечення інформаційних потреб користувачів, комунікаційна система, що забезпечує збирання, пошук, оброблення та пересилання інформації
Інформаційна система, як система управління, тісно пов’язується, як з системами збереження та видачі інформації, так і з іншої - з системами, що забезпечують обмін інформацією в процесі управління. Вона охоплює сукупність засобів та методів, що дозволяють користувачу збирати, зберігати, передавати і обробляти відібрану інформацію. Інформаційні системи існують з моменту появи суспільства, оскільки на кожній стадії його розвитку існує потреба в управлінні. Місією інформаційної системи є виробництво потрібної для організації інформації, потрібної для ефективного управління всіма її ресурсами, створення інформаційного та технічного середовища для управління її діяльністю. Інформаційна система може існувати і без застосування комп’ютерної техніки – це питання економічної необхідності. В будь-якій інформаційній системі управління вирішуються задачі трьох типів:
- задачі оцінки ситуації (деколи їх називають задачами розпізнавання образів);
- задачі перетворення опису ситуації (розрахункові задачі, задачі моделювання);
- задачі прийняття рішень (в тому числі і оптимізаційні).
Автоматизована інформаційна система – це взаємозв’язана сукупність даних, обладнання, програмних засобів, персоналу, стандартних процедур, які призначені для збору, обробки, розподілу, зберігання, представлення інформації у відповідності з вимогами, які випливають з цілей організації. Сьогодні, у вік інформації, практично кожна інформаційна система використовує комп’ютерні технології, і тому надалі під інформаційними системами надалі будемо підрозумівати саме автоматизовані.
Інформаційні системи включають в себе: технічні засоби обробки даних, програмне забезпечення і відповідний персонал. Чотири складові частини утворюють внутрішню інформаційну основу:
• засоби фіксації і збору інформації;
• засоби передачі відповідних даних та повідомлень;
• засоби збереження інформації;
• засоби аналізу, обробки і представлення інформації.
16. Яка роль інформаційних систем при консолідації даних?
Інформаційні системи в наш час широко задіюються для консолідації даних. Це робиться насамперед тому, що сучасні інформаційні системі в заданій сфері діяльності дозволяє забезпечити вирішення таких завдань:
1) прямий, своєчасний доступ до інформаційного продукту (точну інформацію про хід виробничого процесу в просторі та часі);
2) ефективну координацію внутрішньої діяльності та оперативне розповсюдження різноманітних повідомлень;
3) ефективнішу взаємодію із суміжниками по технологічних маршрутах за рахунок використання більш інформованих та наочних засобів відображення та передачі-прийому повідомлень;
4) виділення необхідного і неперервного часу для менеджерів всіх ланок на такі високоефективні види діяльності, як аналіз та прийняття рішень за рахунок зменшення часу на здійснення малопродуктивної діяльності;
5) використання якісно кращої технології системного аналізу та проектування оперативного управління на нижній та середніх ланках управління виробництвом.
17. Як здійснюється інформаційне моделювання предметної області за допомогою бази даних?
Для інформаційного моделювання, зв'язанного із проектуванням БД,частіше використовують модель ПО типу „сутність - зв'язок”. Така інформаційна модель є складовою частиною структурного аналізу, виконуваного за допомогою CASE-технології, і вскладі цієї технології носить найменуваня Entity-Realionship Diagrams (ER-діаграми). Ця модель дозволяє моделювати об'єкти ПО і взаємини цих об'єктів. Відносна простота, застосування природної мови й легкість розуміння дозволяють використовувати модель як інструмент для спілкуваня з майбутніми користувачами для збору інформації про ПО при пректувнні БД. Основне призначення моделі „сутність - зв'язок” – значеннєвий опис ПО й подання інформації для обґрунтування вибору видів моделей і структур даних, що надалі будуть використані в системі.
Існує кілька підходів до побудови моделей „сутність - зв'язок”. Загальним для всіх подходів є використання трьох основних конструктивних елементів для подання складових ПО – сутність, атрибут і зв'язок. Інформація про проект поєднується за допомогою графічних діаграм. Складова „час” у складі конструктивних елементів у явному вигляді відсутні. Час настання подій може бути поданий в моделі шляхом використання атрибутів.
Сутність – це збірне поняття, деяка абстракція існуючих об'єктів, прцесів чи явищ, проякі необхідно зберігати інформацію в системі. Як сутності в моделях ПО розглядаються класи матеріальних (підприємство, виріб, співробітники і т.д.) і не матеріальних (опис деякого явища, застосовування у системі структур даних, реферати наукових статей і т.д.) об'єктів реальної дійсності. При моделюванні використовувається також поняття „екземпляр сутності”. Тип сутності визначає набір однорідних об'єктів, а екземпляр сутності – конкретний об'єкт у наборі. Кожен розглянутий у моделі тип сутності повинний бути пойменований.
Для ідентифікації конкретних екземплярів сутностей використовуються спеціальні атрибути – ідентифікатори. Це може бути один чи декілька атрибутів, значення яких дозволяють однозначно відрізняти один екземпляр сутності від іншого.
Атрибут - це пойменована характеристика сутності, що набуває значення з деякої множини значень. У моделі атрибут виступає як засіб, за допомогою якого моделюються властивості сутностей.
Зв'язки виступають у моделі як засіб, за допомогою якого зображаються відношення між сутностями, що мають місце в ПО. Тип зв'язку розглядається між типами сутностей, а конкретний екземпляр зв'язку розглянутого типу існує між конкретними екземплярами розглянутих типів сутностей. При аналізі зв'язків між сутностями можуть зустрічатися бінарні (між двома сутностями) і, у загальному випадку, n-арні зв'язки (між п сутностями).
Участь сутностей у зв'язках характеризується двома критеріями: ступенем зв'язків і класом приналежності сутностей.
Ступінь зв'язку - це характеристика зв'язку, що вказує, зі скількома екземплярами однієї сутності може вступити у зв'язок (за допомогою відповідних екземплярів зв'язків) екземпляр іншої сутності.
18. Описати життєвий цикл бази даних.
Життєвий цикл бази даних - це сукупність етапів, які проходить база даних на своєму шляху від створення до закінчення використання.
Часто зустрічаються такі етапи
• Дослідження та аналіз проблеми, для вирішення якої створюється база даних.
• Побудова моделі.
• Нормалізація отриманих моделей. Після закінчення цього етапу, як правило отримують заготовки таблиці БД і набір зв'язків між ними (первинні і вторинні ключі)
• Перевірка цілісності БД
• Вибір фізичного способу зберігання та експлуатації (тех. Засобу) бази даних.
• Проектування вхідних і вихідних форм.
• Розробка інтерфейсу програми.
• Функціональне наповнення додатки
• Налагодження: перевірка на коректність роботи функціонального наповнення системи
• Тестування: тест на коректність введення виведення даних, тест на максимальну кількість активних сесій і т. Д.
• Введення в експлуатацію: налагодження ІТ-інфраструктури, навчання користувачів та ІТ-персоналу.
• При необхідності додавання вихідних форм і додаткової функціональності. У разі якщо необхідні більш серйозні зміни, слід повторити всі кроки з першого.
• Виведення з експлуатації: перенесення даних в нову СУБД.
19. Що таке організація баз даних?
Базу даних можна уявити як людинозорієнтовану і комп'ютерозорієнтова-ну модель даних, кожна з яких визначає своє середовище збереження даних. Людинозорієнтована модель бази даних відображається в паперових документах і в пам'яті людини, а компютерозорієнтоваиа - на фізичних носіях ЕОМ. Кожний рівень даних характеризується своїм описом (сприйняттям) елементів даних - зовнішній (інфологічний), концептуальний (даталогічний) і внутрішній (фізичний) рівень. Ці рівні формують трирівневу архітектуру баз даних.
Опис, виконаний із використанням природної мови, математичних формул, таблиць, графіків та інших засобів, зрозумілий людям, які працюють над проектуванням бази даних, називають інфологічною моделлю даних. Основними конструктивними елементами іифологічної моделі є сутності, зв'язки між ними та їхні властивості. Сутність - це будь-який об'єкт, інформацію про який потрібно зберігати в базі даних. Сутностями можуть бути товари, виробники товарів, банківські рахунки тощо. Властивість - піменована характеристика сутності (поточний рахунок, фірма "Світоч" тощо). Для прискорення пошуку конкретних атрибутів бази даних використовують ключі. Ключ - мінімальний набір атрибутів, за значенням яких можна однозначно знайти необхідний примірник сутності.
Одна з основних вимог до організації бази даних - це забезпечення можливостей знаходження одних інформаційних об'єктів за значенням інших, для цього необхідно встановити між ними певні зв'язки. Оскільки в реальних базах даних нерідко зберігаються сотні і навіть тисячі сутностей, то теоретично між ними може бути встановлено більше, ніж мільйон зв'язків. Наявність такої множини зв'язків і визначає складність інфологічних моделей.
Під час побудови інфологічних моделей, як правило, використовують мову ER-діаграм (від англ. Entity-Relationship - сутність-зв'язок). У них сутності відображаються прямокутниками, асоціації - ромбами або шестикутниками, атрибути - овалами, а зв'язки між ними - неналравленими ребрами, над якими можуть проставлятися ступені зв'язку (1 або буква, яка заміняє слово "багато") і необхідні пояснення. Між двома сутностями, наприклад А і В, можливі чотири типи зв'язків.
20. Що таке інформаційний продукт?
Наслідком поєднання інформаційних ресурсів та інформаційних технологій є створення певної нової інформації або інформації у новій формі. Це продукція інформаційної діяльності, яка називається інформаційними продуктами і послугами. Інформаційна продукція — це матеріалізований результат інформаційної діяльності, призначений для задоволення інформаційних потреб громадян, державних органів, підприємств, установ та організацій».
З позиції виробника інформаційний продукт — це сукупність даних, сформована виробником для поширення в матеріальній або нематеріальній формі. Якщо він пропонується ринку з метою його придбання, використання чи споживання, його варто розглядати як товар, що має певні особливості. До особливостей інформації як товару належать такі:
• інформацію можна продати, залишивши її у попереднього власника;
• ціна інформації прямо не залежить від місця, часу та способу її використання;
• володіння інформацією не є гарантією абсолютного права на її використання;
• цінність інформації на момент її створення та в час продажу здебільшого невідома і зазвичай визначається після використання;
• цінність однієї інформації може бути різною для різних користувачів;
• інформація здатна приносити користь, функціонально не пов’язану з витратами на її виробництво;
• інформація не втрачається в процесі використанні, але морально застаріває.
21. Яке співвідношення між інформаційним продуктом і базою даних?
База Даних (БД) - це набір даних, який достатній для встановленої мети та представлений на машинному носії, у вигляді дозволяє здійснювати автоматизовану переробку міститься в ньому інформації. Сучасні БД є одним із різновидів інформаційної продукції і відображають сутність цього явища.
Головним завданням БД є збереження і уявлення на вимогу користувача всієї необхідної інформації, виключаючи повторення і надмірність, а також зводячи до мінімуму ймовірність виникнення збоїв у роботі з даними і втрати даних.
БД нерозривно пов'язані з усіма інформаційними ресурсами суспільства, створюються на їх основі, а багато з них і можуть використовуватися тільки разом з документальними джерелами інформації. Інформаційні ресурси розглядаються як важлива частина національних ресурсів, а проблеми їх розвитку - як частину загальних проблем інформатизації суспільства.
Побудова такої моделі здійснюється в декількох етапів з послідовним наближенням до оптимального варіанту, який найбільш адекватно відображає модельовану предметну область.
Для створення БД в першу чергу визначають об'єкти, що цікавлять (наприклад: постачальники, споживачі, підприємства, працівники), а потім виділяють для кожного об'єкта набір характеризують його властивостей - мінімально можливу смислову одиницю («реквізит»).
Об'єкти реального світу, відомості про які зберігаються в БД, називають «сутностями», а їх актуальні ознаки - «атрибутами». Питання про інформаційний зміст БД вирішується не тільки шляхом визначення предметної області, але і з урахуванням інтенсивності роботи з різними видами інформації, їх динамічними характеристиками, частотою коригувань, ступенем їх взаємозв'язку.
22. Як час впливає на процес організації та використання даних?
Для зручності сприйняття користувачем, а також для покращення структуризації даних у БД часто звертають увагу на атрибут часу. Наприклад, можна розміщувати дані у БД в порядку, який залежить від часу створення запису чи часу, коли трапилась подія, про яку вноситься цей запис.
Більші можливості використання атрибуту часу надають темпоральні (часовозалежні) бази даних. Там використовуються часові лінії, тому атрибут часу набагато більш гнучкий.
В загальному ж випадку старіші дані (записи у БД) зміщуються донизу новішими. Можливе навіть затирання найбільш неактуальних (старих) записів. Це зумовлено тим, що цінність інформаційних продуктів заснована на часовій сутності, тобто як правило, інформація є найціннішою в момент її створення. По мірі тиражування цінність її значно знижується.
Як правило, користувач цікавиться не всією інформацією, що міститься в БД, тому необхідно забезпечити йому можливість виділення окремої частини (подмодели, локальної моделі). Структура організації даних у БД повинна враховувати зв'язки між різними видами даних і забезпечувати швидкий доступ до них.
23. Що таке якість баз даних?
Сучасні бази даних - один з тих об'єктів у сфері інформатизації, від яких іноді потрібно особливо висока якість і наявність можливості його оцінки. Але що означає якість баз даних, які вимоги слід пред'являти до їх якості, якими характеристиками можна описувати якість, як їх оцінювати і вимірювати? Для цього можуть бути корисні методи та стандарти, розроблені для аналізу складних програмних засобів.
При аналізі якості баз даних доцільно розглядати два компоненти: систему програм управління даними і сукупність даних, упорядкованих за деякими правилами.
Практично весь набір характеристик і атрибутів зі стандарту ISO 9126 «Якість програмних засобів» в тій чи іншій мірі може використовуватися в складі вимог до СУБД. Особливості полягають у зміні акцентів при їх виборі та впорядкування. У всіх випадках найважливішими характеристиками якості СУБД є вимоги до функціональної придатності процесів формування і зміни інформаційного наповнення баз даних адміністраторами, а також доступу до даних і представлення результатів користувачам.
У системах баз даних домінуюче значення набувають самі дані, їх зберігання і обробка. Для оцінювання якості інформації може застосовуватися загальний методичний підхід до виділення адекватної номенклатури стандартизованих в ISO 9126 базових характеристик.
Мірою якості функціональної придатності БД може бути ступінь покриття цілей, призначення і функцій баз даних доступною користувачам інформацією. На змістовному рівні функціональну придатність багатьох баз даних відображають:
• повнота накопичених описів об'єктів - відносне число об'єктів або документів, наявних у базі даних, до загального числа об'єктів з даної тематики або по відношенню до числа об'єктів в аналогічних базах даних;
• ідентичність - відносне число описів об'єктів, що не містять дефекти і помилки, до загального числа документів про об'єкти в базах даних;
• актуальність - відносне число застарілих даних про об'єкти в базах даних до загального числа накопичених і оброблюваних даних.
• Коректність або достовірність даних - це ступінь відповідності даних про об'єкти в базах даних реальним об'єктам в даний момент часу, що визначається змінами самих об'єктів, неточностями записів про їх стан або неточностями розрахунків їх характеристик.
• Захищеність інформації реалізується засобами СУБД в поєднанні з підтримуючими їх засобами захисту даних. Цілі, призначення і функції захисту тісно пов'язані з особливостями функціональної придатності кожної бази даних.
• Надійність інформації баз даних може грунтуватися на застосуванні понять і методів теорії надійності, яка дозволяє отримати ряд чітких, добре вимірюваних інтегральних показників. Надійна база даних, насамперед, повинна забезпечувати низьку ймовірність втрати працездатності. Швидке реагування на втрату або спотворення даних і відновлення їх достовірності і працездатності за час менше, ніж поріг між збоєм і відмовою, забезпечують високу надійність.
24. Що таке база часово-залежних даних?
Структурне подання часу: розрізняють два способи його подання: порядковий та структурний. Порядковий спосіб передбачає подання часу за допомогою натуральних чисел. Структурний спосіб ґрунтується на понятті структурування.
Часові елементи: При дослідженні часу розрізняють три типи часових елементів: часовий момент, часовий інтервал та термін часу.
Часовий момент служить для подання найменшої часової одиниці – хронона. Часові моменти будемо позначати t з індексами або без них. Кожній події в предметній області відповідає часовий момент.
Часовий інтервал задається за допомогою двох моментів часу – початкового та кінцевого, та складається з множини всіх часових моментів, які лежать між початковим та кінцевим.
Математичне визначення часу: Час – це безмежна щільна множина елементів, на якій визначено відношення порядку. Ця множина є ізоморфною до множини дійсних чисел, тобто часова вісь подається як вісь дійсних чисел. Таке визначення належним чином відображає усі аспекти часу як одного з елементів дійсності.
В області баз даних часову вісь визначають як зліченну дискретну множину, на якій задано відношення порядку (“менше рівне”). Елементи цієї множини називаються часовими моментами.
Моделювання часу: часовий ізоморфізм: Порядок і темп подій в базі даних відповідає порядку і темпу подій предметної області. Тобто моменти часу появи подій в предметній області фактично не повинні змінюватися при внесенні інформації про ці події в базу даних.
Моделювання часу: часова щільність: Стан бази даних або множини об’єктів, що в ній відображається, як в довільний момент часу появи подій, так і між двома сусідніми моментами появи подій, може бути виведений з інформації про усі попередні події. Тобто, стан бази даних є визначеним на усьому часовому проміжку дослідження поведінки предметної області.
Поява нової події в предметній області спричиняє зміну стану бази даних. Існують три основні способи впливу появи нової події на стан бази даних: східчастий, точковий та неперервний.
Моделювання часу: часова повнота: Еволюція предметної області описується скінченною множиною послідовних подій. Події предметної області трапляються лише у фіксовані моменти часу, а не постійно. Кількість моментів часу появи подій є скінченною, як і кількість подій, які трапилися в один момент часу.
25. Що таке система керування базами даних?
Систе́ма керування ба́зами да́них (СКБД) — комп'ютерна програма чи комплекс програм, що забезпечує користувачам можливість створення, збереження, оновлення, пошук інформації та контролю доступу в базах даних.
· Основні характеристики СКБД:
· Контроль за надлишковістю даних
· Несуперечливість даних
· Підтримка цілісності бази даних (коректність та несуперечливість)
· Цілісність описується за допомогою обмежень
· Незалежність прикладних програм від даних
· Спільне використання даних
· Підвищений рівень безпеки
Можливості СКБД:
· Дозволяється створювати БД (здійснюється за допомогою мови визначення даних DDL (Data Definition Language))
· Дозволяється додавання, оновлення, видалення та читання інформації з БД (за допомогою мови маніпулювання даними DML, яку часто називають мовою запитів)
· Можна надавати контрольований доступ до БД за допомогою:
· Системи забезпечення захисту, яка запобігає несанкціонованому доступу до БД;
· Системи керування паралельною роботою прикладних програм, яка контролює процеси спільного доступу до БД;
Система відновлення — дозволяє відновлювати БД до попереднього несуперечливого стану, що був порушений в результаті збою апаратного або програмного забезпечення.
Основні компоненти середовища СКБД:
· апаратне забезпечення
· програмне забезпечення
· дані
· процедури — інструкції та правила, які повинні враховуватись при проектуванні та використанні БД
· користувачі
· адміністратори даних (керування даними, проектування БД, розробка алгоритмів, процедур) та БД (фізичне проектування, відповідальність за безпеку та цілісність даних)
· розробники БД
· прикладні програмісти
· кінцеві користувачі
Архітектура СКБД:
Існує трирівнева система організації СКБД ANSI-SPARC, при якій існує незалежний рівень для ізоляції програми від особливостей представлення даних на нижчому рівні.
Рівні:
Зовнішній — представлення БД з точки зору користувача.
Концептуальний — узагальнене представлення БД, описує які дані зберігаються в БД і зв'язки між ними. Підтримує зовнішні представлення, підтримується внутрішнім рівнем.
Внутрішній — фізичне представлення БД в комп'ютері.
Логічна незалежність — повна захищеність зовнішніх моделей від змін, що вносяться в концептуальну модель. Фізична незалежність — захищеність концептуальної моделі від змін, які вносяться у внутрішню модель.
26. Які основні функцій системи керування базами даних?
Функції СУБД:
· пошук потрібних даних
· фізичне розміщення власне самих даних і їх описів
· відновлення і оновлення баз даних відповідно до змін у реальному світі (підтримка актуального стану)
· захист даних від злому, некоректних змін і забороненого доступу
· регулювання одночасних запитів до бази від декількох користувачів (така функція виконується за допомогою спеціальних прикладних програм).
27. Що таке реляційна модель даних і СКБД реляційного типу?
Реляційна модель даних — логічна модель даних. Вперше була запропонована британським ученим співробітником компанії IBM Едгаром Франком Коддом (E. F. Codd) в 1970 році в статті «A Relational Model of Data for Large Shared Data Banks». В даний час ця модель є фактичним стандартом, на який орієнтуються практично всі сучасні комерційні системи керування базами даних (СКБД).
У реляційній моделі досягається більш високий рівень абстракції даних, ніж в ієрархічній або мережевій. У згаданій статті Е. Ф. Кодда стверджується, що «реляційна модель надає засоби опису даних на основі тільки їх природної структури, тобто без потреби введення якоїсь додаткової структури для цілей машинного представлення». Іншими словами, подання даних не залежить від способу їх фізичної організації. Це забезпечується за рахунок використання математичного поняття відношення (сама назва «реляційна» походить від англійського relation — «відношення»).
До складу реляційної моделі даних зазвичай включають теорію нормалізації. Крістофер Дейт визначив три складові частини реляційної моделі даних:
· структурна
· маніпуляційна
· цілісна
Структурна частина моделі визначає, що єдиною структурою даних є нормалізоване n-арне відношення. Відношення зручно представляти у формі таблиць, де кожен рядок є кортеж, а кожен стовпець — атрибут, визначений на деякому домені. Даний неформальний підхід до поняття відношення дає більш звичну для розробників і користувачів форму представлення, де реляційна база даних являє собою кінцевий набір таблиць.
Маніпуляційна частина моделі визначає два фундаментальних механізми маніпулювання даними — реляційну алгебру і реляційне числення. Основною функцією маніпуляційної частини реляційної моделі є забезпечення заходів реляційності будь-якої конкретної мови реляційних БД: мова називається реляційною, якщо вона має не меншу виразність і потужність, ніж реляційна алгебра або реляційне числення.
Цілісна частина моделі визначає вимоги цілісності сутностей і цілісності посилань. Перша вимога полягає в тому, що будь-який кортеж будь-якого відношення відмінний від будь-якого іншого кортежу цього відношення, тобто іншими словами, будь-яке відношення має володіти первинним ключем. Вимога цілісності щодо посилань, або вимога зовнішнього ключа полягає в тому, що для кожного значення зовнішнього ключа, що з'являється у відношенні, на яке веде посилання, повинен знайтися кортеж з таким же значенням первинного ключа, або значення зовнішнього ключа повинно бути невизначеним (тобто ні на що не вказувати).
Реляційна система керування базами даних (РСКБД; інакше Система керування реляційними базами даних, СКРБД) — СКБД, що керує реляційними базами даних.
Поняття реляційний (англ. relation — відношення) пов'язане з розробками відомого англійського спеціаліста в області систем баз даних Едгара Кодда (Edgar Codd).
Ця модель характеризується простотою структури даних, зручним для користувача табличним представленням і можливістю використання формального апарату алгебри відношень і реляційного обчислення для обробки даних.
Реляційна модель орієнтована на організацію у вигляді двовимірних таблиць. Кожна реляційна таблиця являє собою двовимірний масив і має такі властивості:
· кожний елемент таблиці — один елемент даних
· всі комірки в стовпці таблиці однорідні, тобто всі елементи в стовпці мають однаковий тип
· кожний стовпець має унікальне ім'я
· однакові рядки в таблиці відсутні
· порядок наступності рядків і стовпців може бути довільним
· Базовими поняттями реляційних СКБД є:
· атрибут
· відношення
· кортеж
28. Яке призначення мови SQL?
SQL (англ. Structured query language — мова структурованих запитів) — декларативна мова програмування для взаємодії користувача з базами даних, що застосовується для формування запитів, оновлення і керування реляційними БД, створення схеми бази даних і її модифікації, системи контролю за доступом до бази даних. Сам по собі SQL не є ні системою керування базами даних, ні окремим програмним продуктом. Не бувши мовою програмування в тому розумінні, як C або Pascal, SQL може формувати інтерактивні запити або, бувши вбудованою в прикладні програми, виступати в якості інструкцій для керування даними. Стандарт SQL, крім того, вміщує функції для визначення зміни, перевірки і захисту даних.
SQL — це діалогова мова програмування для здійснення запиту і внесення змін до бази даних, а також управління базами даних. Багато баз даних підтримує SQL з розширеннями до стандартної мови. Ядро SQL формує командна мова, яка дозволяє здійснювати пошук, вставку, оновлення, і вилучення даних, використовуючи систему управління і адміністративні функції. SQL також включає CLI (Call Level Interface) для доступу і управління базами даних дистанційно.
29. Які переваги і недоліки мови SQL?
Переваги:
Незалежність від конкретної СУБД:
Незважаючи на наявність діалектів і відмінностей в синтаксисі, в більшості своїй тексти SQL-запитів, що містять, DDL і DML, можуть бути досить легко перенесені з однієї СУБД в іншу. Існують системи, розробники яких спочатку закладалися на застосування щонайменше кількох СУБД (наприклад: система електронного документообігу Documentum може працювати як з Oracle, так і з Microsoft SQL Server та IBM DB2). Природно, що при застосуванні деяких специфічних для реалізації можливостей такої переносимості добитися вже дуже важко.
Наявність стандартів:
Наявність стандартів і набору тестів для виявлення сумісності і відповідності конкретній реалізації SQL загальноприйнятому стандарту тільки сприяє «стабілізації» мови. Правда, варто звернути увагу, що сам по собі стандарт місцями занадто формалізований і роздутий в розмірах, наприклад, Core-частину стандарту SQL:2003 включає понад 1300 сторінок тексту.
Декларативність:
За допомогою SQL програміст описує тільки те, які дані потрібно витягнути або модифікувати. Те, яким чином це зробити, вирішує СУБД безпосередньо при обробці SQL-запиту. Проте не варто думати, що це повністю універсальний принцип — програміст описує набір даних для вибірки або модифікації, проте йому при цьому корисно уявляти, як СУБД розбиратиме текст його запиту. Особливо критичні такі моменти стають при роботі з великими базами даних і зі складними запитами — чим складніше сконструйований запит, тим більше він допускає варіантів написання, різних за швидкістю виконання, але тих самих за набором даних.
Недоліки:
Невідповідність реляційної моделі даних: Творець реляційної моделі даних Едгар Кодд, Крістофер Дейт та їхні прихильники указують на те, що SQL не є істинно реляційною мовою. Зокрема вони указують на такі проблеми SQL[3]:
· Рядки, що повторюються
· Невизначені значення (null)
· Явна вказівка порядку стовпчиків зліва направо
· Стовпці без імені та імена стовпчиків, що дублюються
· Відсутність підтримки властивості «=»
· Використання покажчиків
· Висока надлишковість
У опублікованому Крістофером Дейтом і Г'ю Дарвеном Третьому Маніфесті[4] вони висловлюють принципи СУБД наступного покоління і пропонують мову Tutorial D, яка є достовірно реляційною.
Складність:
Хоча SQL і замислювався, як засіб роботи кінцевого користувача, врешті-решт він став настільки складним, що перетворився на інструмент програміста.
Відступи від стандартів:
Незважаючи на наявність міжнародного стандарту ANSI SQL-92, багато компаній, СУБД (наприклад, Oracle, Sybase, Microsoft, MySQL), що займаються розробкою, вносять зміни до мови SQL, вживаної в розроблених ними СУБД, тим самим відступаючи від стандарту. Таким чином з'являються специфічні для кожної конкретної СУБД діалекти мови SQL.
Складність роботи з ієрархічними структурами:
Раніше SQL не пропонував стандартного способу маніпуляції деревовидними структурами. Деякі постачальники СУБД пропонували свої рішення. Наприклад, Oracle використовує вираз CONNECT BY. В наш час[Коли?] як стандарт прийнята рекурсивна конструкція WITH.
30. Що таке реляційна модель даних з гніздуванням?
31. Що таке об’єктно-орієнтовані моделі даних та об’єктно-орієнтовані СКБД?
Нині ООСКБД приділяється багато уваги як з теоретичної, так і з практичної точок зору. Можна виділити три характерні риси сучасного стану досліджень у цій галузі:
· відсутність загальноприйнятої моделі даних;
· відсутність єдиної формальної теорії;
· активна експериментаторська діяльність.
Класичні роботи Кодда специфікували системи реляційних баз даних (модель даних і мову запитів), для систем об'єктно-орієнтованих баз даних подібна специфікація відсутня. Це не означає, що не існує жодної повної моделі об'єктно-орієнтованої бази даних. Таких моделей є багато, але жодна з них не може вважатися загальноприйнятим стандартом. Нині нема єдиної думки про те, чим є об'єктно-орієнтована система програмування, не кажучи вже про ООСКБД. Окрім того, відсутній надійний теоретичний базис, що робить практично неможливим досягнення спільного погляду на модель даних.
Ведуться численні експериментальні дослідження. Можна сподіватися, що разом із відповідною моделлю виникнуть її життєздатні реалізації. Можливо, незабаром за взірець буде взята певна система, але не тому, що вона буде найоптимальнішою, а тому, що вона виявиться першою системою, яка надасть багато функціональних можливостей, відповідних до вимог ринку.
Особливе місце в розвитку проблематики об'єктно-орієнтованих СКБД посідає діяльність групи з управління об'єктними базами даних ODMG (Object Data Management Group) — некомерційного консорціуму виробників об'єктних баз даних та інших організацій, зацікавлених у виробленні стандартів зі зберігання об'єктів у базах даних.
В об'єктно-орієнтованій моделі дані та методи, що їх обробляють, об'єднуються в структури, які називаються об'єктами. Типи об'єктів називаються класами.
З точки зору баз даних є такі важливі особливості ООМ:
· підтримка структур даних, що мають довільний рівень складності;
· ідентифікованість та унікальність об'єктів;
· належність об'єктів класам;
· інкапсуляція;
· успадкування та ієрархії класів;
· поліморфізм.
32. Які часові виміри пов'язують з базами даних?
33. Описати підходи пов'язування даних з часом.
34. Що таке темпоральні баз даних і які є їхні різновиди?
35. Описати недоліки темпоральних баз даних.
36. Життєвий цикл даних.
Основними етапами життєвого циклу даних є виникнення, збереження, застосування та знищення. Знищення, з точки зору життєвого циклу даних, не представляє інтересу, оскільки причиною видалення є втрата інформативності даних. Фаза використання даних включає три етапи:
o пошук;
o обробку;
o аналіз.
Результатом використання даних є інформація.
Дані, як речовину чи енергію, можна збирати, обробляти, зберігати, змінювати форму їх представлення. Вони можуть створюватись, знищуватись, багаторазово використовуватись. Головною особливістю даних сьогодні є те, що їх стає надзвичайно багато. При масовому застосуванні комп'ютерів виникла гігантська кількість джерел даних. Для прикладу можна взяти обсяг даних у всесвітній мережі Інтернет, що збільшується щохвилини.
Ключовим поняттям маніпулювання даними є структура типу "файл", що представляє собою множину однотипних елементів (записів). Також файл займає певну ділянку на носії пам'яті і характеризується ім'ям, типом та іншими атрибутами. В свою чергу запис - це структура, яка складається з полів (мінімальної структури даних).
37. Інформаційні продукти консолідованої інформації. Які є види логічної організації даних?
Необхідно розрізняти: фізичну консолідацію — реально зібрану в одному місці інформацію і логічну консолідацію або федеративну — інформацію розподілену, але з точки зору користувача, знаходиться в єдиному сховищі, що має загальний каталог і однаковий доступ до неї.
Продукти консолідації інформації, основні їх типи включають:
• Огляди: критичні огляди, звіти про сучасний стан.
• Звіти: оцінні, маркетингові та технічні звіти; сигнальні бюлетені або листи.
• Дані: компіляції і таблиці даних; статистичні зведення, кореляції і композиції; критичні дані.
• Бази даних: експертні бази даних; бази знань з предметів.
• Технічні записи: путівники, довідники, аркуші інструкцій, пояснення складного предмета, виконане у стилі і мові, адресованому рівню даної аудиторії. Популярні статті на наукові або технічні теми.
• Керівництва: компіляції істотних даних та інформації щодо предмету.
• Критичні дослідження: порівняння різних практик чи політик зі списками за і проти; вплив і майбутні дослідження.
• Запити: оцінка досліджень і компіляцій на вимогу; брифінги
Звичайно, кожен з цих продуктів має власні вимоги, критерії і процедури[8].
Деякі з продуктів можуть бути підготовлені за допомогою аналітико-синтетичної переробки інформації.
Спираючись на сучасні термінологічні словники, стандарти, посібники, можна встановити, що під аналітико-синтетичною обробкою інформації розуміють процеси переробки, збирання, введення, записування, перетворення, зчитування, зберігання, знищення, реєстрація інформації, з метою вилучення необхідних відомостей, їх оцінки, порівняння і узагальнення, а це, як правило, анотування, реферування, вилучення фактів, підготовка оглядів, складання бібліографічних описів (БО), анотування, індексування.
Основні види аналітико-синтетичної переробки документів та інформації визначаються у Держстандарті України (ДСТУ 2394-94 Інформація та документація. Комплектування фонду, бібліографічний опис, аналіз документів), який відповідає міжнародному стандарту ISO 5127/3a-1981, і включають:
• бібліографічний опис
• індексування
• анотування
• реферування
• переклад наукових документів
• збирання, критична оцінка, систематизація й узагальнення науково-технічних даних
• складання оглядів
Усі перелічені види полегшують пошук продуктів консолідованої інформації. Логічна організація даних на машинному носії залежить від програмних засобів організації і ведення даних, які використовуються у внутрішньо-машинній сфері. Логічна організація даних визначається типом структур даних і видом моделі, яку використовує і підтримує програмний засіб. Основою організації бази даних є модель даних, яка визначає правила, відповідно до яких структуруються дані.
38. Реферат як інформаційний продукт консолідованої інформації
Реферува́ння — це одна з найбільш широко розповсюджених письмових форм отримання інформації, яка дозволяє при сучасному величезному потоці інформації у короткий термін відібрати потрібну спеціалісту інформацію. У порівнянні з анотуванням реферування є досконалішим методом обробки інформації джерел інформації: якщо в анотації приводиться лише короткий перелік питань, що розглядаються, то в рефераті викладається сутність питань та наводяться найважливіші висновки.
На сучасному рівні розвитку інформаційних технологій з'явилася задача автоматичного реферування. Розрізняють два види рефератів: продуктивні і репродуктивні. Репродуктивний реферат відтворює зміст первинного тексту. Продуктивний містить творче або критичне осмислення реферованих джерел.
Репродуктивні реферати можна розділити ще на два види: реферат-конспект і реферат-резюме. Реферат-конспект містить фактичну інформацію в узагальненому вигляді, ілюстрований матеріал, різні відомості про методи дослідження, результати дослідження та можливості їх застосування. Реферат-резюме містить тільки основні положення даної теми.
У продуктивних рефератах виділяють реферат-доповідь і реферат-огляд. Реферат-огляд складається на основі декількох джерел і зіставляє різні точки зору з даного питання. У рефераті-доповіді, поряд з аналізом інформації першоджерела, є об'єктивна оцінка проблеми; цей реферат має розгорнутий характер.
Реферати поділяють на інформативні та індикативні. Факт такого поділу був визнаний міжнародною конференцією з наукового реферування (Париж, 1949 р.). Інформаційний реферат, за її визначенням, містить аргументи й наводить основні дані та висновки оригінальних документів, які вносять цінний вклад у загальну систему знань або корисні для певного кола читачів, а індикативний — це стислий реферат, створений з метою допомогти читачеві у вирішенні питання, чи слід йому звертатися до оригінального документа. Інформативний реферат найповніше розкриває зміст документа, передає важливі фактичні та теоретичні відомості. У інформативному рефераті має бути вказано предмет дослідження та мету роботи, вміщено дані про метод і умови дослідження, висвітлено результати та пропозиції автора щодо їх застосування, наведено основні характеристики нових технологічних процесів, технічних виробів, нову інформацію про відомі явища, предмети та ін. Послідовність викладу матеріалу виступає як головна вимога, що висувається до такого реферату.
Індикативний реферат містить відомості тільки про найважливіші аспекти змісту первинного документа та його інформаційний зміст. При цьому вирішальним є не послідовність викладення матеріалу, а логіка бібліографічного задуму. Вона полягає у виділенні найголовнішого та найактуальнішого в документі. У такому рефераті немає детальної фактографічної інформації, його основне цільове призначення — привернути увагу користувача до наукового документа.
Також реферати поділяють на монографічні, звідний, аспектний, фрагментний. Монографічний — складений на основі аналітико-синтетичної переробки інформації, що міститься в одному первинному документі. Звідний реферат містить відомості з низки первинних документів на одну тему, викладені у вигляді зв'язаного тексту. Аспектним є реферат, укладений на основі аналітико-синтетичної переробки інформації одного чи кількох аспектів первинного документа. Фрагментний укладається за одним чи кількома структурними елементами документа, якщо він має великий обсяг різнопрофільної інформації. Також реферати поділяють за ознакою орієнтованості на споживача (цільовий і загальний), за формалізацією структури (текстовий і бланковий).
Реферат має певну композицію:
1. Вступ. У вступі обгрунтовують вибір теми, можуть бути дані вихідні дані реферованих тексту (назва, де опубліковано, в якому році), повідомлені відомості про автора (П. І.Б., спеціальність, вчений ступінь, вчене звання), розкривається проблематика обраної теми.
2. Основна частина. Зміст реферованого тексту, наводяться основні тези, вони аргументуються.
3. Висновок. Робиться загальний висновок з проблеми, заявленої в рефераті.
Реферат має наступні ознаки:
• зміст реферату повністю залежить від змісту реферованих джерел;
• містить точний виклад основної інформації без спотворень і суб'єктивних оцінок;
• має постійні структури.
40. Описати принцип ідентифікації подій за допомогою часу в базах даних
1) Принцип ідентифікації подій – події для різних об'єктів ПО відрізняються відповідним ідентифікатором об'єкта, а події для одного об'єкта – часовим моментом. Тобто з будь-яким об'єктом в один момент універсального часу може трапитися лише одна подія. Щоб формалізувати принцип ідентифікації подій за допомогою часу, для інформаційних ЧЗД-відношень узагальнено операцію зрізу. Узагальнений зріз (або зріз) інформаційного ЧЗД-відношення r на метамомент часу – це інформаційне відношення (ЧЗД- або традиційне) зі схемою R=(G,XA,X''T+), : яке отримано з r відображенням: кожному кортежу r, який відповідає об’єкту g, ставиться у відповідність кортеж зрізу, який також відповідає об’єкту g, що містить лише ті історичні кортежі з , які відповідають значенням . З результуючого кортежу вилучаються усі дублікати історичних кортежів.
41. Описати принцип ідентифікації станів за допомогою часу в базах даних.
2) Принцип ідентифікації станів – кожна нова подія змінює стан об'єкта, зумовлений усіма попередніми подіями. Тобто кожен стан ідентифікується не однією подією, а сукупністю усіх подій, що сталися на момент визначення стану. Це означає, що в БЧЗД зберігається інформація про події, а не про стани (як для ТБД).
42. Описати принцип метамоментності часу в базах даних.
1.Принцип метамоментності часу – будь-яка подія у теперішньому пов'язана з моментом часу, а в минулому і майбутньому вона пов'язана з періодами часу. Період минулого вказує на той проміжок часу, у якому відбулися події, наслідком яких є теперішня подія. Період майбутнього вказує на проміжок часу, у якому, можливо, стануться події, викликані заданою подією.
У реляційних БД метамоментна структура часу є кортежем:
де - періоди активації минулого (Past Activation Period);
- часові виміри теперішнього;
- періоди активації майбутнього (Future Activation Period). Цей кортеж відображає метамоментну реляційну модель часу.
Для аналітичного опрацювання даних встановлено необхідність формування часових рядів або незалежно від БД, або як результат виконання деяких операцій над даними. Для архівування важливою є одночасова підтримка принципів "пов’язування" даних з часом оперативного та аналітичного опрацювання.
44. Що таке метамоментна структура часу в базах даних?
Метамоментна часова реляційна модель даних побудована із застосуванням апарату теорії реляційних баз даних. Методи опрацювання даних та метаданих у розподілених середовищах створено за допомогою XML-технології. Для розроблення засобів аналізу, проектування реляційних баз часово-залежних даних застосовано технології аналізу та проектування інформаційних систем та програмного забезпечення. Розроблені засоби реалізації реляційних баз часово-залежних даних ґрунтуються на методах прикладної лінгвістики та мові запитів SQL. Для розроблення методів оцінювання якості реляційних баз даних, які враховують часові залежності даних, та аналізу отриманих результатів використано метрики оцінювання якості програмних продуктів за стандартом ISO-9126.
У реляційних БД метамоментна структура часу є кортежем:
де - періоди активації минулого (Past Activation Period);
- часові виміри теперішнього;
- періоди активації майбутнього (Future Activation Period). Цей кортеж відображає метамоментну реляційну модель часу.
45. Що таке часовий ряд?
Часов́ий ряд (англ. time series) — реалізація випадкового процесу, набір послідовних результатів спостереження. Приклади часових рядів кількість сонячних плям, сила вітру, змінення курсу валюти. Часовий ряд дуже часто побудовані за допомогою лінійних діаграм. Тимчасові ряди використовуються в статистиці, обробки сигналів,розпізнавання образів, економетрики, прогнозування погоди, передбачення землетрусів, електроенцефалографія,контроль інженерних даних, астрономії, інженерних комунікацій, і в значній мірі застосовується в наукових дослідженнях і техніки, який включає часові виміри.
Аналіз часових рядів включає методи аналізу часових рядів для того, щоб витягти корисну статистику та інші характеристики даних. Прогнозування часових рядів є використання моделі для прогнозування майбутніх значень на основі раніше спостережуваних значень. У той час як регресійний аналіз часто використовується таким чином, як для перевірки теорій, що поточні значення одного або більше незалежних часових рядів впливають на поточне значення іншої тимчасової серії, цей тип аналізу часових рядів не називається «Аналіз часових рядів», яка фокусується на порівнянні значень одного часового ряду або декількох залежних часових рядів в різні моменти часу.
Методи аналізу часових рядів можуть бути розділені на два класи: методи частотної області і методи тимчасової області[en]. Перші включають спектральний аналіз[en] івейвлет-аналіз; Останні включають в себе автоматичне кореляції і крос-кореляційний аналіз[en]. У тимчасовій області, аналіз кореляції можуть бути зроблені в фільтруючій манері за допомогою масштабованої кореляції[en], тим самим пом'якшуючи необхідність працювати в частотній області.
Крім того, методи аналізу часових рядів можуть бути розділені на параметричні[en] і непараметричні[en] методи. Параметричні методи припускають, що основноюстаціонарний випадковий процес має певну структуру, яку можна описати за допомогою невеликого числа параметрів (наприклад, за допомогою Авторегресія[en] абомоделі змінного середнього). У цих підходів, задача оцінки параметрів моделі, яка описує стохастичний процес. Навпаки, непараметричні підходи явно оцінити коваріаціїабо спектру, не припускаючи, що процес має особливого структуру.
Методи аналізу часових рядів можуть бути розділені на лінійні та нелінійні[en], і однофакторний і багатофакторний аналіз