Реляційні СУБД кадастрового обліку

Атрибутивні дані та їх введення в ГІС

 

Атрибутивні дані, атрибути

Для кожного типу просторових об'єктів встановлюється набір атрибутів, що дозволяють ідентифікувати конкретний тип об'єкта і з максимально повно описати його властивості, після чого визначаються методи їх формалізації.

Одним із найпоширеніших атрибутів просторових об'єктів є їх власні назви (назви населених пунктів, політико-адміністративних одиниць, орографічних, гідрографічних та ландшафтних елементів, об'єктів господарювання тощо). Такий тип атрибута ідентифікує об'єкт, виокремлює його серед інших однотипних об'єктів, дозволяє виконувати цільові запити. Даний спосіб опису атрибутів об'єкта, коли об'єкт отримує своє власне ім'я, рівнозначне у списку ідентичних об'єктів називається номінальним.

Атрибути, що визначають місцеположення об'єкта серед інших аналогічних об'єктів, їх взаємну ієрархію, пріоритет, називаються порядковими. Таким способом описується ієрархія: ділянок транспортної мережі (автостради, шосе, дороги з удосконаленим покриттям, ґрунтові дороги); гідрографічних елементів (водотоки І, II або III порядку); ландшафтних елементів (ландшафти, урочища, фації), населених пунктів (місто, селище міського типу, село, хутір) тощо. У більшості випадків такі атрибути описуються порядковим номером певної рангової шкали.

Для кількісних показників (температура, тиск, вміст забруднювачів у повітрі, воді чи ґрунті, висота над рівнем моря, вміст гумусу, чисельність населення тощо) використовуються розімкнені або замкнені числові шкали. Дані показники можна порівнювати один з одним та виконувати з ними різні математичні операції.

Системи класифікації і кодування атрибутивних даних дозволяють скоротити описи різноманітних просторових об'єктів до одного або декількох десятків символів. Наприкінці минулого століття розроблено системи буквено-цифрових кодувань для геологічних, ґрунтових, ландшафтних, геоботанічних карт. Для цифрових топографічних карт і архітектурно-містобудівних планів розроблено відомчі позиційні коди – класифікатори. Наприклад, «Класифікатор інформації, що відображається на топографічних картах масштабів 1:10 000, 1:25 000, 1:50 000, 1:100 000, 1:200 000, 1:500 000, 1:1 000 000» передбачає виділення дев'яти основних класифікаційних груп, кожна з яких розбита на стандартні підрозділи.

Після певної обробки атрибутивна інформація може бути організована у вигляді бази даних певного формату.

Ефективне використання просторових даних передбачає наявність програмних засобів, які забезпечують функції їх зберігання, опису, оновлення і т.д. Залежно від типів і форматів їх подання, від рівня програмних засобів ГІС та деяких характеристик середовища та умов їх використання можуть бути запропоновані різні варіанти організації зберігання і доступу до просторових даних, причому способи організації розрізняються для позиційної (графічної) і семантичної (атрибутвної) їх частини. У досить простих програмних засобах ГІС, відсутні специфічні засоби організації зберігання, доступу до даних і маніпулювання або ці функції реалізується засобами операційної системи в рамках її файлової організації. Більшість же існуючих програмних засобів ГІС використовують для цих цілей достатньо витончені й ефективні підходи, засновані на організації даних у вигляді баз даних (БД), керованих програмними засобами, які отримали назва систем керування (управління) базами даних (СКБД/СУБД).

 

Елементи теорії баз даних

База даних є інформаційною моделлю реального світу в певній предметній галузі. За тлумачним словником з геоінформатики база даних (БД, data base, database, DB) – це сукупність даних, що організовані за певними правилами і встановлюють загальні принципи опису, збереження і маніпулювання ними.

У базах даних залежно від призначення (база даних підприємства, муніципальна база даних, база даних адміністративного району або області) може зберігатися і оброблятися певна інформація, наприклад:

- списки співробітників підприємств та їх облікові дані;

- списки будинків та їх технічні характеристики;

- юридичні або статистичні описи земельних ділянок;

а також формується перелік об'єктів опису, зокрема:

- склад атрибутів;

- спосіб і ступінь формалізації атрибутів;

- організація взаємозв'язку у базі даних.

Об'єкти бази даних можуть бути представлені у вигляді:

- текстових описів;

- цифрових кодів;

- цифрово-буквених класифікаторів;

- числових значень;

- календарних дат;

- тощо.

Будь-який однотипний об'єкт бази даних представляється ідентичним набором атрибутів. Таким чином, база даних складається з окремих записів, що характеризують об'єкти та покажчиків зв'язків між ними.

Проектування баз даних здійснюється за умови однозначної ідентифікації записів на основі одного або декількох атрибутів. Сукупність значень атрибутів називається ключем запису, а власне атрибути - ключовими атрибутами або ключами. Ключ запису можна розглядати як унікальне ім'я запису, що однозначно ідентифікує його.

У базі даних однорідні об’єкти (будинки, водойми, населені пункти тощо) та взаємозв’язки між ними представляються у вигляді ідентичних записів, тобто записів з однаковими атрибутами.

Множина однотипних записів представляється єдиним абстрактним записом, що називають типом запису. Кожному типу запису у відповідність наводиться ім'я і список атрибутів. Множині однотипних зв'язків у базі даних відповідає один тип зв'язку.

У базі даних виділяють:

- постійні дані;

- проміжні результати;

- керуючі оператори;

- робочі черги;

- службові дані.

До постійних даних відносять вхідні і вихідні дані, що відрізняються стабільністю у порівнянні з проміжними результатами. У процесі роботи постійні дані можуть зазнавати певних трансформацій: створення або видалення об'єктів, модифікація значень параметрів, набору або порядку представлення параметрів у записі тощо.

Для опрацювання взаємозв’язків між об'єктами бази даних розробляються спеціальні алгоритми, що представлені в конкретній реалізації бази даних відповідними програмними модулями.

Структура бази даних не залежить від вибору програмного забезпечення. Створення бази даних і здійснення запитів до неї реалізується за допомогою системи керування (управління) базами даних (СКБД/СУБД).

 

Моделі даних у ГІС

Історично СУБД класифікуються відповідно до використовуваної моделі даних:

- ієрархічна.

- мережева.

- реляційна.

- об'єктна.

- гібридна (елементи об'єктної з реляційною).

Ієрархічна модель даних

Об'єкти проблемної області можуть перебувати у відношеннях домінування і підпорядкування, що називають ієрархічними. До таких відношень належать:

- відношення «частина - ціле» (наприклад, множина населених пунктів об’єднується у сільську раду, множина сільських рад – у політико-адміністративний район, множина політико-адміністративних районів – у політико-адміністративну область);

- видове відношення (наприклад, споруди житлового, виробничого, сільськогосподарського призначення тощо);

- відношення підпорядкованості (наприклад, президент - губернатор - мер міста).

Об'єкти, що перебувають в ієрархічних відношеннях, утворюють дерево – орієнтований граф. У орієнтованого графа є лише одна вершина, що не підпорядкована жодній іншій вершині – корінь дерева, а будь-яка інша вершина графа підпорядкована лише одній вершині вищого рангу.

Схема ієрархічної моделі (hierarchical model) являє собою сукупність типів записів, що пов'язані типами зв'язків в одне або декілька дерев. Усі типи зв'язків цієї моделі належать до виду «один до декількох» і відображаються графічно стрілками.

Взаємозв'язки між об'єктами нагадують взаємозв'язки в генеалогічному дереві, однак: для кожного підпорядкованого типу об'єкта може існувати лише один домінантний тип об'єкта. Тобто ієрархічна модель даних допускає лише два типи зв'язків між об'єктами: «один до одного» і «один до декількох».

Ієрархічні бази даних є навігаційними, оскільки забезпечують доступ лише за допомогою заздалегідь визначених зв'язків.

Навігаційна природа ієрархічних баз даних є їх безсумнівною перевагою, оскільки забезпечує швидкий доступ при проходженні вздовж заздалегідь визначених зв'язків. Однак, жорсткість моделі даних і, зокрема, однозначна підпорядкованість створюють складності при використанні в умовах постійної реалізації нечітко обумовлених запитів. До недоліків ієрархічної моделі даних також слід віднести неможливість інформаційного пошуку з нижніх рівнів ієрархії по вище розміщених вузлах.

Мережева модель даних

У мережевій моделі (network model) даних будь-який об’єкт водночас може бути і домінантним і підпорядкованим. Домінантний об'єкт називається «власником набору», а підпорядкований – «членом набору» , тобто кожен об'єкт може приймати участь у будь-якій кількості взаємозв'язків.

Мережеву модель аналогічно до ієрархічної, можна представити у вигляді орієнтованого графа, однак у цьому випадку граф може містити цикли, тобто вершина графа може мати декілька кореневих вершин.

Мережева структура значно гнучкіша ніж попередня і є придатною для моделювання ширшого класу завдань.

Мережеві бази даних називають базами даних з навігацією. Принцип навігації підвищує міру взаємозалежності програм і даних, що підвищує ефективність доступу до даних і скорочує час відповіді на запит. Програми обробки даних жорстко детерміновані дійсним станом структури бази даних і повинні бути модифіковані при зміні структури бази даних.

Реляційна модель даних

Реляційна модель (relational model) даних передбачає табличне представлення об'єктів і взаємозв'язків між ними, що ідентифікуються як об'єкти. Кожна таблиця характеризує один об'єкт і складається з рядків і стовпців. Таблиця повинна мати первинний ключ (ключовий елемент) — поле або комбінацію полів, що однозначно ідентифікують рядок у таблиці.

У реляційній моделі даних кожен запис у таблиці даних містить інформацію, що відносяться будь-якого конкретного об'єкта, тому взаємозв'язані різнотипні дані в моделі можуть розглядатися як одне ціле.

Таблиця реляційної моделі даних характеризується наступними властивостями:

- відповідність елементів таблиці і елементів даних;

- відсутність повторюваних груп;

- однорідність стовпців в таблиці;

- номенклатурна унікальність стовпців;

- оригінальність рядків.

Якщо порядок розміщення рядків і стовпців у таблиці довільний, то таблиця називається відношенням. У геоінформаційній термінології для характеристики рядка використовується термін «запис», а для стовпця —«поле».

Основною відмінністю ієрархічних, мережевих і реляційних баз даних є методика встановлення взаємозв’язку і пошуку об’єктів. Зокрема, ієрархічні і мережеві моделі даних встановлюють взаємозв'язок і здійснюють пошук між об'єктами за структурою, а реляційні – за значенням ключових атрибутів.

Перевагою реляційної моделі бази даних є концептуальна простота, що дозволяє опрацьовувати невеликі за обсягом і прості в реалізації персональні бази даних, можливість реалізації яких є недоцільною і не розглядається в ієрархічних або мережевих моделях даних.

Недоліком реляційної моделі даних є надмірна кількість полів, що використовується для відображення зв'язків між об'єктами бази даних.

Об'єктна модель даних

Обєктна (об'єктно-орієнтована) модель (object-oriented model) є наступним етапом розвитку технології баз даних ГІС. При цьому вся сукупність даних, що зберігається та обробляється у базі даних, представляється не у вигляді набору окремих картографічних шарів і таблиць, а у вигляді об'єктів певного класу. Об'єктно-орієнтована модель, крім геометричної і атрибутивної інформації, зберігає програмний код, що визначає поведінку об'єктів будь-якого класу при введенні, редагуванні, аналізі або представленні даних. Класи об'єктів представляють специфічну ієрархічну структуру: від загального батьківського класу (робочого простору) переходять до опису характеристик і властивостей похідних класів (векторних, растрових, TIN-просторових даних). На базі похідних класів другого рівня описуються похідні класи третього, четвертого та нижчих рівнів (лінії, точки і полігони векторного представлення просторових даних). Похідні об'єкти успадковують усі властивості батьківського об'єкта, у програмний код якого додаються лише певні специфічні функції. При використанні стандартних класів об'єктів користувач одержує заздалегідь визначену структуру даних: ідентифікатори, типи і розміри полів табличної бази даних, опис методик.

На основі об'єктно-орієнтованої моделі побудована база даних ArcGIS, що має єдину внутрішню структуру та дозволяє в межах єдиного проекту використовувати і взаємно трансформувати різні типи просторових даних, виконувати погодження і усувати неузгодженості при редагуванні наборів даних різних картографічних шарів, організовувати доступ до різних об'єктів бази геоданих.

 

Реляційні СУБД кадастрового обліку

Особливу широке застосування при розробці програмного забезпечення ГІС отримали СУБД реляційного типу. СУБД реляційного типу дозволяють представити дані про просторові об'єкти (точки, лінії і полігони) і їх характеристики (атрибути) у вигляді відношення або таблиці, рядки якої - індексовані записи - відповідають набору значень атрибутів об'єкта, а колонки (стовпці) зазвичай встановлюють тип атрибуту, його розмір і ім'я атрибута. У число атрибутів не входять геометричні атрибути, що описують їх геометрію і топологію. Векторні записи координат об'єктів упорядковуються і організуються з використанням особливих засобів. Зв'язок між геометричним описом об'єктів і їх семантикою в реляційної таблиці встановлюється через унікальні номери - ідентифікатори. Зручність маніпулювання даними в БД істотно залежить від мовних засобів СУБД.

У зв'язку з цим зупинимося на розгляд тільки реляційних СУБД (РСУБД). Класифікація РСУБД здійснюється в залежності від обсягу підтримуваних БД і кількості користувачів.

Зробимо оцінку їх, відповідно до вимог що пред'являються системам автоматизації кадастрового обліку.

Вищий рівень:Oracle, corp. Oracle. Продукт цього класу володіє широким діапазоном функціональних можливостей, включаючи підтримку двофазної фіксації, тиражування даних, збережених процедур, тригерів, оперативно резервного копіювання. Він призначений для організації оптимального використання системних ресурсів, що гарантує максимальну розширюваність. Підтримує БД, що займають кілька фізичних дисків, зберігання нових типів даних. Підтримує майже всі апаратні і програмні платформи, існуючі на сьогоднішній день, а також протоколи передачі даних. Широко застосовується в багатьох галузях промисловості. Зарекомендував себе з найкращої сторони.

SQL Server 10, comp. Sybase. Потужний продукт, що підтримує обробку в реальному часі і процеси рішень. Одного рівня з Oracle, але володіє деякими обмеженнями в плані масштабованості, підтримує обмежене число апаратних і програмних платформ.

Середній рівень: Informix-OnLine, comp. Software. Даний продукт підтримує такі сучасні технології, як тиражування даних, синхронізуючий розподілені БД, і великі двійкові об'єкти. Він може застосуються для запуску OLTP-додатків (високошвидкісний обробки транзакцій), але швидкість обробки виявляється менше, ніж у продуктів верхній частині ринку. Установка можлива для обмежених кількостей платформ. Має великі можливості для розширення.

Microsoft SQL Server, corp. Microsoft. Дуже хороша СУБД. Корпорація Microsoft розробила хороший продукт, який вписується в загальну концепцію компанії, випускаючи тільки інтегровані продукти. Ця СУБД інтегрована з Windows, доповнюючи її. Недоліки: недостатня масштабованість, мала кількість підтримуваних програмних платформ.

Низький рівень: В цю групу входять Cupta SQL-Base Server, Watcom SQL Network Serverта інші. Вони володіють обмеженими можливостями в порівнянні з СУБД більш високого класу, але в невеликих компаніях, де БД невеликі і кількість користувачів обмежена кілька десятками людей, вони чудово виконують свої обов'язки по управлінню БД.

Настільні СУБД: FoxPro, corp. Microsoft. Дуже обмежені можливості по обробці даних. Відсутність можливостей роботи в мережі. Призначені для особистих справ. Не рекомендується для використання в крупних системах. Відсутня можливість захисту даних, управління доступом і багато іншого. Paradox, comp. Borland. У своєму класі одна з кращих, проте, їй властиві всі недоліки настільних СУБД. Обмежені можливості по застосуванню. Зручний інтерфейс.