Збереження та управління інформацією в ГІС

Збереження та управління інформацією базується на концепціях і стандартній архітектурі інформаційних технологій, які добре працюють в централізованому корпоративному комп'ютерному середовищі. Однією з таких технологій є технологія баз та сховищ даних. Вміст баз даних ГІС задається множиною просторових даних, утвореною сукупністю цифрових даних про просторові об'єкти. Бази даних дають змогу зберігати великі обсяги даних та маніпулювати ними. Формування БД і звернення до неї (щляхом запитів) здійснюється з допомогою системи управління базами даних (СУБД).

Структура БД визначається обраною моделлю даних. Найчастіше в ГІС застосовуються реляційні БД, в яких для представлення даних предметної області та взаємозв’язків між ними використовуються математичні відношення у формі реляційних таблиць. Маніпулювання даними здійснюється за допомогою операцій мов визначення та маніпулювання даними, найчастіше – за допомогою операторів мови SQL. Користувач може легко заносити в базу нові дані, комбінувати таблиці, вибираючи окремі поля і записи, і формувати нові таблиці для відображення на екрані.

Об'єктно-орієнтовані моделі застосовують, якщо геометрія певного об'єкту здатна охоплювати декілька шарів. Атрибути таких об'єктів можуть успадковуватися, для їх обробки застосовують специфічні методи.

Для оперування даними, що зберігаються в БД ГІС, використовується сучасна логіка взаємодії додатків. Водночас БД ГІС мають певні особливості у порівнянні зі звичайними реляційними та об’єктно-реляційними БД, які пов’язані специфікою просторових даних та операцій маніпулювання ними для вирішення завдань ГІС.

По-перше, геодані займають великий об'єм, що вимірюється сотнями мегабайтів, і містять багато макроелементів. Цим даним притаманні складні взаємозв’язки, які випливають зі структури транспортних мереж, топографії території тощо.

По-друге, для побудови і підтримки цілісності графічних наборів даних в ГІС потрібні розвинені засоби редагування і спеціалізована обробка на основі особливих географічних правил і команд. Компіляція даних в ГІС вимагає значних витрат, що спонукає користувачів до спільної роботи з наборами ГІС-даних.

По-третє, як і в усіх транзакційних БД, у базі даних ГІС відбувається постійне оновлення різноманітних даних, які мають підтримуватися СУБД ГІС. При цьому, щодо підтримки транзакцій до ГІС висуваються певні спеціальні вимоги, зокрема спроможність підтримувати довгі транзакції, оскільки у ГІС одна операція редагування може викликати зміни багатьох рядків даних у численних таблицях. Користувачі повинні мати змогу скасовувати і повторювати операції редагування. Сеанс редагування може тривати декілька годин або навіть днів і проводитися автономно в системі, відокремленій від центральної, спільно використовуваної бази даних, і перенесеній у інше місце. Наприклад, для проведення редагування деяких даних в польових умовах, необхідно забрати з собою якісь дані, провести їх редагування і оновлення на місці виконання робіт, а потім переслати внесені зміни в основну БД.

Часто користувачі, які у різних місцях проводять свої власні оновлення локальної БД, хочуть синхронізувати зміст ГІС-даних у кількох копіях (репліках) БД . При цьому СУБД можуть бути різними (наприклад SQL Server, Oracle чи DB2), і геоінфармаційні технології мають забезпечувати підтримку таких реплікацій.

Специфікою баз даних ГІС є також те, що вони є просторовими, тобто оптимізованими для збереження представлень та виконання запитів щодо просторових об’єктів, описаних своїми векторними чи растровими моделями. Такі БД мають розширену функціональність. Окрім зберігання та обробки звичайної для БД інформації, представленої даними символьного та чисельного типів, просторові БД працюють з цілісними просторовими об'єктами (англ. feature), об'єднуючими як традиційні види даних (описова частина або атрибутивна), так і геометричні (дані про положення об'єкта у просторі). На додаток до типових запитів SQL на основі оператора SELECT просторові БД дають змогу виконувати аналітичні запити, що містять просторові оператори для аналізу просторово-логічних відношень об'єктів (перетинання, доторкання, приналежність до іншого об'єкту, розміщення на відстані X від іншого об'єкту, збіжність тощо). СУБД таких БД підтримують набір визначених консорціумом «The Open Geospatial Consortium Inc» (OGC) додаткових просторових операторів та вбудованих функцій наступних типів: просторові вимірювання (Spatial Measurements), зокрема, пошук відстаней між точками, полігонами і т. д.; просторові функції (Spatial Functions), спрямовані на модифікацію існуючих об'єктів (features) для створення нових (наприклад, побудова буферних зон навколо об'єкту, перетин об'єктів тощо; просторові предикати (Spatial Predicates), що дають змогу отримати відповіді на питання типу чи «чи знаходиться яка-небудь установа освіти на відстані 300 м від передбачуваного місця будівництва пивного бару?» та визначити місцеположення подій вздовж лінійних об'єктів у відповідній системі координат; функції побудови (Constructor Functions), що реалізовують створення нових об'єктів за допомогою SQL-запитів через вказування положення вершин та вузлів ліній; функції аналітичних обчислень (Observer Functions), які повертають в запитах специфічну інформацію про геометрію об'єктів, наприклад, координати центру кола. Відмінною є також побудова індексів у таких БД. Комбінуючи вбудовані функції та оператори, можна проводити геокодування і визначення місцеположення адрес, трасування по інженерних і комунальних мережах, буферизацію, накладання і видобування просторових об'єктів. Існують затверджені OGC специфікації на представлення базових типів просторових об'єктів Simple Features і стандарти на додаткову функціональність СУБД для просторових БД, хоча повний набір просторових операторів підтримує лише незначна частина БД ГІС.

Нарешті, географічні БД належать до категорії розподілених БД. У розподілених БД здійснюється роздільне зберігання геопросторових даних про місцевість і Землю в цілому. Ці дані залежно від тематичної спрямованості зберігаються в геоінформаційних системах різного рівня і призначення, але організація їх представлення, зберігання та оновлення відбувається за єдиними правилами. Регіональна база даних може бути частковою копією відповідного “шматка” основної бази даних корпоративної ГИС. Ці бази даних повинні періодично синхронізуватися для обміну внесеними до кожної з них змінами.

Об'єднана розподілена база даних ГІС будь-якого рівня і призначення має у своєсму складі картографічну БД, тематичну БД, базу метаданих та оперативну БД. Картографічна БД містить цифрові топографічні карти і плани, дані аерокосмічної зйомки (у аналоговому чи цифровому вигляді) та довідкові графічні матеріали (атласи, чергові карти про зміни на місцевості, схеми тощо). У тематичній БД зберігаються цифрові тематичні карти за профілем функціонування ГІС і довідкові дані тематичного характеру. База метаданих (атрибутивна база) містить відомості про об'єкти конкретної місцевості та геопросторові дані про Землю загалом або про досліджуваний регіон. Через оперативну БД здійснюється взаємодія з БД інших ГІС для забезпечення відповідей на запити користувачів в режимі реального часу.

Аналіз просторових даних

Після введення даних у БД ГІС можна проводити їх аналіз. Засоби просторового аналізу являють собою різноманітні процедури (функції) маніпулювання просторовими і атрибутивними даними, виконувані при обробці запитів користувача. Ці засоби поділяють на специфічні для даної ГІС, які підтримують вирішення специфічних завдань користувачів певної ГІС, та базові, притаманні всім ГІС. До останніх належать: організація вибору і об'єднання об'єктів відповідно до заданих умов, накладення графічних об'єктів, аналіз накладень, реалізація операцій обчислювальної геометрії, побудова буферних зон, мережевий аналіз (аналіз мережевих структур).

Найпростішою формою вибору об'єктів за запитом є отримання характеристик об'єкта вказаного курсором на екрані та відображення об'єкта із заданими атрибутами. Складніші запити дають змогу вибирати об'єкти за кількома ознаками, наприклад за відстанню від інших об'єктів, збіжністю з об'єктами в інших шарах тощо. Для побудови запитів на вибір даних згідно до певних умов застосовують конструкції SQL з використанням математичних і статистичних функцій та географічних операторів, які дають змогу вибирати об'єкти на підставі їх взаємного розташування в просторі. Групування даних може проводитися за рівністю значень певного атрибуту чи приналежністю до одного тематичного шару при розташуванні всередині полігональних об'єктів інших тематичних шарів.

Геометричні функції підтримують розрахунки геометричних характеристик об'єктів або їх взаємного розташування в просторі на основі формул аналітичної геометрії. Так для площадних об'єктів обчислюються займані ними площі або периметри границь, для лінійних – довжини і відстані між об'єктами.

Топологічне накладення шарів здійснюють за допомогою оверлейных операций. В результаті накладення утворюється додатковий шар у вигляді графічної композиції вихідних шарів. Оскільки аналізовані об'єкти можуть відноситися до різних типів (точка, лінія, полігон), можливі різні форми аналізу: точка на точку, точка на полігон тощо. Найчастіше аналізують суміщення полігонів.

Побудова буферних зон є одним із засобів аналізувіддаленості об'єктів один від одного. Буферними зонами називають райони (полігони), межа яких знаходиться на заданій відстані від границі вихідного об'єкту. Межі таких зон обчислюють на основі аналізу відповідних атрибутивних характеристик. При цьому ширина буферної зони може бути як постійною, так і змінною, і мати різну форму. Наприклад, буферна зона джерела електромагнітного випромінювання матиме форму кола, а зона забруднення від димаря заводу з врахуванням рози вітрів – форму, наближену до еліпса.

Мережевий аналіз дозволяє користувачеві проаналізувати просторові мережі зв'язних лінійних об'єктів (дороги, лінії електропередач, теплокомунікаційні мережі тощо). Зазвичай мережевий аналіз використовують для визначення оптимального шляху, оцінки рівня навантаженості мережі, визначення адреси об'єкта або маршруту за заданою адресою та рішення інших подібних задач.

У багатьох випадках необхідно знати не лише об'єм простору, який займають об'єкти, але і кількість об'єктів в певній області, наприклад, розподіл чисельності населення. Для вирішення таких завдань застосовують методи аналізу просторового розподілу об'єктів, найрозповсюдженішими з яких є методи аналізу розподілу точкових об'єктів. За міру точкового розподілу приймають густину, яка визначається діленням кількості точок на площу території, на якій вони розташовані. Окрім густини, оцінюють форму розподілу. Точковий розподіл може бути: випадковим, рівномірним (кількості точок в усіх малих підобластях однакові), регулярним (точки, розділені по області однаковими інтервалами, розташовані у вузлах сітки), кластерним (точки розташовані тісними групами). Для аналізу локальних взаємовідношень між парами точок визначають середню відстань до найближчої сусідньої точки серед всіх можливих пар найближчих точок, що дає змогу оцінити міру розрідженості точок у розподілі.

Для порівняння різних географічних областей за, наприклад, густиною мережі гідрографії, оцінюють густину розподілу ліній. Лінії можуть також оцінюватися за близькістю і можливими перетинами. Іншими важливими характеристиками ліній, які піддаються визначенню, є орієнтація, спрямованість та зв'язаність.

Аналіз розподілу полігонів подібний до аналізу розподілу точок, проте при оцінці густини розподілу визначають не кількість полігонів на одиницю площі, а відносну частку площі, яку займає полігон.

8.5. Моделювання поверхонь. Технологія побудови цифрових моделей рельєфу (ЦМР)

Основою для комп'ютерного представлення даних земної поверхні є цифрові моделі рельєфу (ЦМР). Поверхні переважно задають значеннями висоти Z, розподіленими по області, визначеній координатами X та Y. Побудова ЦМР вимагає певної форми представлення вихідних даних (набору координат точок X,Y,Z) і способу їх структурного опису, які дають змогу відновлювати поверхню шляхом інтерполяції або апроксимації вихідних даних. Останні можуть бути отримані з мап (цифруванням горизонталей), з стереопар знімків або як результат геодезичних вимірювань чи лазерного сканування місцевості.

До основних процесів побудови ЦМР належать:

1. перетворення початкових карт в растрові зображення, тобто сканування;.

2. монтаж (зшивання) растрових фрагментів: у одне зображення так, щоб межі між початковими зображеннями були непомітні, з геоприв'язкою растрових даних;

3. векторизація растрового зображення в ручному, напівавтоматичному чи автоматичному режимах на спеціальних модулях типу Мари Еdit;

4. формування ЦМР на основі методів інтерполяції;

5. візуалізація результатів (інформації про поверхні) в різних формах.

Побудова ЦМР вимагає приведення первинних даих до певної структури. Найпоширенішими в ГІС структурами даних для представлення поверхонь є структури типу: GRID, TIN та TGRID.

TIN (Triangulated Irregular Network) являє собою нерегулярну триангуляційну мережу у вигляді сукупності трикутників, що не перекриваються. Вершинами трикутників є початкові опорні точки. Рельєф представляється багатогранною поверхнею, кожна грань якої описується або лінійною функцією (поліедральна модель), або поліноміальною поверхнею, коефіцієнти якої визначаються за значеннями у вершинах граней трикутників. Для отримання моделі поверхні пари точок з'єднують ребрами певним способом, званим триангуляцією Делоне (рис. 8.7).

 
 

Рис. 8.7. TIN модель

Для двовимірного простору триангуляція Делоне задається наступним твердженням: система взаємозв'язаних трикутників, що не перекриваються, має найменший периметр, якщо жодна з вершин не потрапляє всередину жодного з кіл, описаних навколо утворених трикутників (рис. 8.8).

Утворені трикутники максимально наближаються до рівнобічніх. Кожну із сторін цих трикутників з усіх можливих точок відповідної напівплощини видно під максимальним кутом. Інтерполяція здійснюєється по утворених ребрах.

Перевагою триангуляційної моделі є відсутність перетворень вихідних даних, що забезпечує найбільшу швидкість інтерполяції і найменшу ймовірність привнесення додаткових помилок. Водночас це не дає змоги використовувати такі моделі для детального аналізу. У ранніх версіях більшості ГІС триангуляційний метод був основним; нині більш поширені моделі типу GRID у вигляді регулярної матриці значень висот, отриманої інтерполяцією вихідних даних.

 

 
 

Рис. 8.8. Триангуляція Делоне

GRID–модель (рис. 8.9) фактично являє собою регулярну сітку, розміри якої задаються відповідно до вимог точності конкретної задачі. Ця сітка відповідає земній поверхні, а не її зображенню.

 
 

Рис. 8.9. Розподіл точок у моделі GRID

Модель TGRID (triangulated grid) поєднує елементи моделей TIN і GRID. До переваг моделі відносять можливість використовувати додаткові дані для опису складних форм рельєфу типу урвищ чи скель.

Відновлення поверхонь здійснюють інтерполяцією вихідних даних, тобто відновленням функції форми поверхні на заданному інтервалі за відомими значеннями цієї функції у кінцевій множині точок цього інтервалу. Найчастіше застосовують такі методи інтерполяції, як: лінійна інтерполяція, метод зворотних зважених відстаней, кригінг, сплайн-інтерполяція та тренд-інтерполяція.

Кригінг базується на використанні методів математичної статистики і концепції регіоналізованої змінної, тобто змінної, яка змінює своє значення від місця до місця з деякою видимою безперервністю, внаслідок чого не може моделюватися лише одним математичним рівнянням. Модель поверхні задається трьома незалежними складовими (рис. 8.10):

математичним рівнянням тренду, який характеризує зміну поверхні в певному напрямі;

невеликими випадковими, олднак просторово зв'язаними, відхиленнями від загальної тенденції (маленькими піками і западинами);

випадковим шумом.

 

Рис. 8.10. Елементи кригінгу: 1 - тренд, 2 – випадкові просторово зв'язані висотні коливання, 3 - випадковий шум

Очікувана зміна висоти вимірюється за варіограммою, на якій по горизонталі відкладають відстань між відліками, а по вертикалі – напівдисперсію, визначену як половина дисперсії між значеннями висот початкових і сусідніх точок. Через точки даних проводиться крива найкращого наближення, якому відповідає припинення зростанн|я дисперсії (граничний радіус кореляції).

Метод зворотних зважених відстаней базується на припущенні, що чим ближче одна до одної знаходяться початкові точки, тим ближчі їх значення. Набір точок, по яких здійснюватиметься інтерполяція, обирають в деякій околиці досліджуваної точки, де вони найбільше впливають на її висоту. Значенню висоти в кожній вибраній точці надається вага, що обчислюється залежно від квадрата відстані до точки, яка визначається. Завдяки цьому ближчі точки вносять більший внесок у визначення інтерпольованої висоти в порівнянні з більш віддаленими.

У тренд-інтерполяції, як і в методі зворотних зважених відстаней, для побудови поверхні тренда використовується набір точок в межах заданої околиці. В межах кожної околиці будується поверхня якнайкращого наближення на основі математичних рівнянь у вигляді поліномів або сплайнів. Тип використовуваного рівняння або ступінь полінома визначає величину хвилястості поверхні.

За сплайн-інтерполяції територія розбивається на невеликі ділянки, які не перетинаються. Це дає можливість опису складних поверхонь за допомогою поліномів невисоких ступенів (переважно – третього порядку). Апроксимація поліномами здійснюється окремо для кожної ділянки. Далі будується загальна функція «склеювання» на всю область, із завданням умови безперервності на межах ділянок. Згладжування сплайн-функціями зручно при моделюванні поверхонь, ускладнених розривними порушеннями, і дає змогу уникнути спотворення типу «крайових ефектів».