Поняття, форми представлення та атрибути інформації

МІНІСТЕРСТВО ОСВІТИ І НАУКИ, МОЛОДІ ТА СПОРТУ УКРАЇНИ

НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ «ЛЬВІВСЬКА ПОЛІТЕХНІКА»

В.А. ПАВЛИШ, Л.К. ГЛІНЕНКО

ОСНОВИ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ І СИСТЕМ

УДК 004.6/.8 (075.8)

П 12

ББК 32.973

 

 

Рекомендовано до друку

Вченою радою Інституту телекомунікацій, радіоелектроніки та електронної техніки

Націоналтьного університету «Львівська політехніка»

 

 

Рецензенти:

Русин Б.П., зав. відділом методів і систем аналізу та ідентифікації зображень

ФМІ НАН України, д.т.н., професор

Мізюк Б.М., декан факультету менеджменту Львівської комерційної

академії, д.е.н., професор

Башков Є.О., завідувач кафедри прикладної математики і інформатики

Донецького Національного технічного університету, д.т.н., професор

 

Павлиш В.А. Ооснови інформаційних технологій і систем : Навчальний посібник для студентів вищих навчальних закладів./ В.А.Павлиш, Л.К.Гліненко. – Львів : Видавництво Національного університету «Львівська політехніка», 2013. - с., ілл. , табл.

Розглянуто широке коло питань, що відносяться до технологій формування і управління процесами роботи з даними і інформацією у різних областях діяльності. Висвітлені питання представлення даних, сигналів та інформації, реалізації базових інформаційних процесів інформаційних технологій. Наведені класифікація інформаційних технологій і систем, тенденції їх розвитку, викладені основи концепції відкритих систем як базової концепції архітектури сучасних інформаційних систем. Розглянуті підходи та засоби моделювання предметної області, даних та знань при створенні інформаційних систем; особливу увагу приділено об’єктно-орієнтованому підходу. Викладені основи технології та систем баз даних; основи технології мультимедіа; принципи побудови та функціонування систем розосередженої обробки інформації, інформаційно-обчислювальних мереж; основи геоінформаційних технологій та систем; основи побудови та функціонування інтелектуальних інформаційних систем.

Посібник спрямований на формування у студентів загального системного представлення про інформацію, методи її зберігання, обробки і передачі, сучасні інформаційні технології і системи.Посібник призначений для студентів вищих навчальних закладів, які вивчають інформаційні технології та системи, а також аспірантів та спеціалістів, які займаються даною проблемою.

 

 

З М І С Т

П Е Р Е Д М О В А. 4

В С Т У П. 7

Розділ 1 ІНФОРМАЦІЯ, СИГНАЛИ ТА ДАНІ 17

1.1. Поняття, форми представлення та атрибути інформації 17

1.2. Властивості, якісні характеристики та кількісна оцінка інформації 21

1.3. Від сигналів до даних, інформації та знань. Перетворення сигналів та основні операції з даними. 28

1.4. Цифрове представлення текстових та графічних даних.. 35

1.5. Представлення аналогових та дискретних сигналів у цифровій формі 46

1.6. Цифрове представлення звукових сигналів та відеосигналів. 53

1.7. Робота в режимі реального часу та особливості цифрової обробки сигналів. 66

Питання для самоперевірки. 71

Розділ 2 ОСНОВИ МОДЕЛЮВАННЯ ОБ’ЄКТИВНОЇ РЕАЛЬНОСТІ 72

2.1. Визначення об’єкта дослідження. Поняття моделі та моделювання. 72

2.2. Об’єкт дослідження, як складна система.. 77

2.3. Модель як структура для отримання і збереження знань. Вимоги до моделей та моделювання 82

2.4. Особливості моделювання складних систем.. 87

2.5. Підходи до моделювання складних систем.. 91

2.6. Об'єктно-орієнтований підхід до побудови моделей складних систем.. 100

2.7. Моделювання предметної області при створенні інформаційної системи.. 108

2.8. Методології структурного моделювання предметної області 112

Питання для самоперевірки. 117

Розділ 3 ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ І СИСТЕМИ ТА БАЗОВІ ІНФОРМАЦІЙНІ ПРОЦЕСИ ЇХ РЕАЛІЗАЦІЇ 118

3.1. Інформаційні технології і системи – основа інформаційної індустрії 118

3.2. Класифікація інформаційних технологій. 125

3.3. Методи проектування складних програмних систем.. 131

3.4. Базові інформаційні процеси. Збирання, попередня обробка та аналіз даних 136

3.5. Зберігання і накопичення інформації та даних.. 144

3.6. Транспортування інформації 151

3.7. Обробка інформації та її представлення користувачу.. 156

Питання для самоперевірки. 176

Розділ 4 ОСНОВИ ТЕХНОЛОГІЇ БАЗ ДАНИХ. 178

4.1. Бази даних: основні відомості та типи даних.. 178

4.2. Основні різновиди моделей даних.. 184

4.3. Системи управління БД.. 197

4.4. Проектування баз даних.. 206

4.5. Технологія «сховищ» та «просторів даних». 214

Питання для самоперевірки. 223

Розділ 5 КОНЦЕПЦІЇ РОЗВИТКУ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ І СИСТЕМ.. 225

5.1. Глобальні концепції розвитку ІТ/С та побудови інформаційного суспільства 225

5.2. Концепція архітектури відкритих систем.. 231

5.3. Розробка рівнів та моделі обміну даними між ними.. 242

5.4. Еталонна модель взаємодії відкритих систем.. 247

5.5. Концепція інкапсуляції даних в еталонній моделі 258

5.6. Інші моделі взаємодії відкритих систем.. 262

Питання для самоперевірки. 264

Розділ 6 СИСТЕМИ РОЗПОДІЛЕНОЇ ОБРОБКИ ДАНИХ. 266

6.1 Від пакетного режиму до розосередженої обробки даних.. 266

6.2. Інформаційно-обчислювальні мережі (ІОМ) та їх характеристики.. 273

6.3. Апаратно-програмні засоби ІОМ... 283

6.4. Різновиди інформаційно-обчислювальних мереж.. 290

6.5. Мережеві конфігурації 295

6.6. Методи передачі даних та комутації в ІОМ... 308

6.7. Методи управління обміном даними.. 321

6.8. Мережеві розподілені обчислення. 325

Питання для самоперевірки. 339

Розділ 7 ТЕХНОЛОГІЇ МУЛЬТИМЕДІА. 342

7.1. Основні поняття та різновиди мультимедійних технологій.. 342

7.2. Способи доставки та носії мультимедійних продуктів. 348

7.3. Базові технології мультимедіа: текст. 355

7.4. Базові технології мультимедіа: графіка.. 358

7.5. Базові технології мультимедіа: звук. 368

7.6. Відображення рухомих зображень: відео.. 381

7.7. Відображення рухомих зображень: анімація. 390

Питання для самоперевірки. 397

Розділ 8 ГЕОІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ 399

8.1. Поняття ГІС. Класифікація, сфери застосування, функції та структура.. 399

8.2. Структури і моделі даних в ГІС.. 405

8.3. Введення даних та створення баз даних ГІС.. 411

8.4. Аналіз просторових даних.. 415

8.5. Моделювання поверхонь. Технологія побудови цифрових моделей рельєфу (ЦМР) 417

8.6. Методи і засоби візуалізації геоінформації 422

8.7. ГІС-технології в Україні 424

Питання для самоперевірки. 427

Розділ 9 ІНТЕЛЕКТУАЛЬНІ ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ 429

9.1. Інтелектуальні інформаційні технології та системи. Основні поняття. 429

9.2. Моделі представлення знань у інтелектуальних технологіях.. 432

9.3. Технології автоматичного розпізнавання образів. 438

9.4. Інтелектуальні технології обробки текстової інформації 443

9.5. Гіпертекстова інформаційна технологія. 452

9.6. Інтелектуальні технології пошуку текстової інформації 456

9.7. Автоматизоване реферування та анотування текстів. 459

9.8. Технології машинного перекладу.. 464

9.9. Технологія нейронних мереж.. 472

9.10. інтелектуальні технології управління знаннями.. 486

9.11. Технології автоматизованого видобування знань з тексту.. 493

9.12. Орієнтовані на знання системи підтримки пошуку рішення. 502

Питання для самоперевірки. 509

Список літератури. 513

П Е Р Е Д М О В А

Завершується вік енергетики і на його зміну у відповідності з прогнозом Н.Вінера приходить вік інформатики. Перетворення інформації, інформаційних ресурсів в окрему економічну категорію складає одну з головних характеристик постіндустріальної епохи. Це єдиний вид ресурсів, який з поступальним розвитком людства не тільки не вичерпується, а навпаки, збільшується та сприяє найбільш ефективному, раціональному використанню усіх інших ресурсів, їх збереженню, а в цілому ряді випадків – розширенню та створенню нових.

Ринки перестають бути ринками товарів масового споживання – продуктів промислової економіки. На зміну масовому виробництву приходить масове індивідуальне виробництво на замовлення – масове виробництво індивідуальних продуктів і послуг, включаючи дані. Нова модель бізнесу будується на знаннях – знання управляє можливостями підприємства Успіх фірми починає залежати від її здатності діяти в глобальному масштабі, базувати свою економічну діяльність на інформації та знаннях, опираючись на інформаційні технології як на найважливіший інструмент управління.. В умовах інформаційного суспільства рівень та спосіб життя починають залежати не стільки від кількості отриманих матеріальних благ, скільки від рівня послуг, культури та освіти.

Навколишній світ стрімко змінюється перетворюючись у світ електронного бізнесу, електронної комерції, нової економіки та управління, у світ, рухомий інформаційними технологіями. Виробництво, економіка, освіта, медицина, культура, домашній побут – усе наше життя наповнюється інформаційними технологіями та системами.

Метою даного навчального посібник є формування у студентів загального кругозору в галузі інформаційних технологій і систем, вивчення існуючих принципів, підходів та методів моделювання предметної області; основ організації інформаційного обміну в інформаційно-обчислювальних мережах, ознайомлення із найважливішими сучасними комп’ютерними інформаційними технологіями та перспективами їх розвитку.

Навчальний посібник призначений для студентів вищих навчальних закладів, які вивчають інформаційні технології та системи, а також аспірантів та спеціалістів, які займаються даною проблемою.

У першому розділі приведені терміни, визначення та характеристики таких понять, як «інформація», «дані», «сигнали», «знання», що відносяться до категорії базових. Описано, як із сигналів отримують дані, а із даних – інформацію, як здійснюється оцифровка аналогових сигналів, представлення текстових та графічних даних в цифровій формі, показано важливість процесу цифрової обробки сигналів та його місце в інформаційних технологіях.

Другий розділ присвячений питанням моделювання об’єктивної реальності, починаючи із визначення предметної області, представлення об’єкта дослідження у вигляді складної системи та завершуючи вибором підходу до моделювання та технологією побудови моделі предметної області.

У третьому розділі висвітлюються основні поняття інформаційних технологій та систем, глобальні концепції їх розвитку, а також описана концепція побудови інформаційного суспільства. Показана структура та проведено опис базових інформаційних процесів реалізації інформаційних технологій.

Четвертий розділ присвячений питанням опрацювання великих масивів накопичених даних, основам створення моделей даних, баз даних, систем управління базами даних, проектуванню баз даних та технології «сховищ» та «просторів даних».

У п’ятому розділі відображені питання, пов’язані із вирішенням надзвичайно складної задачі – переміщенням інформації між комп’ютерами різних систем. Описана базова архітектурна модель для реалізації цих задач – еталонна модель взаємодії відкритих систем (Open System Interconnection – OSI).

Шостий розділ присвячений опису систем розподіленої обробки даних, створення яких стало можливим завдяки стандартизації апаратних та програмних інтерфейсів на базі концепції архітектури відкритих систем.

Сьомий розділ присвячений опису одних з найперспективніших інформаційних технологій – технологій мультимедіа, які з допомогою комплексу апаратно-програмних засобів дають змогу користувачу працювати в інтерактивному режимі з різнорідними даними – текстом, звуком, мовою, графікою, фото, відеозображенням, анімацією в єдиному інформаційному (мультимедійному) середовищі.

У восьмому розділі описуються геоінформаційні технології та системи, які були створені на базі мультимедіа та гіпертекстових технологій та призначені для впровадження в практику методів та засобів роботи з просторово-часовими даними, представленими у вигляді електронних карт та предметно-орієнтованих середовищ обробки різнорідної інформації для різних категорій користувачів, доступу до будь-яких світових сховищ інформації.

Дев’ятий розділ присвячений опису інтелектуальних технологій і систем, оскільки еволюція ІТ/С у значній мірі визначається їх інтелектуалізацією.

Крім теоретичного матеріалу у посібнику до кожного розділу наведені контрольні питання, які допоможуть студентам закріпити отримані знання та пов’язати їх із практичною діяльністю.

Будь-які зауваження та пропозиції будуть сприйняті авторами із розумінням та вдячністю.

В С Т У П

Стрімко, шаленими темпами зростає потік інформації, яка починає відігравати усе більш важливу роль у розвитку суспільства та міжнародного бізнес-середовища і як ресурс, і як товар. Інформація стає таким же важливим виробничим ресурсом, як енергія та матеріал, таким же основним економічним ресурсом науково-технічного потенціалу як технічні, трудові та фінансові ресурси. Підвищення організованості та впорядкованості за рахунок залучення додаткової або більш якісної інформації часто стає більш важливим фактором розвитку виробництва ніж залучення додаткових трудових ресурсів, сировини, енергії.

Що ж криється під поняттям «інформація»? У чому її сутність? Відповісти на ці питання складно, оскільки строгого та загальноприйнятого визначення цього терміну не існує дотепер. Тому і сьогодні актуальним залишається вислів Н. Вінера «Інформація є інформація, а не матерія і не енергія».

Спеціалісти різних галузей при вирішенні теоретичних та практичних наукових задач визначають поняття «інформація» по-різному, в залежності від їх класу та області дослідження. Фахівці в галузі математики та кібернетики трактують інформацію як міру усунення невизначеності, міру організованості системи, філософи – як атрибут матерії. Стандарт ISO 2382/1-1984, E/F 01.01.02 в процесах обробки даних та в офісних машинах визначає інформацію, як значення, яке людина присвоює даним на підставі існуючих домовленостей. В теорії динамічних систем, яка складає основу синергетики – науки про самоорганізацію, інформацію визначають, як випадковий вибір одного варіанта із декількох можливих та рівноправних. Випадковий вибір відповідає виникненню інформації. Якщо вибір не випадковий (підказаний) – мова йде про одержання (рецепцію) інформації.

Інформація разом із матерією та енергією є однією із фундаментальних сутностей світу, який нас оточує. Інформація не може виникнути з нічого. Вона є результатом відображення властивостей деякого образу реального світу, який у подальшому може існувати незалежно від матеріального об’єкта. Інформація нематеріальна, але вона не може існувати без матеріального носія – засобу зберігання або переносу інформації в просторі та в часі, проявляючи, у той же час, по відношенню до нього певну самостійність. Одну й ту саму інформацію можна зберігати на різних матеріальних носіях, передавати різними способами та з різними енергетичними затратами, багаторазово використовувати. Вона не зникає при споживанні та зберігається при передачі у суб’єкта, який її передає. Інформація має певні ознаки, характеристики, атрибути. Її можна описати через властивості, які вона проявляє, оцінити кількісно за допомогою таких понять, як об’єм, щільність, ємність, інформативність та якісно, як сукупність властивостей, які обумовлюють можливість її використання для задоволення певних потреб, визначених у відповідності з її призначенням. Метою використання інформації є зменшення невизначеності в процесі вироблення та прийняття управлінських рішень, підвищення організованості та впорядкованості системи, а суть інформаційного впливу полягає у здатності інформації управляти потужними речовинно – енергетичними процесами.

Часто інформацію ототожнюють з даними та знаннями, розуміють під інформацією будь-які відомості, вважають, що будь-яке повідомлення містить інформацію, не знають як із сигналів отримують дані, а із даних – інформацію. Дані – це виражені в різній формі факти, які характеризують об'єкти, процеси та явища предметної області, а також їх властивості. Вони не є тотожними інформації, а служать сировиною для неї. Для отримання інформації необхідний певний метод обробки даних, які самі по собі не несуть корисного смислу допоки певним чином не організовані та не впорядковані. Інформація з’являється в процесі аналізу опрацьованих даних, який надає їм смисл та забезпечує споживчі якості. Результатні дані у момент їх використання (при виробленні рішення) знову стають інформацією. Абстрактність інформації на відміну від конкретності даних полягає в тому, що процес інтерпретації у загальному випадку не може бути визначений формально, у той час як дані завжди існують у якійсь певній формі. Знання – це здатність перетворювати інформацію та дані в ефективні дії [Applehans W., 1999].

Не кожне повідомлення, яке передається, несе у собі інформацію, а лише таке, яке знімає або зменшує невизначеність про стан матеріальної системи (об’єкта, явища, події, процесу тощо). Про передачу повідомлення можна говорити тільки при наявності системи передачі інформації, яка складається із об’єкта – джерела інформації, суб’єкта – приймача інформації та каналу зв’язку. Передача здійснюється сигналами, які є результатом вимірювання фізичних або інших властивостей об’єкта дослідження. В приймальній системі вхідні сигнали виділяються на фоні шуму та після машинної алгоритмічної обробки перетворюються в так звану «сигнальну інформацію», яка по суті представляє собою дані. Інформаційний обмін відбувається на синтаксичному рівні (це зовнішня оболонка інформації, яка не відображає змістовність повідомлення), хоча сигнали містять у собі структуру зв’язків, інтерпретація яких дозволяє оцінити змістовну (семантичну) або корисну (прагматичну) сторону повідомлення. Сигнал –це матеріальний носій інформації – фізичний процес, параметри якого адекватно відображають інформацію про стан об’єкта спостереження.

Для вимірювання кількості смислового змісту інформації найбільше визнання отримала тезаурусна міра, яка зв’язана із здатністю приймача, в якості якого виступає користувач або система, сприйняти повідомлення, яке надійшло. (Тезаурус – це сукупність відомостей, якими володіє приймач інформації). Із семантичної точки зору інформація, яка міститься у повідомленні, змінює тезаурус приймача, тобто несе йому раніше не відомі (відсутні в його тезаурусі) відомості. Якщо цього не відбувається, то передаються відомості вже відомі або зрозумілі приймачу. Таким чином кількість семантичної інформації, яка міститься в повідомленні визначається, певною мірою, зміною тезаурусу приймача, а ефективність її передачі залежить від співвідношення тезаурусів джерела та приймача. У випадку, якщо сприйняття змісту наступного повідомлення залежить від результатів осмислення семантики попереднього повідомлення, має місце контекстна залежність. Під контекстом розуміється будь-яке оточення в якому існує джерело та приймач інформації, включаючи канал зв’язку, саму суб’єктно-об’єктну пару та їх взаємодію з оточуючим середовищем. Згідно стандарту ISO 9421-11 контекст – це користувачі, їх цілі та задачі, сукупність програмного та апаратного забезпечення, фізичне та соціальне оточення, в якому використовується система.

У природі всі вимірювані фізичні величини представляються неперервними (аналоговими) сигналами. Це означає, що вся сукупність відомостей про досліджувані об’єкти, системи, явища, що дають змогу приймати певні рішення, усе різноманіття вхідних сигналів від давачів, яке і створює дані, малюнки, текст, зображення, звук для представлення в комп’ютері повинно бути перетворене в цифрову форму. Під час цього перетворення надзвичайно важливо не втратити бодай частину важливої інформації, яка міститься в параметрах сигналів. Тому цифрова обробка сигналів, цифрове представлення даних є одним із найважливіших базових процесів інформаційних технологій, це місток між об’єктивною реальністю та віртуальним простором.

При роботі у віртуальному просторі людина має справу не з самим об’єктом, а з його узагальненою інформаційною моделлю, яка є його аналогом, але простіша від нього та зберігає окремі, найбільш суттєві, з точки зору поставленої мети, властивості. Тобто представлення природного або штучного об’єкта дослідження в інформаційному середовищі здійснюється за його моделлю, так само, як у людській пам’яті у вигляді певних образів та їх ідентифікаторів, що представляють собою логічну систему імен (так званих понять), відображаються об’єкти зовнішнього світу. Метою моделювання є створення адекватного образу досліджуваного об’єкта (моделі) та проведення з ним наукових експериментівдля аналізу його поведінки або розробки за результатами моделювання оригіналу, прототипом якого є модель. Математична модель є наближеним описом властивостей об’єкта-оригінала та відображає ті його риси, які цікавлять дослідника. Тому при конструюванні моделі (моделюванні) надзвичайно важливим етапом є постановка задачі – визначення мети проектування чи дослідження та предметної області – частини реальної дійсності, яка розглядається в межах даного контексту (з формальної точки зору контекст – це певна систему відліку). Визначення предметної області завжди суб’єктивне і в значній мірі залежить від мети та компетенції дослідника, так як і наступні етапи – виділення деякої частини предметної області у вигляді об’єкта дослідження та частини, що залишилась, у вигляді «фону» чи «зовнішнього середовища», встановлення границь об’єкта дослідження та його зв’язків із оточуючим середовищем, вибір методології дослідження та мови опису об’єктивних даних.

Загальноприйнятим методом наукового пізнання є системний підхід – методологія, яка базується на поданні об’єкта дослідження у вигляді системи, створенні її математичної моделі та дослідженні об’єкта за цією моделлю на ЕОМ.Системний підхід означає сприйняття системи як єдиного цілого у всій сукупності її елементів, з урахуванням системних властивостей, усіх зв’язків та відносин, як між елементами системи так і з оточуючим середовищем. Якщо об’єкт дослідження належить до категорії складних систем, система представляє собою множину структурно взаємопов’язаних і функціонально залежних підсистем.Інформація, яка передається між підсистемами, має семантичну складову, яку підсистеми-отримувачі здатні інтерпретувати та реагувати на неї в залежності від стану, як самої підсистеми, так і зовнішнього оточення. Тому при проектуванні і дослідженні складних систем, система і зовнішнє середовище повинні розглядатися, як єдине ціле.

Основу моделювання складають інформаційні процеси, оскільки воно базується на інформації про реальний об’єкт, модельних експериментах на підставі управляючої інформації та обробці даних. Побудову моделі складної системи можна розглядати як представлення об’єктивних даних на певній спеціальній мові. Тому завжди слід розрізняти семантичну і синтаксичну сторони побудови моделі. Синтаксис моделі – це її оболонка, а семантика – структура, зміст, внутрішній контекст, тобто все те, що при використанні моделі відповідає за її схожість з оригіналом. Для правильної інтерпретації моделі семантика потребує узгодження між користувачем моделі та тим, хто її побудував. Модель представляє собою структуру для збереження і отримання знань, як системи понять та логічних відношень між ними, що відображають якусь сторону реальної дійсності. Модель зберігає знання в певній формі, надаючи змогу зменшити ступінь надлишковості емпірично отриманої інформації.

Однією із сучасних ідеологій створення складних програмних комплексів та систем є об’єктно-орієнтований підхід, метою якого є адекватне моделювання предметної області у термінах взаємодії об’єктів, а концептуальною основою – об’єктні моделі, за якими може бути прослідковано відображення реальних сутностей предметної області в об’єкти та класи програмної системи. Кожний об’єкт характеризується властивостями, станом та поведінкою. Об’єкти з однаковою структурою та поведінкою об’єднуються в класи, стаючи їх екземплярами. Клас задає властивості (змінні) та поведінку (методи) екземплярів (об’єктів) класу і також є об’єктом із своїми властивостями, поведінкою та здатністю породжувати нові екземпляри. Кожен об’єкт інтегрує в собі деяку структуру даних та доступні тільки йому процедури їх обробки, взаємодіючи із зовнішнім оточенням через певний інтерфейс у вигляді переліку повідомлень, які він може приймати. Основні принципи об’єктно-орієнтованого підходу (абстрагування, інкапсуляція, модульність, ієрархія) та поняття (об’єкт, клас, атрибут, операція, інтерфейс та ін.) сформульовані Граді Бучем у його фундаментальній книзі «Об’єктно-орієнтований аналіз і проектування».

З розвитком інформаційних технологій докорінно змінюється модель ринкових відносин. Ініціатива переходить до рук самого споживача, який, використовуючи сучасні технології, отримує необхідну інформацію і самостійно приймає рішення. Виробництво, економіка, освіта, медицина, культура, домашній побут – усе наше життя наповнюється інформаційними технологіями. Інформатизація, як процес переходу від індустріального до інформаційного суспільства, для якого характерно забезпечення певного ступеня інформованості громадян та надання інформаційних послуг високого рівня, стає вирішальним фактором його розвитку, основою забезпечення відповідного рівня життя населення на основі використання високих технологій, а його головним ресурсом – інформаційні технології та системи, а також рівень готовності людини використати надані можливості. Асоціація американських бібліотек назвала інформаційно грамотною людиною особистість, здатну виявити, розмістити, оцінити інформацію та найбільш ефективно її використати. Інформаційні технології – це перш за все інструмент для досягнення поставленої мети. Необхідно навчитися користуватись ним, використовувати його там де це потрібно. Інформаційні технології забезпечують перехід від рутинних методів та засобів роботи з інформацією до промислових. Продуктом ІТ є інформація – один із самих дорогих видів ресурсів у теперішній час, а метою – отримання потрібної інформації необхідної якості у якомога коротший час та з найменшими затратами. Основу сучасних ІТ складають: комп'ютерна обробка інформації за заданими алгоритмами, зберігання великих об’ємів інформації на машинних носіях та передача інформації на будь-яку відстань за обмежений час. Інформаційні технології – це способи перетворення інформації, а інформаційні системи – середовище, у якому вони реалізуються. Інформаційну систему можна розглядати як систему управління, де об’єктом управління є процес виробництва інформації. Таким чином під інформаційною технологією будемо розумітисукупність методів і засобів отримання, обробки, представлення інформації, спрямованих на зміну її стану, властивостей, форми, змісту, які здійснюються в інтересах користувачів. Можливості конкретних ІТ найбільш повно реалізуються тільки тоді, коли вони взаємозв’язані з іншими інформаційними технологіями, об’єднані в мережі або системи. Тому відбувся закономірний розвиток ІТ в інформаційні технології та системи (ІТ/С), які представляють собою єдність апаратного, програмного, алгоритмічного забезпечення та мережі підтримки, направлену на досягнення певної мети.

Серед різноманітних інформаційних технологічних процесів, на яких ґрунтується будь-яка інформаційна технологія, виділяють базові інформаційні процеси, притаманні кожній ІТ. До таких процесів відносять процеси збирання, попередньої обробки та відбору даних, аналізу даних, транспортування, обробки, зберігання, накопичення та представлення інформації користувачу у довільних формах. Дані є основою інформаційних технологій та систем. Вони повинні бути організовані в бази даних з метою адекватного відображення об’єктивної реальності та задоволення інформаційних потреб користувачів. Інформаційна система вимагає створення в пам'яті ЕОМ динамічно оновлюваної моделі певної предметної області зовнішнього світу з використанням єдиного сховища - бази даних.

Новим етапом розвитку інформаційних технологій та систем стала розробка концепції та технології Глобальної інформаційної інфраструктури(Global Information Infrastructure – GII), яка почала формуватися групою розвинутих країн у 1995 р., як загальносвітова інформаційна мережа масового обслуговування населення у вигляді глобального інтегрованого середовища телекомунікаційних та інформаційних сервісів (послуг). Інформаційне утворення GII створювалось на принципах концепції відкритих систем і комплексній стандартизації базових мережевих технологій та способів їх безшовної інтеграції. Найважливішими властивостями технології GII стали основні властивості відкритих систем, внаслідок високого ступеня їх відповідності міжнародним стандартам або гармонізованим на міжнародному рівні специфікаціям. Під терміном «відкрита система» стосовно реально існуючих біологічних та соціальних систем розуміють системи, які знаходяться в певному стані за рахунок постійного обміну речовиною, енергією та інформацією з оточуючим середовищем. В галузі інформаційних технологій «відкритою» вважають систему, яка володіє властивостями відкритості та доступна для взаємодії з іншими системами відповідно до прийнятих стандартів. Основними з цих властивостей є: мобільність користувачів та прикладного програмного забезпечення; можливість сумісної роботи з іншими системами на локальних та віддалених платформах (інтероперабельність); здатність до масштабування. Яскравим прикладом відкритої системи є глобальна комп’ютерна мережа Internet, яка об’єднує різноманітні апаратно-програмні платформи, різне комунікаційне обладнання та програмне забезпечення інформаційно-обчислювальних мереж усього світу. Ідеологію відкритих систем реалізують у своїх розробках усі провідні фірми – постачальники засобів обчислювальної техніки та передачі інформації, програмного забезпечення та розробки прикладних інформаційних систем.

Переміщення інформації між комп’ютерами різних систем є надзвичайно складною задачею. Основною архітектурною моделлю для реалізації цих задач стала еталонна модель взаємодії відкритих систем (Open System Interconnection – OSI), яка була розроблена у тісному співробітництві Міжнародної Організації по Стандартизації (ISO) та Міжнародного Консультативного Комітету з Телеграфії та Телефонії (МККТТ) та описана в рекомендаціях Х.200 (МККТТ) та ISO 7498 (МОС). Термін «взаємодія відкритих систем» відноситься до процедур передачі даних між системами, відкритість яких одна для одної досягається завдяки стандартизації їх поведінки. У відповідності з цією концепцією інформаційно-обчислювальне середовище представляється у вигляді ієрархічної багаторівневої відкритої системи, на кожному рівні якої вирішується чітко визначене коло задач. Специфіка та ефективність роботи інформаційно-обчислювального середовища значною мірою визначаються протоколами організації інформаційного обміну між об’єктами одного і того ж рівня та інтерфейсами між об’єктами сусідніх рівнів.

Стандартизація апаратних та програмних інтерфейсів на базі концепції архітектури відкритих систем зробила можливим створення систем розподіленої обробки даних, основними ознаками яких стали: доступ користувачів до віддалених ресурсів, забезпечення можливості їх сумісного використання та децентралізована обробка даних. Інформаційно-обчислювальна мережа (ІОМ) почала розглядатись як середовище розподіленої обробки даних та формуватись для забезпечення ефективного надання різних інформаційно-обчислювальних послуг її користувачам за допомогою організації зручного і надійного доступу до ресурсів, розподілених в цій мережі. Підвищення ефективності застосування комп’ютерів при об’єднанні у ІОМ досягалось за рахунок сумісного використання програмних та апаратних засобів компонентів мережі, надання доступу до даних всім її користувачам, незалежно від їх фізичного розташування та віддаленості від ресурсу. Об’єднання у мережу забезпечувало суттєве зростання надійності роботи внаслідок наявності альтернативних джерел інформації.

Потреба у великих інформаційно-обчислювальних ресурсах, що динамічно виділяються для вирішення складних науково-математичних та обчислювальних задач, трудомістких задач з обробки даних привела до створення технології мережевих розподілених обчислень та виникнення грід-систем. Грід (grid — решітка, мережа) з точки зору мережевої організації представляє собою відкрите, стандартизоване інформаційно-обчислювальне середовище, яке забезпечує надійний, гнучкий та уніфікований доступ до географічно розподілених інформаційно-обчислювальних ресурсів та сховищ даних. З точки зору користувача на час виконання задачі чи проекту грід-система представляє собою віртуальний «суперкомп’ютер» з потужністю та можливостями глобального кластеру, який об’єднує окремі комп’ютери, робочі станції, кластери, комп’ютерні центри, що належать різним людям, організаціям, установам та закладам, розташованим в різних точках світу. У той же час комп’ютер користувача також може бути включений у склад цього глобального кластеру для виконання задач інших користувачів.

Подальшим розвитком технологій розподіленої обробки даних стали хмарні технології – розподілена обробка даних (хмарна обробка даних – cloud computing) з допомогою «розпорошених» по різних місцях обчислювальних ресурсів, які у той же час являються єдиною обчислювальною структурою. Це мережева технологія, яка з метою задоволення потреб користувачів, надає їм у вигляді Інтернет-сервісів додаткові комп’ютерні ресурси і потужності (це можуть бути як стаціонарні комп’ютерні системи так і ноутбуки, планшети, смартфони і т.п.), програмне забезпечення, сховища даних на декількох серверах та різноманітні послуги. За умови нерівномірності запитів Інтернет-ресурсів зі сторони користувачів, створюються так звані «віртуальні сервери», які приймають участь у перерозподілі навантаження на систему. Перевага зазначеної технології у порівнянні з іншими полягає у тому, що користувачі не повинні піклуватися про обчислювальну потужність, інфраструктуру, операційну систему та програмне забезпечення власного термінала чи системи.

Світ стрімко змінюється перетворюючись у світ електронного бізнесу, електронної комерції, нової економіки та управління, у світ, рухомий інформаційними технологіями, які можуть змінити не тільки якість та зміст життя людини, а трансформувати сам спосіб його буття, відкриваючи з допомогою технологій віртуальної реальності та інтелектуальних технологій необмежені можливості для самого широкого спектру діяльності – творчості, роботи, спілкування, розваг, мандрівок тощо. Віртуальна реальність – це штучний («віртуальний») світ людини, який вона відчуває, не знаходячись у ньому фізично. Це інформаційна технологія, яка з допомогою комплексних мультимедійних систем створює у людини ілюзію перебування в реальному часі у штучно створеному світі , в якому вона може здійснювати те, що недоступно їй в об’єктивній реальності.

Технології мультимедіа вважаються одними з найперспективніших інформаційних технологій.Вони реалізуються з допомогою комплексу апаратно-програмних засобів, які дають змогу користувачу працювати в інтерактивному режимі з різнорідними даними – текстом, звуком, мовою, графікою, фото, відеозображенням, анімацією в єдиному інформаційному (мультимедійному) середовищі. Під мультимедійним середовищем розуміється штучна інформаційна природа з її альтернативною реальністю – віртуальним світом, який представляє собою абсолютний інтерфейс людини та комп’ютера з використанням усіх систем її взаємодії із зовнішнім світом (зорових, слухових, тактильних, гравітаційних і т. п.) та інтенсивністю потоку інформації через нього, що поступово наближається до рівня сприйняття наших органів чуття. Комунікаційним каналом людини із найбільшою пропускною здатністю є зоровий канал, у той же час швидкість передачі даних через відеоканал віртуальної реальності уже сьогодні досягає 1 Гб/сек. Вже існують пристрої, які дозволяють за допомогою лазерного променя малої потужності проектувати безпосередньо на сітківку ока зображення, кутові розміри якого практично не відрізняються від максимального кута зору людини. На базі голографічної технології розробляються накопичувачі з великою питомою ємністю та високою швидкістю читання/запис. Створений спеціальний шлем, який дозволяє отримати покращене сприйняття об’ємного (стереофонічного) звучання та стереоскопічного зображення. Спеціальні датчики відслідковують поворот голови людини, відтворюючи перед його очима на міні дисплеях ту відеоінформацію, яку він повинен побачити, повертаючи голову.

Однак формування віртуальної реальності потребує не лише вдосконалення можливостей технічних засобів, а вимагає створення інтелектуальних систем управління, розробки складного програмного забезпечення на базі вивчення властивостей рецепторного та рефлекторного апаратів людини, законів психології сприйняття різноманітних образів. Необхідно, щоб модель, яка відображає якусь фізичну реальність, була динамічно настроюваною на її зміну, що потребує цілого комплексу програмно-апаратних засобів та систем (різноманітних давачів, систем оптичного спостереження, локації, телекомунікації) для відслідковування цих змін, передачі та введення їх в комп’ютер. Ведуться роботи з впровадження в системи мультимедіа елементів штучного інтелекту, які надають їм здатність «відчувати» середовище спілкування, адаптуватися до нього і оптимізувати процес спілкування з користувачем. На стадії наукових досліджень та розробки експериментальних прототипів знаходяться роботи щодо створення інтерфейсу «мозок-комп’ютер».

Мультимедійні технології є найбільш ефективною формою представлення інформації в середовищі інформаційних технологій. Вони суттєво підвищують ефективність сприйняття інформації, дозволяють працювати з величезними, різноманітними та розрізненими масивами даних, дають можливість зібрати і опрацьовувати їх разом, зберігати на одному носієві та вибирати в інтерактивному режимі потрібні інформаційні блоки. Поява мультимедіа дала поштовх до переходу від лінійних аналогових форм до цифрових нелінійних структур завдяки гіпертексту – структурованому тексту, перехід від одного фрагменту якого до іншого здійснюється за допомогою посилань у певних його точках та гіпермедіа – гіпертексту з посиланнями на «нетекстові» фрагменти інформації (графіку, відео тощо). Мультимедіа та гіпертекстові технології стали базою створення геоінформаційних технологій та систем, призначених для впровадження в практику методів та засобів роботи з просторово-часовими даними, представленими у вигляді електронних карт та предметно-орієнтованих середовищ обробки різнорідної інформації для різних категорій користувачів, доступу до будь-яких світових сховищ інформації. Основною проблемою при реалізації ГІС є складність формалізації конкретної предметної області та її відображення на електронній карті.

Масштабні процеси інформатизації людської діяльності ведуть до якісних змін самого суспільства, основою існування якого стають знання. Вони перетворюються у найбільш значущий фактор виробництва, оскільки забезпечують найвищу віддачу від інвестицій. Знання – це виражена певною мовою відношень особлива форма інформації, яка представляє собою сукупність структурованих даних, фактів, положень, закономірностей, відношень, принципів, зв’язків, законів та евристичних правил, щодо предметної області, отриманих в результаті практичної діяльності та професійного досвіду, представлених в різноманітній формі та зв’язаних синтаксичними, семантичними та прагматичними відношеннями. Експоненціальний ріст обсягів різноманітних даних, підвищення вимог до швидкості їх обробки та аналізу з метою забезпечення можливості оперативного та своєчасного прийняття управлінських рішень вимагає переходу до роботи із знаннями на основі штучного інтелекту. Одним з найбільш ефективних підходів до вирішення цієї проблеми є інтелектуалізація інформаційних технологій та створення інтелектуальних систем, основна відмінність яких від інформаційних полягає в наявності механізму системної обробки знань, здатності до «спілкування», «розуміння» та «навчання». Сучасна інтелектуальна інформаційна система повинна представляти собою набір інформаційних технологій для роботи з даними та інформацією, доступу до знань, управління запасами знань та набуття нових знань.

В. Павлиш

 

Розділ 1
ІНФОРМАЦІЯ, СИГНАЛИ ТА ДАНІ

Поняття, форми представлення та атрибути інформації

Термін «інформація» походить від латинського слова «informatio» - пояснення, повідомлення, інформування. З цим поняттям зустрічаємось щоденно. Воно використовується в усіх без винятку сферах діяльності, однак, строгого, чіткого та загальновизнаного його визначення досі не існує. Під поняттям «інформація» часто розуміють сукупність відомостей про навколишній світ, стан якої-небудь матеріальної системи (об’єкта, явища, події, процесу тощо), які призначені для передачі, розподілу, перетворення, зберігання або безпосереднього використання.

В основі інформації лежить взаємозалежність пари об’єктів – джерела і споживача інформації [40]. Джерелами інформації, насамперед, є природні об’єкти: люди, тварини, рослини, планети та ін. Разом з тим у міру розвитку науки і техніки джерелами інформації стають наукові експерименти, машини, апарати, технологічні процеси. Споживачами інформації є люди, тварини, рослини, різноманітні технологічні пристрої тощо.

Усю різноманітність оточуючої нас інформації можна згрупувати за різними ознаками [16]:

· за ознакою «область виникнення» розрізняють інформацію, яка відображає процеси та явища неживої природи – елементарна або механічна,процеси тваринного та рослинного світу – біологічна, людського суспільства – соціальна (економічна, політична, науково-технічна тощо).

Економічна інформація є однією із найбільш важливих різновидностей інформації. Вона представляє собою сукупність відомостей, які відображають соціально-економічні процеси і служать для управління цими процесами і колективами людей у виробничій і невиробничій сферах;

· за ознакою, пов’язаною із способами сприйняття та передачі інформації розрізняють інформацію, яка передається та сприймається видимими образами та символами – візуальна, звуками – аудіальна, відчуттями – тактильна, запахами та смаками – органолептична, засобами обчислювальної техніки – машинна;

· за суспільним призначенням розрізняють інформацію призначену для конкретної особи – особиста, для будь-якого користувача – масова, для вузького кола осіб, які займаються вирішенням складних спеціальних задач в галузі науки, економіки, в органах внутрішніх справ тощо – спеціальна.

Інформація може бути умовною і безумовною (об’єктивною) [40]. Безумовною є інформація про реальні процеси, події, явища. Вона не виникає випадково, її одержують при вивченні природи, навколишньої дійсності. Наукова творчість у цілому містить два елементи: рецепцію (одержання) безумовної інформації від природи і генерацію умовної (теоретичної) інформації. Успіх останньої залежить від того, якою мірою обраний алгоритм опису вже прийнятий у суспільстві. Алгоритм опису кола явищ містить дві частини: математичний апарат і ряд фізичних положень (постулатів або гіпотез), тобто представляє собою не що інше, як математичну модель кола явищ. Ця модель повинна з певною точністю описувати всі наявні дані та мати прогнозуючі можливості. Як правило, можна запропонувати декілька моделей, що задовольняють цим умовам і відрізняються вибором математичного апарату. Вибір варіанта моделі – це генерація умовної інформації. Прикладом умовної інформації може бути код, яким користуються, щоб зашифрувати повідомлення, а безумовної (об’єктивної), наприклад, інформація про те, що однойменні електричні заряди відштовхуються.

Поняття об’єктивності інформації є відносним, оскільки методи її отримання є суб’єктивними. Більш об’єктивною прийнято вважати інформацію, в яку методи вносять менший суб’єктивний елемент.

Інформація про будь-який матеріальний об’єкт може бути одержана шляхом спостереження, натурного або обчислювального експерименту, а також на основі логічного висновку. Тому говорять про апріорну (до проведення експерименту) та апостеріорну (отриману за результатами експерименту) інформацію.

Існує багато визначень інформації, однак найбільш поширеними концепціями, кожна з яких по-своєму пояснює її сутність, є такі [16]:

· концепція, яка визначає інформацію як міру невизначеності системи – під інформацією розуміють усі ті відомості, які зменшують степінь невизначеності наших знань про конкретний об’єкт, систему (концепція К. Шеннона - чим більш ймовірним є повідомлення, тим менше інформації міститься в ньому). Цей підхід, не зважаючи на те, що він не враховує змістовну сторону інформації, став основою для її кількісної оцінки та оптимального кодування повідомлень;

· концепція, яка розглядає інформацію як властивість (атрибут) матерії та базується на твердженні, що інформацію містять будь-які повідомлення, які сприймаються людиною або приладами. Поява цієї концепції пов’язана з розвитком кібернетики і найбільш яскраво відображена академіком В.Глушковим, який писав, що «інформацію несуть не лише поцятковані буквами листи книги або людська мова, але і сонячне проміння, зморшки гірського хребта, шум водоспаду, шелест трави»;

· концепція, яка базується на логіко-семантичному (смисловому) підході, при якому інформація трактується як діюча, корисна, «працююча» частина знань, яка використовується для орієнтації, активних дій, управління та самоуправління.

Розглянуті підходи в певній мірі доповнюють один одного, висвітлюють різні сторони сутності поняття інформації.

Відсутність необхідної інформації, використання неточних або недостовірних даних можуть привести до серйозних економічних прорахунків. Тому найбільш змістовним визначенням інформації є твердження, приведене в [40]: інформація – вибір одного варіанта (або декількох) із багатьох можливих і рівноправних (тобто усі варіанти, із яких робиться вибір, належать одній множині). Розглянуто три основних варіанти вказаного вибору: якщо вибір підказаний (або вказаний), то мова йде про одержання (рецепцію) інформації; якщо вибір зроблений самостійно і випадково, то говорять про виникнення інформації; і, нарешті, якщо вибір однозначно визначений ситуацією або попередніми подіями( тобто вибору, по суті, немає), то про інформацію взагалі говорити не доводиться.

Основними формами представлення інформації є символьна, текстова і графічна [40]:

· символьна форма є найбільш простою і застосовується для передачі нескладних сигналів про різні події. Вона базується на використанні символів – літер, цифр, знаків і т. д.;

· текстова форма тежбазується на використанні символів – літер, цифр, математичних знаків. Однак, інформація закладена не тільки у цих символах, але й у їхньому сполученні, порядку проходження;

· графічна форма є найбільш місткою і складною. Образи природи, фотографії, креслення, схеми, малюнки мають велике значення в нашому житті і містять величезну кількість інформації.

Інформація виражена певною мовою у вигляді однієї із форм її представлення або їх комбінацій і призначена для передачі від джерела інформації до її одержувача з доп омогою сигналів різної фізичної природи стає повідомленням. Повідомлення є формою передачі інформації і може бути записане на матеріальному носії.

Інформація не має ні хімічних, ні фізичних властивостей, однак, для її існування обов’язкова наявність якогось матеріального об’єкта, який передає або зберігає інформацію.Властивості інформації тісно зв’язані з властивостями її носіїв. Кожний з них можна характеризувати такими параметрами як роздільна здатність(кількість даних, записаних у прийнятій для носія одиниці виміру) тадинамічним діапазоном (логарифмічним відношенням інтенсивності амплітуд максимального та мінімального сигналів, які реєструються). Від цих властивостей носія нерідко залежать такі властивості інформації, як повнота, доступність та достовірність.

Для інформації характерними є атрибути [29], класифікація яких наведена на рис.1.1.

Р

Рис. 1.1. Атрибути інформації

Матеріальний носій інформації– це природне або штучне середовище в якому зафіксована інформація (наприклад, світлові, електричні, звукові сигнали, нейрони мозку, папір, магнітна стрічка, магнітні та оптичні диски тощо). При відображенні на носії інформація кодується, тобто їй у відповідність ставиться певна форма, структура та інші параметри носія. Однак, спостерігається відносна незалежність інформації від носія, оскільки можливі її перетворення і передача по різних фізичних середовищах з допомогою різних фізичних сигналів незалежно від її змісту.

Джерело інформаціїце матеріальний об’єкт або суб’єкт інформації здатний накопичувати, зберігати перетворювати та видавати інформацію у вигляді повідомлень або сигналів різної фізичної природи. Він є виробником інформаційних символів.

Джерело інформації без пам’яті – це спеціальний тип джерела, де ймовірність символу, який виробляється, не залежить від будь-якого із попередніх символів [43]. Якщо ймовірність кожного символу незмінна в часі, то кажуть, що джерело стаціонарне. У строчці символів, вироблених таким джерелом - S1S2S3∙∙∙Sn, усі символи належать одному і тому ж розподілу ймовірностей. Набір допустимих символів називається алфавітом. Якщо існує деяка залежність від попередніх результатів, то кажуть, що джерело має пам'ять. Більшість реальних джерел мають пам'ять. Кожна буква англійського алфавіту – це символ, але тільки деякі групи символів створюють правильні (допустимі) комбінації виходів джерела з пам’яттю, тобто формують різні повідомлення. Якщо деякі із можливих комбінацій символів не формують правильних повідомлень, то кажуть, що вони надлишкові.

Одержувач інформаціїце матеріальний об’єкт чи суб’єкт, який сприймає інформацію в усіх формах її проявлення з метою подальшої її обробки та використання.

Канал зв’язкуце частина комунікаційної системи, яка зв’язує між собою джерело та одержувача інформації і призначена для транспортування повідомлень.

Канали можуть бути безшумними та шумливими. У безшумному каналі вихідний сигнал еквівалентний вхідному, причому існує взаємно однозначне відображення вихідного сигналу у вхідний, не зважаючи на його можливе перетворення. У шумливому каналі до інформаційного сигналу додається шумовий сигнал. Їх сукупність утворює вихідний сигнал.