Принципи обробки даних з використанням інформаційних систем і технологій?

Інформаційні системи, побудовані на базі комп’ютерних мереж, забезпечують розв’язання ряду задач [Error: Reference source not found]: зберігання даних, обробка даних, організація доступу користувачів до даних, передача даних та результатів обробки даних користувачам. Потреба в даних колективного використання останнім часом все більше зростає. Останнє і привело до підвищеної уваги до різних систем розподіленої обробки даних. В цій галузі використовуються такі поняття як розподілена обробка даних,база даних з мережним доступом,архітектура „клієнт-сервер“,розподілені бази даних.

Під розподіленою обробкою данихрозуміють обробку даних кількома територіально розподіленими комп’ютерами.

Технологія розподіленої обробки даних базується на двох концепціях. Перша концепція називається „файл-сервер“, а друга – „клієнт-сервер“. Сервер, в даному контексті, – це комп’ютер, який забезпечує функціонування тієї частини мережної версії СУБД, яка здійснює управління даними в термінах бази даних і називається сервером файлів або файл-сервером(File Server). Клієнт – задача, робоча станція чи користувач комп’ютерної мережі. В процесі обробки даних клієнт може сформувати запит до серверу для виконання складних процедур, читання файлу, пошуку інформації в БД тощо.

Файл-сервернамодель реалізується наступним чином. В мережі є головний комп’ютер, який називається файловим сервером. Сервер надає в спільне використання інформаційні (фали, бази даних) та апаратні (принтери, модеми) ресурси. Мережна операційна система, яка забезпечує взаємодію користувачів з сервером, складається з двох частин: одна (основна) частина розміщується на файловому сервері, а друга (оболонка) встановлюється на комп’ютерах мережі (робочих станціях). Оболонка забезпечує взаємодію між програмами робочої станції та сервера. Файловий сервер в рамках такої архітектури використовується тільки як сховище даних, а їх обробка здійснюється на комп’ютері користувача.

У клієнт-серверніймоделі сервер використовується не тільки як сховище програм та даних, а й як обчислюване середовище. Програмне забезпечення в розглянутій моделі складається з двох взаємозв’язаних програм: програми-сервера та програми-клієнта. Програма-клієнт формує запит та відправляє серверу (програмі), встановленій на комп’ютері із спільним доступом. Обробка запиту здійснюється на сервері, а клієнту, з використанням відповідного протоколу відображаються результати виконаного запиту. При цьому слід звернути увагу, що сервером тут називають як комп’ютер, так і програмне забезпечення.

Grid-технології. Одним з найперспективніших на даний час методів розподіленої обробки даних є використання grid-технологій. Ці технології базуються на використанні спеціальних комп’ютерних систем, які називаються кластерами. Кластер – це група комп’ютерів, об’єднаних високошвидкісними каналами зв’язку, яка представляє з точки зору користувача єдиний комп’ютер. Один із перших архітекторів кластерної технології Грегорі Пфістер запропонував наступне визначення [¹²¹]: „Кластер – це різновид паралельної чи розподіленої системи, яка складається з кількох зв’язаних між собою комп’ютерів і використовується як єдиний уніфікований комп’ютерний ресурс“.

Суть grid-технологій полягає у прагненні об’єднати усі комп’ютери підприємства чи організації (а в ідеалі – усього світу) в єдину систему (єдиний кластер), що дозволить розподіляти і перерозподіляти ресурси між користувачами у відповідності до їх запитів. Маючи доступ до такого суперкомп’ютера, користувач може в будь-який час і в будь-якому місці запросити стільки обчислювальних ресурсів, скільки йому потрібно для розв’язання своєї задачі. Grid-технології часто порівнюють з єдиними системами електропостачання – така система здатна перерозподіляти потужності, направляючи чи перенаправляючи запити на недовантажені комп’ютери. Крім того, на grid-технології покладаються й задачі інформаційного характеру: зробити усю інформацію підприємства (світу) загальнодоступною. По суті тут мова йде про сміливий, фантастичний розвиток WorldWideWeb.

Потенціал grid-технологій уже сьогодні оцінюється дуже високо: він має стратегічний характер і в найближчій перспективі grid-технології повинні стати обчислювальним інструментарієм для розвитку високих технологій у різноманітних сферах людської діяльності, подібно до того, як таким інструментом стали персональний комп’ютер та Інтернет. Такі високі оцінки можна пояснити здатністю grid-технологій на основі безпечного і надійного віддаленого доступу до ресурсів розподіленої глобальної інфраструктури вирішувати дві проблеми [Error: Reference source not found]:

Створення розподілених обчислювальних систем надвисокої пропускної здатності з обладнання, що випускається серійно при одночасному підвищенні ефективності наявного парку обчислювальної техніки шляхом використання ресурсів, які тимчасово простоюють.
Створення широкомасштабних систем моніторингу, управління, комплексного аналізу та обслуговування із глобально розподіленими джерелами даних, які здатні підтримувати життєдіяльність державних структур, організацій та корпорацій.

З самого початку grid-технології призначалися для розв’язання складних наукових, виробничих та інженерних задач, які неможливо вирішити за прийнятні терміни на окремих обчислювальних установках. По мірі свого розвитку grid-технології почали проникати у промисловість та бізнес, у зв’язку з чим зараз grid-технології претендують на роль універсальної інфраструктури для обробки даних, у якій функціонує велика кількість служб (Grid Services), які дозволяють вирішувати не тільки конкретні прикладні задачі, а й передбачають сервісні послуги: пошук необхідних ресурсів, збір інформації про стан ресурсів, зберігання та доставка даних.

Застосування grid-технологій може привести до нової якості розв’язання наступних класів задач:

масова обробка потоків даних великого об’єму;
багатопараметричний аналіз даних;
моделювання на віддалених суперкомп’ютерах;
реалістична візуалізація великих наборів даних;
складні бізнес-програми з великими об’ємами обчислень.

За принципами grid-технологій зараз інтенсивно розвивається новий метод використання програмного забезпечення, який називаютьхмарними обчисленнями.

Хмарні обчислення (cloud computing) – технологія обробки даних, у якій програмне забезпечення надається користувачу як Інтернет-сервіс [¹²²].

За такої моделі користувач має доступ до власних даних, але не може управляти і не повинен турбуватися про інфраструктуру, операційну систему та, власне, програмне забезпечення, з яким він працює. „Хмарою“ метафорично називають мережу Інтернет, яка приховує усі технічні деталі.

Згідно одного із визначень „Хмарна обробка даних – це парадигма, у рамках якої інформація постійно зберігається на серверах в мережі Інтернет і тимчасово кешується на клієнтській стороні, наприклад, на персональних комп’ютерах, ноутбуках, смартфонах тощо“ [¹²³]. Хмарна обробка даних як концепція включає в себе поняття програмне забезпечення як послуга (Software as a Service – SaaS) та інші технологічні тенденції, спільним в яких є впевненість в тому, що мережа Інтернет у змозі задовольнити потреби користувачів в обробці даних. Яскравим прикладом втілення в життя технології хмарних обчислень є проект Google Apps (http://www.google.com/apps/business/), який надає в користування офісні програми в режимі on-line, доступ до яких здійснюється за допомогою Web-броузера, тоді як програмне забезпечення та дані зберігаються на серверах Google.

Семінар 21