Распределённая обработка данных

Распределённая обработка данных позволяет повысить эффективность удовлетворения изменяющейся информационной потребности и обеспечить гибкость принимаемых решений.

Преимущества:

1) увеличение числа взаимодействующих пользователей

2) снятие пиковых нагрузок

3) обеспечение доступа к вычислительным ресурсам сети

4) обеспечение симметричного обмена данными между удалёнными пользователями

Для доступа к удалённым данным используют сетевую СУБД.

Для использования данных создаётся удалённый запрос.

Удалённый запрос – единичный запрос к одному серверу.

Несколько удалённых запросов к одному серверу объединяются в удалённую транзакцию.

Если отдельные запросы транзакции обрабатываются различными серверами, то транзакция называется распределённой.

Если запрос обрабатывается несколькими серверами, то запрос называется распределённым.

Обработка распределённого запроса поддерживает концепцию распределённой базы данных (т.е. если база данных обрабатывает распределённые запросы, то такая база данных является распределённой).

Существуют разные технологии распределённой обработки данных:

1) технология файл-сервер

2) технология клиент-сервер

В технологии клиент-сервер ввод – вывод к базе основан не на физическом дроблении данных, а на логическом. Клиенту отправляются логически необходимые данные, что ведёт к сокращению трафика сети.

Совмещением технологии реляционных баз данных с гипертекстовой технологией позволило создать распределённые гипертекстовые базы данных.

Гипертекстовые базы данных содержат гипертекстовые документы (которые могут быть представлены в виде текстовых, графических, видео и аудио файлов), что ведёт к созданию распределённой мультимедийной базы данных.

Для распределённых баз данных выделяют следующие проблемы:

1) сложное управление

2) недостаточная производительность

3) слабая защищённость

Информационное хранилище

Информационное хранилище – это автоматизированная система, собирающая данные из внутренних баз предприятий и внешних источников, и позволяет формировать, хранить и эксплуатировать информацию как единое целое.

Отличия реляционных баз данных от информационного хранилища:

1) реляционные базы данных содержат только оперативные данные, а хранилища обеспечивают доступ как ко внутренним, так и ко внешним источникам данных

2) модели данных реляционных баз данных ориентированы на предметные и функциональные приложения ИС, и обеспечивают запросы оперативных данных предприятия, а информационные хранилища поддерживают большое число моделей данных, включая многомерные и ER-модели

3) Данные информационных хранилищ хранятся не только на сервере, но и на вторичных устройствах хранения

Для доступа и размещения данных в хранилище можно выделить HSM (Hierarchical Storage Management) и DM (Data Migration) системы.

HSM реализует функции иерархического хранилища.

DM реализует миграцию данных.

HSM-система является дополнением дискового пространства файлового сервера на вторичных устройствах.

При конфигурации HSM указывается, какая часть пространства сервера отводится для обмена с библиотеками. Как только это пространство становится занятым и требуется подкачка данных, из библиотеки реализуется миграция данных.

Наименее используемые файлы с сервера переносятся в библиотеку-автомат. Освободившееся пространство передаётся буферу, в который из библиотеки перекачиваются требуемые файлы.

Все перемещения выполняются автоматически.

Для хранения данных используются выделенные серверы. Доступ к серверам должен удовлетворять следующим условиям:

1) малая задержка

2) высокая пропускная способность

3) надёжность

4) возможность работы на больших расстояниях

При слиянии и размещении данных в информационное хранилище обеспечивается:

1) предметная ориентация

2) целостность и внутренняя взаимосвязь

3) отсутствие временной привязки

4) упорядоченность во времени

5) неизменяемость

Т.е. данные, погруженные в хранилище, организуют интегрированную целостную структуру, обладающую естественными внутренними связями, имеющие новое свойство и являющиеся основой для построения аналитических систем и систем поддержки принятия решения.

Технологии корпоративных информационных систем (КИС)

КИС – автоматизированная система управления крупными территориально распределёнными предприятиями, имеющими несколько уровней управления, и построенная посредством интегрированных информационных технологий и систем.

Назначение КИС – обеспечить решения внутренних задач управления.

КИС строится на основе автоматизации бизнес-процессов и по принципу подсистем управления.

Разделение на подсистемы происходит на уровне пользователя, а не на уровне хранения и обработки информации.

Автоматизация бизнес-процессов достигается за счёт организации единого хранилища данных, содержащую всю информацию, накопленную компанией в процессе хозяйственной деятельности, что обеспечивает необходимый уровень комплексного обобщения и анализа данных различными подсистемами.