Организация распределенных вычислений

 

В эпоху централизованного использования ЭВМ с пакетной обработкой информации пользователи вычислительной техники предпочитали приобретать компьютеры, на которых можно было бы решать почти все классы их задач. Однако сложность решаемых задач об­ратно пропорциональна их количеству, и это приводило к неэффективному использованию вычислительной мощности ЭВМ при значительных материальных затратах. Нельзя не учи­тывать и тот факт, что доступ к ресурсам компьютеров был затруднен из-за существующей политики централизации вычислительных средств в одном месте.

Принцип централизованной обработки данных не отвечал высоким требованиям к надежности процесса обработки, затруднял развитие систем и не мог обеспе­чить необходимые временные параметры при диалоговой обработке данных в многопользо­вательском режиме. Кратковременный выход из строя центральной ЭВМ приводил к роковым последствиям для системы в целом, так как приходилось дублировать функции центральной ЭВМ, значительно увеличивая затраты на создание и эксплуатацию систем об­работки данных.

Появление персональных компьютеров потребо­вало нового подхода к организации систем обработки данных, к созданию новых информа­ционных технологий. Возникло логически обоснованное требование перехода от использования отдельных ЭВМ в системах централизованной обработки данных к рас­пределенной обработке данных.

Распределенная обработка данных – обработка данных, выполняемая на независимых, но связанных между собой компьютерах, представляющих распределенную систему (рис. 3.5).

 

Рис. 3.5. Система распределенной обработки данных

 

Для реализации распределенной обработки данных были созданы многомашин­ные ассоциации, структура которых разрабатывается по одному из следующих на­правлений:

 многомашинные вычислительные комплексы (МВК);

 компьютерные (вычислительные) сети.

Многомашинный вычислительный комплекс – группа установленных рядом вычислительных машин, объединенных с помощью специальных средств сопряжения и выполняющих совместно единый информационно-вычислительный процесс. Под процессом понимается некоторая последовательность дейст­вий для решения задачи, определяемая программой.

Многомашинные вычислительные комплексы могут быть:

 локальными при условии установки компьютеров в одном помещении, не требу­ющих для взаимосвязи специального оборудования и каналов связи;

 дистанционными, если некоторые компьютеры комплекса установлены на зна­чительном расстоянии от центральной ЭВМ и для передачи данных используются те­лефонные каналы связи.

Пример 1. Три ЭВМ объединены в комплекс для распределения заданий, поступаю­щих на обработку. Одна из них выполняет диспетчерскую функцию и распределяет задания в зависимости от занятости одной из двух других обрабатывающих ЭВМ.

Это локальный многомашинный комплекс.

Пример 2. ЭВМ, осуществляющая сбор данных по некоторому региону, выполняет их предварительную обработку и передает для дальнейшего использования на цент­ральную ЭВМ по телефонному каналу связи.

Это дистанционный многомашинный комплекс.

Сети “клиент/сервер” различаются по характеру распределения функций между серверами, другими словами по типам серверов. При специализации серверов по определенным приложениям имеем сеть распределенных вычислений.

В зависимости от выполняемых функций в иерар­хических сетях различают серверы следующих типов.

Файловый сервер. В этом случае на сервере находятся со­вместно обрабатываемые файлы или (и) совместно исполь­зуемые программы. В этом случае на рабочих станциях находится только небольшая (клиентская) часть программ, требующая незна­чительных ресурсов. Программы, допускающие такой режим работы, называются программами с возможностью инсталля­ции в сети. Требования к мощности сервера и пропускной спо­собности сети при таком способе использования опреде­ляются количеством одновременно работающих рабочих станций и характером используемых программ.

Сервер баз данных. На сервере размещается база данных, которая может пополняться с различ­ных рабочих станций или (и) выдавать информацию по зап­росам с рабочей станции.

Принт-сервер. К компьютеру небольшой мощности под­ключается достаточно производительный принтер, на кото­ром может быть распечатана информация сразу с нескольких рабочих станций. Программное обеспечение организует оче­редь заданий на печать, а также идентифицирует отпечатан­ную информацию специальными страницами (закладками), которые разделяют печатные материалы различных пользо­вателей.

Почтовый сервер. На сервере хранится информация, от­правляемая и получаемая как по локальной сети, так и извне (например, по модему). В любое удобное для него время пользователь мо­жет просмотреть поступившую на его имя информацию или отправить через почтовый сервер свою.

Системы распределенных вычислений появляются, прежде всего, по той причине, что в крупных автоматизированных информационных системах не всегда удается организовать централизованное размещение всех баз данных и СУБД на одном узле сети. Поэтому системы распределенных вычислений тесно связаны с системами управления распределенными базами данных.

Распределенная база данных (РаБД) – это совокупность логически взаимосвязанных баз данных, распределенных в компьютерной сети.

Система управления распределенной базой данных (РаСУБД) – это программная система, которая обеспечивает управление распределенной базой данных и прозрачность ее распределенности для пользователей.