Кластерные суперкомпьютеры и особенности их архитектуры

Существует технология построения больших компьютеров и суперкомпьютеров на базе кластерных решений. По мнению многих специалистов, на смену отдельным, независимым суперкомпьютерам должны прийти группы высокопроизводительных серверов, объединяемых в кластер.

Кластер - это связанный набор полноценных компьютеров, используемый в качестве единого вычислительного ресурса.

Удобство построения кластерных ВС заключается в том, что можно гибко регулировать необходимую производительность системы, подключая к кластеру с помощью специальных аппаратных и программных интерфейсов обычные серийные серверы до тех пор, пока не будет получен суперкомпьютер требуемой мощности. Кластеризация позволяет манипулировать группой серверов как одной системой, упрощая управление и повышая надежность.

Важной особенностью кластеров является обеспечение доступа любого сервера к любому блоку как оперативной, так и дисковой памяти. Эта проблема успешно решается, например, объединением систем SMP-архитектуры на базе автономных серверов для организации общего поля оперативной памяти и использованием дисковых систем RAID для памяти внешней (SMP — Shared Memory multiprocessing, технология мультипроцессирования с разделением памяти).

Для создания кластеров обычно используются либо простые однопроцессорные персональные компьютеры, либо двух- или четырех- процессорные SMP-серверы. При этом не накладывается никаких ограничений на состав и архитектуру узлов. Каждый из узлов может функционировать под управлением своей собственной операционной системы. Чаще всего используются стандартные ОС: Linux, FreeBSD, Solaris, Unix, Windows NT. В тех случаях, когда узлы кластера неоднородны, то говорят о гетерогенных кластерах.

При создании кластеров можно выделить два подхода.

1. Первый подход применяется при создании небольших кластерных систем. В кластер объединяются полнофункциональные компьютеры, которые продолжают работать и как самостоятельные единицы, например, компьютеры учебного класса или рабочие станции лаборатории.

2. Второй подход применяется в тех случаях, когда целенаправленно создается мощный вычислительный ресурс. Тогда системные блоки компьютеров компактно размещаются в специальных стойках, а для управления системой и для запуска задач выделяется один или несколько полнофункциональных компьютеров, называемых хост-компьютерами. В этом случае нет необходимости снабжать компьютеры вычислительных узлов графическими картами, мониторами, дисковыми накопителями и другим периферийным оборудованием, что значительно удешевляет стоимость системы.

Основные достоинства кластерных суперкомпьютерных систем:

· высокая суммарная производительность;

· высокая надежность работы системы;

· наилучшее соотношение производительность/стоимость;

· возможность динамического перераспределения нагрузок между серверами;

· легкая масштабируемость, то есть наращивание вычислительной мощности путем подключения дополнительных серверов;

· удобство управления и контроля работы системы.

Наряду с достоинствами, как и у любой технологии, у кластеризации имеются свои недостатки:

· задержки разработки и принятия общих стандартов;

· большая доля нестандартных и закрытых разработок различных фирм, затрудняющих их совместное использование;

· трудности управления одновременным доступом к файлам;

· сложности с управлением конфигурацией, настройкой, развертыванием, оповещениями серверов о сбоях и т.п.

Практические примеры:

Корпорация IBM в 2005 году представила прототип суперкомпьютера Blue Gene. Blue Gene был установлен в Ливерморскую национальную лабораторию им. Лоуренса. Основные его задачи - моделирование погодных условий и изучение космического пространства.

Blue Gene состоит из 130 тысяч процессоров, и его производительность составляет 360 терафлопс.

Однако разработки суперкомпьютеров не стоят на месте и уже в марте 2014 года было объявлено, что Ливерморская национальная лаборатория (Lawrence Livermore National Laboratory - LLNL) объединяет усилия с двумя другими национальными лабораториями: Окриджской национальной лабораторией (Oak Ridge National Laboratory - ORNL) и Аргоннской национальной лабораторией (Argonne National Laboratory - ANL) для создания суперкомпьютеров следующего поколения. Системы, которые будут проектироваться, должны обладать пиковой производительностю 200 ПФлопс (петафлопс 1015). Ожидается, что такую систему удастся создать в 2017-2018 годах.

 

Список Top500 (http://www.top500.org/) - это список из самых мощных суперкомпьютеров, составляемый учеными университета Мангейма, университета штата Теннесси и Национальной лаборатории Лоуренса в Беркли. Он публикуется дважды в год накануне конференции по суперкомпьютерам и позволяет следить за ростом вычислительной мощности мировой компьютерной элиты.

 

Чипы IBM используются в системе, неформально называемой Big Mac. PowerPC 970, которая состоит из 1100 двухпроцессорных компьютеров Apple G5, с производительностью в 10,3 триллионов операций в секунду.

Процессоры Opteron используются в 2816-процессорном кластере, и его производительность составляет 8 триллионов операций в секунду.

 

Интересен факт, что общая производительность 500 лучших систем растет экспоненциально, увеличиваясь в десять раз примерно каждые четыре года.

В июне 2016 года Ляо Сянкэ, глава школы вычислительной техники Национального университета оборонных технологий Китая, заявил, что к 2020 году они планируют ввести в эксплуатацию новый суперкомпьютер который способен выполнять по меньшей мере миллиард миллиардов операций в секунду. Данный проект был запущен для выполнения 13-го пятилетнего национального плана.

По словам Ляо Сянкэ, новый суперкомпьютер будет называться Tianhe-3. Первый Tianhe был запущен в 2010 году. Его мощность составляла 563 терафлопс при пиковой скорости в 1,2 петафлопс. На момент запуска он стал пятым мощнейшим компьютером в мире. Сегодня Tianhe-1 выполняет самые разнообразные задачи, в том числе занимается поиском нефти, производством высококачественного оборудования, медицинскими исследованиями, созданием анимаций и многим другим. К сожалению, про характеристики Tianhe-3 пока ничего не сообщается.

 

 

Самостоятельная работа

1. Привести примеры вычислительных систем по систематике Флинна (1-2 примера).

2. Привести примеры суперкомпьютеров (2-3) с кратким описанием (5-10 предложений).