Хранилища данных

Используются хранилища данных различного масштаба — от локальных решений на уровне подразделения предприятия до полифункциональных интегрированных систем управления эффективностью бизнеса (Business Performance Management, ВРМ). В результате непрерывного увеличения объемов хранимых данных разработчики вынуждены применять новые эффективные технологии хранения. Одной из них является интеллектуальная обработка структурированных и неструктурированных данных и разнесение их с учетом востребованности. Установлено, что до 80% данных являются маловостребованными или востребованными единожды. Для их хранения и обработки не требуется быстродействующих устройств, они, например, могут размещаться на ленточных носителях информации.

Хранилища данных (ХД) или витрин данных для конкретных подразделений содержат узкий набор данных и пять-шесть показателей для решения аналитических задач одного подразделения. Например, это могут быть только данные по клиентам для менеджеров по продажам или показатели управленческого баланса для финансовой службы. Такой способ храпения данных позволяет более быстро и просто предоставлять конечным бизнес-пользователям необходимую информацию, однако нельзя согласовывать данные в витринах для разных подразделений.

Централизованные хранилища данных охватывают задачи анализа и управления всех подразделений организации. В этом случае предполагается, что пользователи работают с единым источником информации, в котором структурированы и консолидированы данные из корпоративных учетных систем. Технология решает проблему несогласованности данных, используемых различными подразделениями, по положительный эффект для бизнеса от масштабного и дорогостоящего проекта может быть получен только при его правильной организации.

Отраслевая специализация ПО обеспечивает сокращение сроков и снижение издержек внедрения, а исходная прозрачность бизнес-модели системы повышает вероятность успеха проекта. Один из главных плюсов такого подхода состоит в том, что допустимо поэтапное внедрение бизнес-модели системы, которая поддерживает целый ряд управленческих методик. Таким образом, заказчик может начинать с решения приоритетных задач, постепенно инвестируя в развитие системы. Пользователи банковского ПО считают, что польза от хранилища данных проявляется лишь тогда, когда оно помогает решить одну или несколько прикладных задач, актуальных для банка. Следовательно, такое хранилище должно работать в интересах бизнес-подразделений и поддерживать реализацию бизнес-стратегии банка. Наиболее востребованной является цепочка реализуемых при использовании хранилища данных функций: "хранение — обработка — анализ".

Обработка данных предполагает вычисление расчетных показателей с использованием специализированных процедур классификации и трансформации данных, аллокаций, корректировок и др. Системы, реализующие эти бизнес-функции на основе ХД, относятся к классу ВРМ. Они обеспечивают автоматизацию целого ряда технологий управления. В качестве необходимой функциональности ВРМ-пакетов выделяется следующий состав приложений: планирование или прогнозирование и бюджетирование, управление доходностью, финансовая и обязательная отчетность, финансовая консолидация.

В зависимости от деления организаций на предприятия малого, среднего и крупного бизнеса различается и их ИТ-инфраструктура.

Инновационные решения для систем хранения данных

К инновационным решениям для систем хранения данных относится Dell Compellent, основанное на активном интеллектуальном управлении данными. В нем сочетаются архитектура Fluid Data, виртуализация хранения, интеллектуальное ПО и модульная структура оборудования. Архитектура Fluid Data обладает встроенными интеллектуальными функциями для динамического "перетекания" корпоративных данных между разными уровнями хранения.

Управление осуществляется па уровне блоков. Конкретная информация о каждом из блоков собирается в процессе работы с ним и используется для динамического хранения, миграции и восстановления данных. Она содержит сведения о типе хранимых данных, а также об используемых для их размещения дисках (уровень RAID 0), о времени записи и частоте обращения к данным.

Известно, что до 80% информации предприятия используется редко или даже один раз. Такие сведения могут быть размещены на нескоростных устройствах хранения, например на ленточных накопителях. Наиболее востребованная и часто используемая информация копируется на твердотельные диски с высокой скоростью чтения/записи.

Управление данными на уровне блоков позволяет Dell Compеllеnt использовать для хранения виртуальные диски. Создастся гибкий пул хранения для всех серверов. Они "видят" ресурсы хранения как доступную емкость памяти с указанием типов дисков и уровня хранения, как это показано в табл. 3.1.

Таблица 3.1. Гибкий пул хранения ресурсов

Обработка нескольких запросов ввода-вывода осуществляется параллельно, так как операции чтения/записи распределены по всем дискам. Это повышает скорость обработки. Использование технологии Thin Provisioning оптимизирует применение дисковой памяти. При этом не требуется располагать на одном диске одно приложение, разрешается размещать их по нескольку и оперативно работать с ними. Такое решение экономит дисковое пространство.

Приложение Automated Tierd Storage динамически классифицирует данные и перемещает их на соответствующий уровень храпения RAID. Мгновенные снимки обеспечивают защиту данных и их быстрое восстановление, а технология Thin Replication позволяет осуществлять репликацию данных на удаленные площадки. И благодаря унифицированному пользовательскому интерфейсу упрощается управление.

Такая технология хранения корпоративных данных реализована семейством систем хранения Dell EqualLogic PS 6010. Входящие в него решения отличаются повышенным уровнем производительности благодаря интеграции с контроллером 10GB Ethernet (10GBE) и лучшей системой хранения данных для виртуальных серверов вследствие интеграции с технологиями V M ware и Hyper V. Кроме того, обеспечивается управление предприятием с помощью SAN Head Quarters v.2 — инструмента мониторинга событий. А после того как это семейство систем хранения объединилось с сетями SAN, оно приобрело более высокую производительность, надежность, интеллектуальную автоматизацию и полную виртуализацию.

Сети хранения данных

Сеть хранения данных (СХД), или SAN (Storage Area Network), является высокопроизводительной, высокоскоростной (1, 2,4,8,10,16 и 20 Гбит/с) коммутируемой сетью передачи данных. Она объединяет серверы предприятия и территориально разнесенные хранилища данных — дисковые массивы, ленточные библиотеки, оптические накопители. При лом ОС определяет ресурсы как локальные. Архитектура сети может быть различной:

- "точка-точка" (Fiber Canal, Point-to-point, FC-P2P), когда два устройства непосредственно соединяются друг с другом;

— циклические схемы (Arbitrated loop, FC-AL), когда используется интерфейс стандарта FC-AL для волоконно-оптических каналов с кольцевой топологией. Такая архитектура подобна архитектуре "замкнутое кольцо" (token ring) в технологии Ethernet. В ней выход из строя, а также добавление или удаление компонентов сети вызывают разрыв цикла. Пример циклической схемы показан на рис. 3.3;

- коммутируемая связная архитектура (Switched fabric, FC-SW) подобна топологии "звезда" в технологии Ethernet. Все устройства подключаются к FC-коммутатору. В результате информационные потоки между двумя портами проходят только через коммутатор, а не передаются в какой-либо другой порт. На рис. 3.4 показан SAN-коммутатор, к которому подключаются коммутируемые узлы схемы.

Рис. 3.3. Циклическая топология но технологии FC-AL

Рис. 3.4. Подключение узлов схемы к коммутатору

Для связи между серверами и устройствами хранения данных на уровне шинной топологии большинство сетей хранения данных используют протокол SCSI. А поскольку он не предназначен для формирования сетевых пакетов, в сетях хранения данных применяются низкоуровневые протоколы iSCSI и Fibre Channel Protocol (FCP). Протокол FCP реализует транспорт данных но протоколу SCSI через Fibre Channel, a iSCSI — по протоколу SCSI через

TCP/IP. Соединение по протоколу Fibre Channel обеспечивает обмен данными между элементами сети на расстояниях от нескольких метров до сотен километров. Сеть хранения данных позволяет:

• с высокой скоростью надежно передавать данные от серверов к устройствам хранения, находящимся на большом расстоянии от них, с минимальным снижением производительности;

• удаленно хранить данные, что повышает надежность системы, скорость резервного копирования и восстановления информации с заранее созданной резервной копии;

• подключать к системе новые серверы и дисковые RAID-массивы без остановки и прерывания работы системы;

• обеспечивать совместную работу используемых и вновь приобретенных систем хранения данных, оперативно изменять масштаб информационной системы;

• централизованно управлять распределенной информационной системой.

Сетевые хранилища данных (Network Attached Storage, NAS) решают близкую задачу. Они предоставляют доступ к хранящимся на их файловой системе данным с помощью сетевой файловой системы NFS, SMB/CIFS или AppleTalk. В настоящее время наблюдается конвергенция технологий SAN и NAS.