ПРОГРАММНЫЕ СРЕДСТВА ИНФОРМАЦИОННОЙ СИСТЕМЫ

ОПЕРАЦИОННЫЕ СИСТЕМЫ

Базовые системы больших машин являются «фирменными»; хотя по внешним интерфейсам они совместимы с другими сред­ствами, их внутренние свойства могут существенно различаться и составляют секрет фирмы. Основа базовых средств - операци­онная система. Администраторы ИС требуют, чтобы операци­онная система имела прежде всего высокую надежность и жизне­способность. По этим качествам эталоном служит ОС MVS фир­мы IBM - базовая для ЭВМ семейства ESA/390. Первым принци­пом, заложенным в MVS при ее создании, является локализация ошибки в минимальном элементе задания и отбрасывание этого задания. Второй принцип организации MVS - возможность вос­становления состояния после сбоев. Эта ОС может воссоздать тысячи нажатий клавиш пользователем на этапе восстановления состояния. Однако для ее использования нужны значительные ресурсы, поэтому в маломощных системах ее свойства реализо­вать в полной мере не удается.

На основе базовой ОС MVS/ESA созданы варианты с мень­шими возможностями, а также ОС для средних машин AIX/390 -полностью 64-разрядная ОС, одна из самых мощных современ­ных версий ОС UNIX. Для их инсталляции нужны меньшие ре­сурсы, они обеспечивают соответственно более низкий уровень качества управления вычислительным комплексом.

Базовой операционной системой средних машин служит ОС UNIX. Именно эта ОС является основной для серверов сред­него уровня и начинает рассматриваться для серверов высше­го уровня и суперсерверов масштаба предприятия. В последнее время на эту роль активно претендует ОС Windows NT компа­нии Microsoft.

Разработка ОС UNIX высокого класса требует больших зат­рат. До недавнего времени в список компаний, занимающихся разработкой ОС UNIX мирового класса, входили AT&T GIS Data General, DEC, HP, IBM, Novell, Santa Cruz Operation, Siemens Nixdorf, SUN Microsystems и некоторые другие. Производители 64-разрядных операционных систем (Digital, Hewlett-Packard, SUN Microsystems и IBM) традиционно разрабатывали свою ОС (Digital UNIX. HP-UX, Solaris и AIX соответственно) как некое­го рода надстройку к собственному RISC-процессору.

Кроме стандартных вариантов ОС UNIX все громче заявляет о себе новая ОС Linux. Она создается изначально бесплатно, и круг ее пользователей стремительно ширится.

Еще пять лет назад мысль о соперничестве между Windows NT и UNIX не возникала. Однако благодаря усилиям Intel в раз­витии микропроцессоров ПК-серверы получили признание на рынке корпоративных систем. Все это укрепляет позиции альян­са Wintel (Windows+Intel), но отнюдь не означает, что будущее за NT, хотя за последние годы ОС Windows NT продемонстриро­вала прочное положение на рынке многопроцессорных серверов младшего класса стоимостью менее 50 тыс. долл. На рынке же высокопроизводительных корпоративных серверов, которые могут оцениваться в 500 тыс. долл. и более, все еще господству­ют UNIX-системы.

Еще одна сфера, способная стать «полем боя», - кластериза­ция, т.е. объединение серверов в группы для повышения произ­водительности и обеспечения высокой отказоустойчивости. Тех­нология кластеризации еще достаточно нова для Windows NT, a UNIX-серверы давно зарекомендовали себя в этой области с луч­шей стороны. Очевидно, что до тех пор, пока крупные компании заинтересованы в высокой производительности, надежности и отказоустойчивости, данный рынок будет принадлежать UNIX-системам.

В качестве ОС для ПК практически безраздельно господству­ет семейство Microsoft Windows в нескольких версиях. Компания Microsoft пытается сформулировать для пользователей более или менее стройную стратегию использования различных версий ее ОС Windows, однако это у нее пока не очень получается. Так, многие пользователи соглашаются с тем, что новая Windows 98 - это ОС для конечных пользователей, a Windows NT - для компа­ний. Однако приложения, созданные в свое время специально для Windows 95, могут не работать в среде Windows NT, полностью 32-разрядной операционной системе, поддерживающей иные форматы файлов, чем ОС серии Windows 95/98. Особенно слож­но оценить, как поведут себя приложения, приобретенные или созданные в прежние годы. Скорее всего Windows 98 заменит Windows 95 на компьютерах конечных пользователей; в платфор­мах серверов компаний ее роль предсказать пока трудно.

При этом задача перед менеджерами ИС достаточно слож­ная, Windows 98 в некоторых аспектах имеет превосходство над NT. К тому же для ОС Windows NT необходимы более «креп­кая» аппаратная база (более мощный процессор, больше опе­ративной памяти и наличие более емких жестких дисков) и более интенсивная техническая поддержка. Это удерживает от перехода на NT, поэтому пользователи могут сохранить Windows 95 или 98. Объявленный выход новой ОС MS Windows 2000 явно задерживается.

СРЕДСТВА РАБОТЫ С ДАННЫМИ

В связи с увеличением масштабов хранения и обработки дан­ных система управления данными становится в ряд центральных ресурсов информационной системы. Формирование структур данных уже давно осуществляется в среде той или иной стандар­тной системы управления базами данных (СУБД). В развитых и масштабных ИС выбор СУБД является задачей примерно той же значимости, что и выбор ОС, а переход системы на другую СУБД может быть столь же трудным.

Идеальных СУБД нет и быть не может: все они имеют как сильные стороны, так и слабые. Крупная база данных создается не на один год, поэтому выбор СУБД серьезными заказчиками осуществляется, как правило, в результате тестирования различ­ных вариантов с учетом характера задач формирования струк­тур и обработки данных, требований защищенности и т.п.

Одной из важнейших характеристик СУБД является модели данных. Теоретически любую информацию можно представить в виде реляционной модели. Эта модель имеет наиболее прора­ботанные математическое основание и стандарты. Кроме того, реляционная модель данных отличается большой гибкостью от­носительно изменения структуры данных. Это. безусловно, наи­более распространенная сейчас модель данных. С другой сторо­ны. существует немало задач, которые более эффективно реша­ются средствами других моделей. В частности, автоматизация новых областей бизнеса уже поставила задачу поддержки объек­тно-ориентированного подхода.

Существует уже достаточно широкий набор объектно-ориен­тированных систем. Одной из основных является Oracle5 компа­нии Oracle. Компания Informix утверждает, что по функциональ­ным возможностям ее Dynamic Server ненамного отличается от Oracle. В свою очередь, Sybase реализует объектно-ориентиро­ванные возможности в своей схеме баз данных, хотя ее Adaptive Server Enterprise предлагает лишь некоторые из функций, имею­щихся в Oracle». Компания IBM обеспечивает те же функциональные возможности в версии своей DB2 и перенесла эту новую вер­сию СУБД и на самый массовый бизнес-компьютер AS/400.

Microsoft SQL Server по уровню объектно-реляционной поддер­жки явно отстает от других ведущих реляционных баз данных. Computer Associates предлагает Jasmine, объектно-ориентирован­ную базу данных, призванную свести на нет противоречия между реляционными данными и объектно-ориентированными прило­жениями.

Непрерывно совершенствуясь, системы хранения данных ста­новятся все более емкими, дешевыми и надежными. Клиенты ста­новятся все более требовательными в отношении, как данных, так и технологий работы с ними. Им нужны средства для доступа к большим объемам данных, а также возможность быстрого поис­ка в сверхбольших объемах данных, содержащих, например, все сведения о деятельности компании за добрый десяток лет. Как следствие, возникла технология хранилищ информации (Data Warehouse), которая представляет собой самостоятельную об­ласть ИТ. В ее основе лежит идея создания централизованной и всеобъемлющей корпоративной базы данных, главное предназ­начение которой - информационное обеспечение систем поддер­жки принятия решений руководителями предприятий.

По замыслу автора идеи создания хранилищ У. Инмона (W. Inmon) [42], такая база данных должна отвечать следующим тре­бованиям.

Во-первых, ориентироваться на предметную область, а не на приложения, которые будут работать с данными.

Во-вто­рых, хранилище должно содержать интегрированную информа­цию, полученную на основе данных из множества источников; необходимо проводить проверки на непротиворечивость, целос­тность и т. д.

В-третьих, база данных хранилища должна быть оптимизирована, прежде всего, для операций поиска и чтения: дан­ные, пройдя обработку и попав однажды в хранилище, остаются там на долгие годы, причем изменения в данных не предполага­ются.

В-четвертых, оборудование, предназначенное для хранения данных, должно иметь высокую надежность.

На основе концепции хранилищ данных строится схема их включения в корпоративную ИС. По одну сторону от хранилищ данных остаются источники информации, в качестве которых обычно выступают стандартные системы оперативной обработ­ки транзакций (On-Line Transaction Processing, OLTP). По дру­гую - приложения-потребители, прежде всего системы оператив­ной аналитической обработки данных (On-Line Analytical processing, OLAP). Потребителями информации являются в ос­новном OLAP-системы. Для оптимизации работы, как хранилищ данных, так и OLAP-систем создаются так называемые витрины (или киоски) данных (Data Marts) - промежуточные базы дан­ных, содержащие выборку из хранилища, создаваемую специаль­но для конкретных приложений. Полно размерная работа в струк­туре хранилища называется Data Mining (разработка данных -по аналогии с разработкой полезных ископаемых).

Функционирование собственно хранилища данных обеспечи­вается на основе достаточно мощных СУБД компаний Oracle, Informix, Sybase, NCR, IBM и др. Реализация хранилищ данных представляет собой достаточно сложную технологию: это есте­ственно, когда приходится оперировать сотнями гигабайтов и терабайтами данных. Они обычно строятся следующим образом. Для сбора и предварительной обработки данных от систем-ис­точников выделяют один или несколько относительно неболь­ших серверов на базе ОС ,UNIX или NT. В качестве главного сер­вера СУБД хранилища используются мощные ПК (менее 3 Гбайт), мощные UNIX-компьютеры (3-25 Гбайт), мейнфреймы (25 - 400 Гбайт) или даже суперЭВМ при объеме данных более 400 Гбайт, которые считаются уже уникально большими. Собственно данные хранятся в избыточных массивах дисковых накопителей RAID, соединенных с сервером СУБД с помощью высокопроиз­водительной шины (SCSI, Fibre Channel, Gigabit Ethernet, ATM). Для реализации витрин данных применяют машины на базе ОС UNIX или NT с собственными массивами накопителей.

Как любая технология, хранилища данных имеют специфи­ческие проблемы создания, эксплуатации, оценки эффективнос­ти, а также согласования с различными задачами и требования­ми. Тем не менее, целесообразность их применения уже не под­вергается сомнению, все владельцы больших и сверхбольших объемов информации создают такие технологии в своих ИС. Так, по оценкам специалистов, к 1999 г. объем хранимых в глобаль­ных сетях данных достиг 1000 петабайт (1 млн. Тбайт). Размер многих крупных хранилищ данных уже измеряется десятками те­рабайт и продолжает непрерывно увеличиваться, за ближайшие три года средний размер хранилищ данных увеличится в 36 раз.