Требования к компьютерной сети

 

Основным требованием к компьютерной сети является вы­полнение сетью того набора услуг, для которого она предна­значена. К таким услугам могут относиться: доступ к файловым архивам; доступ к страницам веб-сайтов; обмен с использованием электронной почты; интерактивный обмен с помощью IР-телефонии; потоковое видео и т.д.

Все остальные требования (а это могут быть: производитель­ность, надежность, совместимость, управляемость, защищен­ность, расширяемость и масштабируемость) связаны с качеством выполнения основной задачи.

Хотя важны все перечисленные требования, в понятие «ка­чество обслуживания» для компью­терной сети часто включают только две важнейшие характери­стики — производительность, надежность и безопасность.

Производительность.К основным характеристикам про­изводительности относятся время реакции; скорость передачи данных; задержка передачи и ее вариация.

Время реакции определяют как интервал времени между возникновением запроса пользователя к какой-либо сетевой службе и получением ответа на этот запрос.

Обычно это время складывается из нескольких составляющих (рис. 7.6):

t1 - время подготовки запроса на пользовательском ком­пьютере;

t2 - время передачи между клиентом и сервером;

t3 - время обработки запроса на сервере;

 

 

Рис. 7.6. Обмен «пользователь-клиент-сервер»

 

Сервер

- t4 - время доставки ответа с сервера на клиентский ком­пьютер;

- t5время обработки ответа на этом компьютере.

С точки зрения работы сети важнейшими составляющими являются t2 и t4, т.е. задержки на передачу по сети.

Скорость передачи данных определяется объемом данных, передаваемых в единицу времени. Используется также понятие пропускной способности — это скорость передачи па­кетов между узлами сети через различные коммуникационные устройства. Скорость передачи измеряется:

- в битах в секунду;

- в пакетах в секунду. Различают три скорости.

1. Средняя скорость. Берется достаточно длительный про­межуток времени (час, сутки) и общий объем переданных дан­ных делится на время.

2. Мгновенная скорость. Для усреднения выбирается очень маленький промежуток времени — например, 10 мс или 1 с.

3. Максимальная скорость. Это максимальная мгновенная скорость, зафиксированная за время наблюдения.

При проектировании сети чаще всего пользуются параметра­ми средней и максимальной скорости.

Иногда оперируют и общей пропускной способностью, рас­сматриваемой как максимальное количество информации, пере­даваемой между всеми узлами сети в единицу времени.

Задерэюка передачи время между моментом поступления данных на вход какого-то сетевого устройства или части сети и моментом появления этих данных на выходе, т.е. tзад = tвых – tвх.

Отличием этого параметра от времени реакции является то, что в tзад никогда не включается время на обработку в конечных узлах сети.

Обычно рассматривают максимальную задержку и вариацию задержки.

Надежность и безопасность.Для обычных технических средств используют такие показатели надежности, как: среднее время наработки на отказ; вероятность отказа;

- интенсивность отказов.

Однако эти характеристики пригодны для оценки только простых устройств, которые могут находиться в двух состоя­ниях — работоспособном и отказа.

Сложные системы из многих элементов могут иметь и про­межуточные состояния. Поэтому для оценки надежности таких сложных систем как сети применяют другой набор характери­стик.

Готовность (или коэффициент готовности), Availability —-доля времени, в течение которого система может быть исполь­зована. Для увеличения коэффициента готовности в состав системы включают резервные элементы.

Сохранность данных (и их защита от искажений).

Согласованность данных (их непротиворечивость). Это требуется, например, когда несколько копий данных хранятся на разных файловых серверах.

Может также применяться параметр вероятность по­тери пакета (например, из-за переполнения буфера маршру­тизатора, отсутствия работоспособного пути в сети, поражения пакета ошибками). Этот параметр может представляться в виде:

- вероятности искажения отдельного бита передаваемых данных;

- отношения числа потерянных пакетов к общему числу передаваемых пакетов.

Безопасность (Security) — способность системы защитить данные от несанкционированного доступа. Сюда относятся защита каналов, защита компьютеров, защита от взлома паро­лей и т.д.

Отказоустойчивость (Fault tolerance) способность системы скрывать от пользователя факт отказа отдельных элементов. Например, если копии данных хранятся на несколь­ких файловых серверах, пользователь может и не заметить факт отказа одного их них. В этом случае говорят о деградации си­стемы, так как при отказе одного сервера увеличивается время доступа к базе данных из-за уменьшения степени распаралле­ливания запросов.

Специфичными для сетей являются параметры расширяемо­сти и масштабируемости.

Расширяемость (Extensibility) — возможность легко до­бавлять в сеть новые элементы (пользователей, компьютеры, приложения, службы), наращивать длину сегментов и заменять аппаратуру более мощной.

Масштабируемость (Scalability) — возможность наращи­вания количества узлов и протяженности связей в сети в очень широких пределах. При этом производительность сети не ухуд­шается.

Часто термины «расширяемость» и «масштабируемость» ис­пользуются как синонимы. Однако, если взять, к примеру, сеть Ethernet, то можно говорить о хорошей расширяемости (коли­чество компьютеров на сегменте можно увеличить до 100), но при этом резко снижается производительность сети, т.е. это указывает на плохую масштабируемость.

Прозрачность (Transparency) сети достигается в том слу­чае, когда для пользователя сеть представляется не как мно­жество компьютеров, связанных сложной системой каналов, а как единая вычислительная машина с системой разделения времени.

Символом прозрачности считают принцип: «Сеть — это ком­пьютер».

Прозрачность может достигаться на двух уровнях — поль­зователя и программиста.

Прозрачность на уровне пользователя для работы в сети используются те же команды и привычные процедуры, что и для работы с локальными ресурсами.

Прозрачность на уровне программиста приложению для доступа к удаленным ресурсам требуются те же вызовы, что и для локальных ресурсов.

Сеть должна скрывать различия операционных систем и компьютеров. Можно одинаково обращаться к ресурсам на компьютере с ОС Macintoch, Windows или Unix. От пользова­теля не требуется знание места расположения ресурса. Ресурсы должны свободно перемещаться с одного компьютера на другой без изменения их имен.

Поддержка разных видов трафика: наряду с традици­онным трафиком передачи данных все увеличивается доля мультимедийного трафика — передаваемых в цифровой форме речи и изображения.

Особенность мультимедийного трафика — это жесткие тре­бования к синхронизации передаваемых данных. При запазды­вании сообщений наблюдаются искажения.

Необходимость передачи мультимедийного трафика требует внесения изменений как в протоколы, так и в оборудование.

В сети в общем случае должны сосуществовать два вида трафика:

- традиционный компьютерный (пульсирующий);

- мультимедийный (синхронный).

Это является сложной задачей и ближе всего к ее решению подошли сети АТМ.

Управляемость — возможность централизованно контро­лировать состояние основных элементов сети, выявлять и устра­нять неисправности, выполнять анализ производительности и планировать развитие сети.

В этой области еще очень много нерешенных проблем. В основном существующие системы не управляют сетью, а лишь осуществляют наблюдение за ее работой.

Совместимость (или интегрируемость) — способность сети включать в себя разнообразное ПО и аппаратное обеспе­чение, т.е. сеть может быть неоднородной или гетерогенной. Еще такие сети называют интегрированными.

В них могут сосуществовать различные ОС, стеки протоко­лов, аппаратные средства и приложения от разных произво­дителей. Основной путь обеспечения совместимости — это ис­пользование открытых стандартов и спецификаций.

Традиционные сети обеспечивают сервис, который получил название «Best effort» — с максимальными усилиями. Это озна­чает, что сеть не дает никаких гарантий на обслуживание, на­пример сети Ethernet, Token Ring, IP, Х25.

При обработке очередей обычно используется алгоритм FIFO, а при переполнении буфера — пакеты отбрасываются.

В настоящее время самый распространенный путь обеспече­ния QoS — это постоянное наращивание пропускной способности сети, т.е. постоянно иметь избыточную пропускную способность. Встроенные механизмы QoS пока применяются только в таких сетях как АТМ и Frame Relay.

Типы QoS.Определяются соответствующими типами.

Сервис Best Effort с максимальными усилиями. Это фак­тически отсутствие QoS. Обслуживание производится без каких-либо гарантий, например, IP-сети и Ethernet с принципом FIFO.

Сервис с предпочтением, (называют также «мягким» сервисом QoS). В этом случае некоторые виды трафика обслу­живаются лучше остальных. Но характеристики обслуживания точно неизвестны — они зависят от характеристик трафика. Например, при высокой интенсивности высокоприоритетного трафика может совсем прекратиться обслуживание трафика с низким приоритетом.

Гарантированный сервис (называется также «жестким» или «истинным» сервисом QoS). Различным типам трафика даются статистические гарантии. Обычно этот тип QoS основан на предварительном резервировании сетевых ресурсов для каж­дого из потоков, получивших гарантии обслуживания. Однако и эти гарантии носят статистический характер. Например, с вероятностью 0,999 задержка пакета не должна превышать 100 мс.

При этом производится контроль интенсивности входных потоков — чтобы это значение не превышало заранее оговорен­ную величину. Такой тип QoS применяется обычно для обслу­живания тех приложений, для которых нужны гарантии про­пускной способности и/или задержек. Например, это может быть трафик видеоконференции или трафик, поступающий от измерительных систем реального времени.

Рассмотрим новые базовые сети и их роль в обеспечении качества обслуживания.

Эти сети являются основой вторичных сетей — компьютерных и телефонных. Как было показано выше, обеспечение QoS за­висит от имеющегося резерва пропускных способностей, т.е. от производительности первичной сети. Без развития первичных сетей невозможен прогресс сетевых технологий.

Такие сети называют также опорными и первичными сетя­ми.

Современные сети основаны на коммутации каналов. Для создания абонентского канала коммутаторы первичных сетей поддерживают один из методов мультиплексирования и ком­мутации.

В настоящее время для мультиплексирования абонентских каналов используют:

технику частотного мультиплексирования — FDM (Frequency Division Multiplexing);

мультиплексирование по длине волны WDM (Wave Division Multiplexing);

мультиплексирование с разделением времени — TDM (Time Division Multiplexing).

Частотное мультиплексирование применяется в основ­ном в телефонных сетях, где речевой телефонный канал имеет спектр 300 — 3 400 Гц (т.е. на его передачу необходима пропускная способность 3 100 Гц). Кабельные же системы между телефонны­ми коммутаторами имеют пропускную способность в сотни мега­герц. Для передачи производится модуляция высокочастотного сигнала низкочастотным. Таким образом, спектр модулированно­го сигнала переносится в другой частотный диапазон. Высоко­частотный сигнал делится на полосы по 4000 Гц (3 100 4~ 900 страховой промежуток) . В сетях на основе РОМ-коммутации принято несколько уровней уплотненных каналов. Это базовая группа (12 абонентских каналов), супергруппа (60 абонентских каналов) и главная группа (600 абонентских каналов), которая имеет полосу пропускания 2520 КГц (564—3084 КГц).

В первичных сетях с мультиплексированием по длине волны (WDM и DWDM) используется тот же принцип частот­ного разделения, но информационным сигналом в них является не электрический ток, а свет. Используется инфракрасный диапазон с длинами волн от 850 до 1 565 нм, что соответствует частотам 196 — 350 ТГц.

В магистральном канале обычно мультиплексируется доста­точно много спектральных каналов: 16, 32, 40, 80 или 160. Если используются 16 и более каналов, то такая техника часто на­зывается плотной, т.е. Dense WDM или DWDM. Внутри спек­трального канала данные могут кодироваться как дискретным, гак и аналоговым способами.

Коммутация каналов на основе разделения времени как уже упоминалось, эта техника носит название «Мультиплек­сирование с разделением времени» (Time Division Multiplexing, TDM). Основой этой технологии являются каналы Т1/Е1, кото­рые были предложены для передачи вызовов между телефонны­ми станциями (АТС). Это дуплексные цифровые каналы.

Для передачи используются две пары витых проводников (по паре в каждую сторону). В 1990-е гг. эти каналы стали очень популярны в качестве средства подключения абонентов (небольших фирм, корпоративных сетей) к сети Internet.

На базе внедренных в телефонии каналов Т1 к настоящему времени сформировались два поколения таких цифровых базо­вых сетей:

- технология плезиохронной цифровой передачи (Plesiochronous Digital hierarchy, PDH). «Плезио» означает «почти», т.е. это почти синхронная передача;

- синхронная цифровая иерархия (Sinchronous Digital Hierarchy, SDH). В США технология SDH называется SONET.

К недостаткам технологии PDH относятся:

- сложность мультиплексирования и демультиплексирования данных. Например, для извлечения одного канала из потока ТЗ надо демультиплексировать канал до Т2, затем — до Т 1, а уже затем демультиплексировать канал Т1;

- отсутствие встроенных средств контроля и управления сетью. Нет и процедур поддержки отказоустойчивости;

- слишком низкие (по понятиям современных сетей) скорости передачи. Иерархия скоростей Е1 заканчивается на 139 Мбит/с, а современные оптоволоконные каналы позволяют передавать со скоростью в десятки гигабит в секунду.

Эти недостатки были устранены в сетях SDH, которые и стали в настоящее время одним из тех типов сетей, который позволяет удовлетворить требования к качеству обслужива­ния.

Технология синхронной цифровой иерархии (Sinchronous Digital Hierarchy, SDH) разработана для создания надежных транспортных каналов, позволяющих гибко формировать циф­ровые каналы в широком диапазоне скоростей — от единиц мегабит в секунду до десятков гигабит в секунду.

Основная область применения — первичные сети операторов связи. Эти сети относятся к классу полу постоянных сетей с коммутацией каналов — формирование канала происходит по инициативе оператора связи. Поэтому чаще всего вместо тер­мина «коммутация» используют термин «кросс-коннект» (cross-connect). Используется мультиплексирование с разделением времени TDM. Информация адресуется путем относительного временного положения внутри составного кадра. Обычно эти сети используют для объединения большого числа более низко­скоростных каналов PDH. На рис. 7.7 приведен пример струк­туры сети SDH.

 

Рис. 7.7. Пример структуры сети 8ВН

 

Достоинствами сетей SDH являются:

гибкая иерархическая система мультиплексирования циф­ровых потоков с различными скоростями. Возможность ввода и вывода пользовательской информации без демультиплекси­рования потока в целом:

- отказоустойчивость сети. Использование резервных марш­рутов и резервного оборудования. Переход на резервный путь обычно требует не более 50 мс;

- мониторинг и управление сетью на основе той информации, которая встроена в заголовки кадров;

- высокое качество транспортного обслуживания для трафи­ка любого вида — голосового, видео и компьютерного. Техника мультиплексирования TDM, лежащая в основе SDH, обеспечи­вает трафику каждого абонента гарантированную пропускную способность, а также низкий и фиксированный уровень задер­жек.

Сети SDH составляют сегодня фундамент практически всех крупных телекоммуникационных сетей — региональных, на­циональных и между народных.

Эти сети легко интегрируются с сетями DWDM, обеспечивая передачу информации по оптическим магистралям со скоростя­ми сотни гигабит в секунду за счет мультиплексирования с разделением по длине волны (рис. 7.8).

В сетях DWDM сети SDH играют роль сетей доступа, т.е. ту же роль, что играют по отношению к ним сети PDH.

К типовым топологиям относятся кольца, линейные цепи и ячеистая топология, близкая к полносвязной.

Вторым типом современных базовых сетей, которые позво­ляют обеспечить поддержку служб, имеющих требуемое каче­ство обслуживания, являются сети DWDM.

Рис. 7.8. Иерархия базовых сетей и сетей доступа

 

Технология плотного волнового (спектрального) мультиплек­сирования SWDM (Dense Wave Division Multiplexing) предна­значена для создания оптических магистралей нового поколения, работающих на мультимегабитных и терабитных скоростях.

Информация в оптическом волокне передается одновременно большим количеством световых волн.

Сети DWDM работают по принципу коммутации каналов — при этом каждая световая волна представляет собой отдельный спектральный канал.

Каждая волна несет свою собственную информацию, при этом оборудование DWDM не занимается непосредственно про­блемами передачи данных на каждой волне, т.е. способом ко­дирования информации и протоколом ее передачи.

Устройства DWDM занимаются только объединением раз­личных волн в одном световом пучке, а также выделением из общего сигнала информации каждого спектрального канала.

Оборудование DWDM позволяет передавать по одному опти­ческому каналу 32 и более волн различной длины в окне про­зрачности 1 550 нм. При этом каждая волна может переносить информацию со скоростью до 10 Гбит/с (при применении про­токолов STM-64 или 10GE). Ведутся работы по повышению этой скорости до 40 80 Гбит/с.

Мультиплексирование DWDM называется «плотным», так как в нем используется существенно меньшее (чем у предше­ствующей технологии WDM) расстояние между длинами волн.

Рис. 7.9. Интервалы между каналами

 

В рекомендации С.692 определен частотный план с разнесени­ем частот на 100 ГГц (Dl = 0,8 нм). Для передачи используется 41 волна: от 1 528 нм (191 ТГц) до 1 560 нм (192 ТГц). Опреде­лен также частотный план с разнесением на 50 ГГц (Dl = 0,4 нм), что позволяет передавать в этом диапазоне 81 волну.

Имеются экспериментальные образцы с разнесением на 25 ГГц. Такая технология называется High Dence WDM (HDWDM).

Как видно на рис. 7.9, необходимо обеспечить высокую точ­ность частоты, чтобы не допустить перекрытия спектра кана­лов.

Преимуществами технологии DWDM являются:

— высокий коэффициент использования частотного диапазо­на оптоволокна;

—отличная масштабируемость — достаточно просто добавить новые спектральные каналы;

—экономическая эффективность — не требуется электриче­ская регенерация на длинных маршрутах;

—независимость от протокола передачи через магистраль DWDM можно передавать трафик сетей любого типа;

—независимость спектральных каналов друг от друга;

—совместимость с технологией SDH. Мультиплексоры DWDM оснащаются интерфейсами STM-N, способными принимать и передавать данные мультиплексоров SDH;

—совместимость с технологиями Ethernet — Gigabit Ethernet и 10GE;

—стандартизация на уровне Международного союза по теле­коммуникациям ITU-Т.

Обработка информации

 

Обработка информации состоит в получении одних «инфор­мационных объектов» из других «информационных объектов» путем выполнения некоторых алгоритмов и является одной из основных операций, выполняемых с информацией и главным средством увеличения ее объема и разнообразия.

На самом верхнем уровне можно выделить числовую и не­числовую обработки. В указанные виды обработки вкладыва­ется разная трактовка понятия «данные». При числовой об­работке используются такие объекты, как переменные, векторы, матрицы, многомерные массивы, константы и т.д. При нечис­ловой обработке объектами могут быть файлы, записи, поля, иерархии, сети, отношения и т.д. Другое отличие заключается в том, что при числовой обработке содержание данных не име­ет большого значения, в то время как при нечисловой обработ­ке необходимы непосредственные сведения об объектах, а не их совокупность в целом.

С точки зрения реализации на основе современных достиже­ний вычислительной техники выделяют такие виды обработки информации:

- последовательная обработка, применяемая в традиционной фоннеймановской архитектуре ЭВМ, располагающей одним процессором;

- параллельная обработка, характеризующаяся наличием нескольких процессоров в ЭВМ;

- конвейерная обработка, связанная с использованием в ар­хитектуре ЭВМ одних и тех же ресурсов для решения разных задач, причем если эти задачи тождественны, то это последо­вательный конвейер, если задачи одинаковые — векторный конвейер.

Принято относить существующие архитектуры ЭВМ с точки зрения обработки информации к одному из следующих классов.

Архитектуры с одиночным потоком команд и одиночным потоком данных (SISD) — традиционные фоннеймановские однопроцессорные системы, где имеется центральный процессор, работающий с парами «атрибут — значение».

Архитектуры с одиночным потоком команд и множествен­ным потоком данных (SIMD) — особенность данного класса — наличие одного (центрального) контроллера, управляющего рядом одинаковых процессоров. В зависимости от возможностей контроллера и процессорных элементов, числа процессоров, организации режима поиска и характеристик маршрутных и выравнивающих сетей выделяют:

- матричные процессоры, используемые для решения вектор­ных и матричных задач;

-- ассоциативные процессоры, применяемые для решения не­числовых задач и использующие память, в которой можно об­ращаться непосредственно к информации, хранящейся в ней;

- процессорные ансамбли, применяемые для числовой и не­числовой обработки;

- конвейерные и векторные процессоры.

Архитектуры с множественным потоком команд и одиноч­ным потоком данных (MISD) — конвейерные процессоры.

Архитектуры с множественным потоком команд и мно­жественным потоком данных (MIMD) — мультипроцессорные системы, системы с мультобработкой, вычислительные системы из многих машин, вычислительные сети.

Основные процедуры обработки данных представлены на рис. 7.10.

Создание данных как процесс обработки предусматривает их образование в результате выполнения некоторого алгоритма и дальнейшее использование для преобразований на более высоком уровне.

Модификация данных связана с отображением изменений в реальной предметной области, осуществляемых путем включе­ния новых данных и удалением ненужных.

 

 

 

Рис. 7.10. Основные процедуры обработки данных

 

Безопасность и целостность направлены на адекватное ото­бражение реального состояния предметной области в информа­ционной модели и обеспечивают защиту информации от не­санкционированного доступа (безопасность) и от сбоев и по­вреждений технических и программных средств.

Поиск информации, хранимой в памяти компьютера, осу­ществляется как самостоятельное действие при выполнении ответов на различные запросы, так и вспомогательная операция при обработке информации.

Поддержка принятия решения является наиболее важным действием, выполняемым при обработке информации. Широкая альтернатива принимаемых решений приводит к необходимости использования разнообразных математических моделей [25, 32].

Создание документов, сводок, отчетов заключается в преоб­разовании информации в формы, пригодные для чтения как человеком, так и компьютером. С этим действием связаны и такие операции как обработка, считывание, сканирование и со­ртировка документов.

Преобразование информации осуществляет ее перевод из одной формы представления или существования в другую и определяется потребностями, возникающими в процессе реали­зации информационных технологий.

Реализация всех действий, выполняемых в процессе обработ­ки информации, осуществляется с помощью разнообразных программных средств. Наиболее распространенной областью применения технологической операции обработки информации является принятие решений.

В зависимости от степени информированности о состоянии управляемого процесса, полноты и точности моделей объекта и системы управления, взаимодействия с окружающей средой процесс принятия решения протекает в условиях определен­ности, риска, неопределенности и многокритериальности.

При принятии решений в условиях определенности модели объекта и системы управления считаются заданными, а влияние внешней среды несущественным. Поэтому между выбранной стратегией использования ресурсов и конечным результатом существует однозначная связь, откуда следует, что в условиях определенности достаточно использовать решающее правило для оценки полезности вариантов решений, принимая в качестве оптимального то, которое приводит к наибольшему эффекту. Если таких стратегий несколько, то все они считаются эквива-

лентными. Для поиска решений в условиях определенности используют методы математического программирования.

В отличие от предыдущего случая для принятия решений в условиях риска необходимо учитывать влияние внешней среды, которое не поддается точному прогнозу, а известно только ве­роятностное распределение ее состояний. В этих условиях ис­пользование одной и той же стратегии может привести к раз­личным исходам, вероятности появления которых считаются заданными или могут быть определены. Оценку и выбор стра­тегий проводят с помощью решающего правила, учитывающего вероятность достижения конечного результата.

При принятии решений в условиях неопределенности как и в предыдущей задаче, между выбором стратегии и конечным результатом отсутствует однозначная связь. Кроме того, неиз­вестны также значения вероятностей появления конечных ре­зультатов, которые либо не могут быть определены, либо не имеют в контексте содержательного смысла. Каждой паре «стратегия — конечный результат» ставится в соответствие не­которая внешняя оценка в виде выигрыша. Наиболее распро­страненным является использование критерия получения мак­симального гарантированного выигрыша.

Принятие решений в условиях многокритериалъности воз­никает в случае наличия нескольких самостоятельных, не сво­димых одна к другой целей. Наличие большого количества решений усложняет оценку и выбор оптимальной стратегии. Одним из возможных путей решения является использование методов моделирования.

Решение задач с помощью искусственного интеллекта за­ключается в сокращении перебора вариантов при поиске реше­ния, при этом программы реализуют те же принципы, которы­ми пользуется в процессе мышления человек.

Экспертная система пользуется знаниями, которыми она обладает в своей узкой области, чтобы ограничить поиск реше­ния задачи путем постепенного сужения круга вариантов.

Методы решения задач в экспертных системах:

- метод логического вывода, основанный на технике доказа­тельств, называемой резолюцией и использующей опровержение отрицания (доказательство «от противного»);

— метод структурной индукции, основанный на построении дерева принятия решений для различения объектов из большо­го количества данных на входе;

- метод эвристических правил, основанных на перенимании опыта у экспертов-людей, а не на абстрактных правилах фор­мальной логики;

- метод машинной аналогии, основанный на представлении информации о сравниваемых объектах в удобном виде, напри­мер, в виде структур данных, называемых фреймами.

Источники «интеллекта», проявляющегося при решении за­дачи, могут оказаться бесполезными либо полезными или эко­номичными в зависимости от определенных свойств области, в которой поставлена задача. Исходя из этого, может быть осу­ществлен выбор метода построения экспертной системы или использования готового программного продукта.

Процесс выработки решения на основе первичных данных (рис. 7.11) можно разбить на два этапа: выработка допустимых вариантов решений путем математической формализации с ис­пользованием разнообразных моделей и выбор оптимального решения на основе субъективных факторов.

 

 

Рис. 7.11. Процесс выработки решения на основе первичных данных

 

Информационные потребности лиц, принимающих решение, во многих случаях ориентированы на интегральные технико-экономические показатели, которые могут быть получены в результате обработки первичных данных, отражающих текущую деятельность предприятия. Анализируя функциональные взаи­мосвязи между итоговыми и первичными данными можно по­строить так называемую информационную схему, которая от­ражает процессы агрегирования информации. Первичные данные, как правило, чрезвычайно разнообразны, интенсивность их поступления высока, а общий объем на интересующем ин­тервале велик. С другой стороны, состав интегральных показа­телей относительно мал, а требуемый период их актуализации может быть значительно ниже периода изменения первичных данных — аргументов.

Для поддержки принятия решений обязательным является наличие таких компонентов, как обобщающий анализ, прогно­зирование, ситуационное моделирование.

Система поддержки принятия решений (СППР) может быть представлена как автоматизированная интерактивная человеко-машинная система поддержки принятия решений на основе использования данных и моделей. СППР предназначены для поддержки управленческих решений и интуитивного подхода к решению управленческих задач. Для этого они обеспечивают пользователей необходимой информацией, генерируют, оцени­вают и предлагают несколько вариантов. Системы поддержки принятия решений входят в состав практически любой совре­менной информационной системы. Понятие информационной системы (ИС) и понятие системы поддержки принятия решений являются взаимодополняющими. В соответствии с характером обработки информации в ИС на различных уровнях управления заданной системой (оперативном, тактическом и стратегическом) выделяются три типа информационных подсистем — системы обработки данных (EDP – Electronic Data Processing); инфор­мационная система управления (MIS – Management Information System); система поддержки принятия решений (DSS – Decision Support System).

Для задач СППР свойственны недостаточность имеющейся информации, ее противоречивость и нечеткость, преобладание качественных оценок целей и ограничений, слабая формализованность алгоритмов решения. В качестве инструментов обоб­щения чаще всего используются средства составления аналитических отчетов произвольной формы, методы статистического анализа, экспертных оценок и систем, математического и ими­тационного моделирования.

Таким образом, СППР — это автоматизированная система, используемая для различных видов деятельности при принятии решений в ситуациях, когда невозможно или нежелательно иметь автоматическую систему, полностью выполняющую весь процесс решения, вследствие слабой структурированности или неструктурированности решаемых проблем.

Такая «система поддержки принятия решения» может со­стоять из нескольких подсистем, реализующих 7 основных функций СППР:

1) оценка обстановки (ситуации), выбор критериев и оценка их относительной важности;

2) генерация возможных решений (сценариев действий);

3) оценка решений (сценариев действий) и выбор лучшего;

4) обмен информацией об обстановке принимаемых решений и согласование групповых решений (в тех случаях, когда это возможно);

5) моделирование принимаемых решений (в тех случаях, когда это возможно);

6) динамический компьютерный анализ возможных послед­ствий принимаемых решений;

7) сбор данных о результатах реализации принятых решений и оценка результатов.

СППР зачастую используют как интегрированные подсисте­мы в составе сложных комплексов управления и контроля. Для подобных интегрированных СППР можно выделить несколько основных функций:

обеспечение ЛПР информацией для процесса принятия ре­шения, включая ее предварительную обработку;

организационно-методическое обеспечение процесса принятия решений;

моделирование последствий принятия решений;

экспертные функции: выдача рекомендаций и обоснований;

обеспечение согласованности решений, принимаемых в груп­пах.

Модель процесса принятия решений человеком включает три основные ступени: интеллектуальную ступень, конструирование и выбор. Термин «поддержка» подразумевает различные шаги и задачи на каждом этапе процесса принятия решений.

В зависимости от данных, с которыми СППР работают, их можно разделить на оперативные (предназначенные для не­медленного реагирования на текущую ситуацию); стратегические (основанные на анализе большого количества информации из разных источников с привлечением сведений, содержащихся в системах, аккумулирующих опыт решения проблем).

Оперативные СППР получили название Информационных Систем Руководства (ИСР — Executive Information Systems). По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из информационной системы предприятия или OLTP-системы. Для ИСР характерно следую­щее:

- отчеты, как правило, базируются на стандартных для ор­ганизации запросах; число последних относительно невелико;

— отчеты представляются в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мульти­медийные возможности и т.п.;

система ориентирована на конкретный вертикальный ры­нок, например финансы, маркетинг, управление ресурсами.

Стратегические СППР предполагают достаточно глубокую проработку данных, специально преобразованных так, чтобы их было удобно использовать в ходе процесса принятия решений. Неотъемлемым компонентом СППР этого уровня являются пра­вила принятия решений, которые на основе агрегированных данных подсказывают менеджерскому составу выводы и при­дают системе черты искусственного интеллекта. Такого рода системы создаются только в том случае, если структура бизнеса уже достаточно определена и имеются основания для обобщения и анализа не только данных, но и процессов их обработки.

Большая часть используемых сегодня СППР разработана для генерации и оценки альтернатив посредством анализа «что-если» и «поиска цели» на этапах конструирования и выбора.

Финансовые модели служат для поддержки и планирования, рассчитывая последствия запланированных действий на основе оценки прибылей.

Репрезентативные модели оценивают последствия действий (принятия решений) на основе комплекса моделей, включая все имитационные модели.

Оптимизирующие модели находят оптимальные решения.

Предлагающие модели дают специальное решение для четко структурированных задач. Такие системы выполняют механические вычисления и не оставляют места управленческому суждению.

Управление данными и моделями в СППР практически не­разделимо, поэтому многие исследователи фокусируют внимание на обеих сторонах вопроса, на управлении и данными, и моде­лями. Данные представляют собой фактические результаты наблюдения за физическими явлениями, например, это могут быть размеры суточного выпуска продукции, объем дневных продаж и уровень запасов продукта А. База данных содержит совокупность взаимосвязанных файлов.

Управление данными в СППР — это необходимая функция, используемая, главным образом, на интеллектуальной стадии процесса принятия решений, но недостаточная для поддержки этапов конструирования и выбора альтернатив. Для поддержки этих этапов СППР должны обеспечить выполнение таких опе­раций, как проекция, дедукция, анализ, генерация альтернатив, сравнение альтернатив, оптимизация и имитация. При выпол­нении этих задач СППР используют различные типы моделей из областей знаний об управлении и исследовании операций. Эти модели включают линейное программирование, целочис­ленное программирование, сетевые модели, программирование целей, имитационные и статистические модели и электронные таблицы.

Другой важной, развивающейся в последнее время разновид­ностью СППР, являются системы поддержки принятия реше­ний, основанные на базе знаний (СППРБЗ), которые представ­ляют собой гибрид СППР и ЭС и предназначены для решения широкого круга организационных задач. В интегрировании СППР и ЭС выделяются два основных подхода: экспертные системы поддержки (ЭСП) и интеллектуальные системы под­держки (ИСП). Основные различия между этими системами заключаются в следующем — ЭСП предназначены для замены живого эксперта машинным экспертом, а задачи ИСП заклю­чаются в поддержке знаний отдельных пользователей и групп. Широкий ряд управленческих задач реального мира легче под­дается решению, если используются как количественные, так и качественные данные. Новая интегрированная система (ЭСП или ИСП) может помогать ЛПР, используя знания и опыт ключевых фигур в организации. Узким местом при разработке систем, основанных на знаниях, таких как ЭСП например, яв­ляется задача приобретения знаний: этот процесс состоит из представления знаний, проверки, механизма построения логи­ческих выводов, механизмов объяснения и управления.

Множество новых средств и технологий способно расширить возможности СППР, среди них важное место занимает интел­лектуальный анализ данных (ИАД), обычно определяемый как метод поддержки принятия решений, основанный на анализе зависимостей между данными [23]. Существуют два подхода автоматизации поиска зависимостей между данными.

В первом подходе, используемом в традиционной технологии анализа, пользователь сам выдвигает гипотезы относительно зависимостей между данными. Гипотеза приводит к построению отчета, анализ отчета — к выдвижению новой гипотезы и т.д. Такая методика действует и в том случае, когда пользователь применяет такие развитые средства, как OLAP, поскольку про­цесс поиска по-прежнему полностью контролируется человеком. Во многих системах ИАД в этом процессе автоматизирована проверка достоверности гипотез, что позволяет оценить вероят­ность тех или иных зависимостей в базе данных.

Второй подход основан на автоматическом поиске зависимо­сти между данными. Увеличивающееся количество продуктов, реализующих автоматический поиск зависимостей, подтверж­дает растущий интересе производителей и потребителей к си­стемам именно такого типа.

Процессы ИАД подразделяются на три большие группы: по­иск зависимостей (discovery), прогнозирование (predictive modelling) и анализ аномалий (forensic analysis). При поиске за­висимостей осуществляется просмотр базы данных и автома­гическое выявление зависимостей. Проблемой здесь является отбор действительно важных зависимостей из огромного числа существующих в БД. Прогнозирование основано на том, что пользователь предъявляет системе записи с незаполненными полями и запрашивает недостающие значения. Система сама анализирует содержимое базы и делает правдоподобное пред­сказание относительно этих значений. Анализ аномалий заклю­чается в процессе поиска подозрительных данных, сильно от­клоняющихся от устойчивых зависимостей.

Необходимость оперативной обработки стремительно возрас­тающих объемов информации вызвало к жизни появление и активное развитие технологии интеллектуального анализа дан­ных (ИАД или data mining). Теоретической базой ИАД явля­ются методы математической статистики и искусственного

интеллекта. Сложность решаемых задач потребовала создания специализированных инструментальных средств, ориентирован­ных на конечного пользователя и предназначенных для решения как типовых, так и специфических задач в различных пред­метных областях.

Областями применения ИАД являются научные исследова­ния, образование, статистика, здравоохранение, производство, финансы, правоохранительная и военная деятельность.

Разнообразие решаемых задач вынуждает разработчиков создавать исследовательские ИАД, предназначенные для рабо­ты с новыми типами проблем, и прикладные ИАД, ориентиро­ванные на решение типовых задач. Каждый из классов систем может быть ориентирован как на специалистов, так и непро­граммирующих пользователей.

К сожалению, универсальные средства ИАД довольно слож­ны и дороги, поэтому они не могут широко применяться в рамках интегрированных систем, ориентированных на конечно­го пользователя. В основу технологии ИАД положен не один, а несколько принципиально различных подходов (табл. 7.1), причем использование некоторых из них невозможно без специ­альной подготовки [46]. Выбор подхода нередко требует при­влечения специалиста по ИАД.

Таблица 7.1. Основные технологии интеллектуального анализа данных

Технология Область применения Недостатки
Правила вывода Работа с данными, связанными отноше­ниями, представлен­ными в виде правил «если то» Потеря наглядности при большом количе­стве правил; не всегда удается выделить от­ношения «если то»
Нейронные сети Работа с нелиней­ными зависимостя­ми , зашумленными и неполными данными Модель типа «черный ящик» не позволяет объяснить выявлен­ные знания, при этом данные обязательно должны быть преобра­зованы в числовой вид
Нечеткая логика Ранжировка данных по степени близости к желаемым резуль­татам; нечеткий по­иск в базах данных Из-за новизны техноло­гии в настоящее время известно ограниченное число специализиро­ванных приложений
Визуализация Многомерное графическое пред­ставление данных (пользователю самому представля­ется возможность выявить закономер­ности отношений между данными) Зависимость интер­претации модели от аналитика
Статистика Научные и инже­нерные приложения, характеризуемые наличием большого числа алгоритмов и опыта их приме­нения Крен в сторону про­верки гипотез, а не выявления новых закономерностей в данных
К- ближайший сосед Выявление кла­стеров, обработка целостных источни­ков данных Требует больших объе­мов памяти, проблемы с чувствительностью
Интегрированные технологии Выбор подходов, адекватных зада­чам, или их срав­нение Сложность средств поддержки; высокая стоимость. Для каж­дой отдельно взятой технологии не всегда реализуется наилуч­шее решение

Одним из основных подходов к поиску и выборке данных является оперативная аналитическая обработка (OLAP – Online Analytical Processing). Общеизвестно, что OLAP-системы построены на двух базовых принципах:

все данные, необходимые для принятия решений, предва­рительно агрегированы на всех соответствующих уровнях и организованы так, чтобы обеспечить максимально быстрый до­ступ к ним;

язык манипулирования данными основан на использовании бизнес-понятий.

Так как в основе OLAP лежит понятие гиперкуба, или многомерного куба данных, в ячейках которого хранятся ана­лизируемые (числовые) данные, то дальнейшее усложнение модели данных может идти по нескольким направлениям:

- увеличение числа измерений. Например, данные о статьях не только по месяцам и годам, но и по темам. В этом случае куб становится трехмерным;

- усложнение содержимого ячейки. В этом случае в ячейке будет несколько значений признаков;

введение иерархии в пределах одного измерения. Например, общее понятие «время» естественным образом связано с иерар­хией значений: год состоит из кварталов, квартал из месяцев и т.д.

Имеется в виду не физическая структура хранения, а лишь логическая модель данных, т.е. определяется лишь пользова­тельский интерфейс модели данных. В рамках этого интерфей­са должны быть введены определенные базовые операции:

- поворот;

- проекция — при проекции значения в ячейках, лежащих на оси проекции, суммируются по некоторому предопределен­ному закону;

- раскрытие (drill-down) — одно из значений измерения за­меняется совокупностью значений из следующего уровня иерар­хии измерения; соответственно заменяются значения в ячейках гиперкуба;

- свертка (roll-up/drill-uo) — операция, обратная раскры­тию;

- сечение (slice-and-dice).

В зависимости от ответа на вопрос, существует ли гиперкуб как отдельная физическая структура или лишь как виртуальная модель данных, различают системы MOLAP (Multidimensional OLAP) и ROLAP (Relational OLAP). В первых гиперкуб реали­зуется как отдельная база данных специальной нереляционной структуры, обеспечивающая максимально эффективный по скорости доступ к данным, но требующая дополнительного ресурса памяти. MOLAP-системы весьма чувствительны к объемам хранимых данных, поэтому данные из хранилища сначала помещаются в специальную многомерную базу (Multidimensional Data Base, MDB), а затем эффективно обра­батываются OLAP-сервером.

Реализация процесса принятия решений заключается в по­строении информационных приложений. Выделим типовые функциональные компоненты, необходимые для формирования любого приложения на основе баз данных (БД) [41):

- PS (Presentation services) средства представления. Обе­спечиваются устройствами, принимающими ввод от пользова­теля и отображающими то, что сообщает ему компонент логи­ки представления PL, плюс соответствующая программная поддержка. Может быть текстовым терминалом или Х-терми-налом, а также персональным компьютером или рабочей стан­цией в режиме программной эмуляции терминала или Х-терми­нала;

— PL (Presentation Logic) — логика представления. Управля­ет взаимодействием между пользователем и ЭВМ. Обрабаты­вает действия пользователя по выбору альтернативы меню, нажатию кнопки или выбору элемента из списка;

— BL (Business or Application Logic) — прикладная логика. Набор правил для принятия решений, вычислений и операций, которые должно выполнить приложение;

— DL (Data Logic) — логика управления данными. Выполня­ет операции с базой данных (SQL-операторы SELECT, UPDATE и INSERT), которые необходимы для реализации прикладной логики управления данными;

— DS (Data Services) — операции с базой данных. Действия системы управления БД (СУБД), вызываемые для выполнения логики управления данными, такие как манипулирование дан­ными, определения данных, фиксация или откат транзакций и т.п. СУБД обычно компилирует SQL-приложения;

— FS (File Services) —- файловые операции. Дисковые опера­ции чтения и записи данных для СУБД и других компонент. Обычно являются функциями ОС.

Среди средств разработки информационных приложений можно выделить: традиционные системы программирования: инструменты для создания файл-серверных приложений: сред­ства разработки приложений клиент-сервер: средства автома­тизации делопроизводства и документооборота: средства разработки Internet/Intranet приложений: средства автоматизации проектирования приложений.

Хранение информации

 

Хранение и накопление — одни из основных действий, осуще­ствляемые с информацией, и главное средство обеспечения ее доступности в течение некоторого промежутка времени. В настоя­щее время определяющими направлениями реализации этих опера­ций является концепция базы данных, хранилища данных [39].

База данных совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения измене­ний применяется общий управляющий метод.

Система баз данных совокупность управляющей си­стемы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.

Хранилище данных (Склад данных —• ХД, Информацион­ное хранилище — Data Warehouse) база данных, хранящая данные, агрегированные по многим измерениям. Основные от­личия ХД от БД: агрегирование данных; данные из ХД никог­да не удаляются; пополнение ХД происходит на периодической основе; автоматическое формирование новых агрегатов данных, зависящих от старых; доступ к ХД осуществляется на основе многомерного куба или гиперкуба.

Витрины данных (Data Mart), альтернатива хранилищу данных — множество тематических БД, содержащих информа­цию, относящуюся к отдельным информационным аспектам предметной области.

Репозитарий в упрощенном виде можно рассматривать просто как базу данных, предназначенную для хранения не пользовательских, а системных данных. Технология репозита-риев проистекает от словарей данных, которые по мере обога­щения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.

Каждый из участников действия (пользователь, группа поль­зователей, «физическая память») имеет свое представление об информации.