Надежность сложной системы

Сложная (не простая!) система состоит из большого числа элементов с изменчивыми связями и переменной структурой. Такая система, как правило, многофункциональна и отказы отдельных элементов не вызывают отказа всей системы, но почти всегда влияют на полноту и качество выполнения некоторых её функций и, тем самым вызывают частичные отказы и снижение качества функционирования всей системы. Примером подобной сложной системы может служить АСУТП с централизованной и, особенно распределенной структурами, а также многие информационно-вычислительные системы реального времени.

Главная особенность сложной системы – невозможность или затруднительность строгой объективной формулировки понятий «работоспособность» и «отказ», что, в свою очередь, делает невозможным применение введенных ранее функциональных и числовых показателей надежности Q(t), P(t), f(t), l(t), tн, tg, кг, ког для описания поведения случайных величин: наработки Т и длительности восстановления Тв.

В связи с этим появляется необходимость введения новых функциональных и числовых характеристик надежности сложной системы, базирующихся на понятии эффективности функционирования системы.

Модель функционирования сложной системы.

Пусть сложная система состоит из m восстановливаемых элементов, часть из которых может быть основными, а часть – резервными. При этом каждый элемент может находиться в состоянии работоспособности или отказа (восстановления); переходы из одного состояния в другое происходят мгновенно (рис. 3.53)

 

 

Рис. 3.53 – Схема функционирования элемента сложной системы

 

Присвоим каждому элементу системы индекс (имя) g, g=1,2,..., m.

В каждый момент времени t система находится в некотором техническом состоянии Si, i=1,2,…,M, однозначно определяемом числом и номерами отказавших элементов. Например, в состоянии S1 все m элементов системы исправны; в состоянии S2 – отказал один элемент с номером g=1 (все остальные исправны); в состоянии S3 – отказал один элемент с номером g=2 (остальные m-1 элемента работоспособны);при выходе из строя элементов с g=1 и g=2 возникает состояние Sm+2 и т.д.

Наконец, в состоянии SM отказали все m элементов (состояние полной неработоспособности). Можно подсчитать общее число М=2m разных состояний системы Si, .

В процессе функционирования система мгновенно переходит из произвольного состояния Si, в любое другое состояние Sj, вследствии отказов тех или иных элементов и/или ввода их в работу после окончания ремонта. Эти события – отказ и восстановление – происходят в случайные моменты времени, поэтому, считая потоки отказов и восстановлений простейшими, смену состояний можно описать случайным марковским процессом с непрерывным временем t и дискретными состояниями Si, (рис. 3.54).

 

Рис 3.54 – График смены состояний сложной системы

 

Для марковского процесса переход из состояния Si в состояние Sj определяется одним числовым параметром – интенсивностью перехода . В общем случае .

Интенсивности перехода li, j определяются интенсивностями отказов и восстановлений отдельных элементов системы,

Для удобства описания введем конечномерный вектор состояния системы , а также векторы интенсивностей отказов и восстановлений элементов , вектор интенсивностей переходов системы . При этом вектор L=L(l, ), а вектор состояний системы S=S(L)=S(l, ).

 

Эффективность функционирования сложной системы.

Любая сложная система создается для достижения той или иной цели. Способность (свойство) сложной системы достигать своей цели называют её эффективностью. Степень эффективности или количественная близость к поставленной цели характеризуют некоторой количественной мерой – критерием эффективности I.

Каждая цель в общем случае может описываться набором частных критериев качества . Используя известные методы преобразования векторных критериев к скалярным мы можем свести к одному обобщенному критерию эффективности I.

При анализе сложных автоматизированных систем в качестве критерия эффективности обычно принимают следующие показатели:

- технико-экономические (прибыль, себестоимость, эксплуатационные затраты и др.);

- технологические (производительность, КПД, степень превращения вещества и т.д.)

- информационные (время ожидания в очередях на обработку информации, вероятность решения задачи за заданное время, средняя скорость переработки информации и др.).

Отметим, что два первых типа критериев эффективности относятся к замкнутой системе «ТОУ - АСУ», третий критерий характеризует в основном АСУ или информационно-вычислительную систему.

Различают «мгновенную» эффективность сложной системы в любой момент времени t0, оцениваемую значением критерия I(t0), и усредненную эффективность функционирования сложной системы на заданном отрезке времени [0, T0]

где T0 – директивное время, например, горизонт планирования работы системы (квартал, декада, год и т.д.).

Критерии I и Э зависят от состояния системы S(t) в момент времени t, и режима работы R(t) системы в каждом из возможных состояний Si, то есть

Э=Э(S(t), R(t))

Для упрощения задачи анализа эффективности будем полагать, что состояние Si не зависит от режимов функционирования системы во всех предшествующих состояниях. Кроме того, пусть для каждого состояния Si заранее известен расчетный (номинальный) или оптимальный режим функционирования системы Ri, , который «мгновенно» устанавливается при возникновении Si. При этом режим Ri обеспечивает в состоянии Si расчетное (номинальное) или оптимальное значение критерия Ii. Итак, имеем «цепочку» (рис. 3.55)

 

 

Рис. 3.55 – К расчету критериев качества Ii

 

При сделанных допущениях оказывается, что средняя эффективность Э зависит только от состояний Si, , возникающих в случайные моменты времени t на интервале [0, T0]:

Э=Э(S(t)),

То есть, эффективность опосредственно определяется безотказностью и ремонтопригодностью всех элементов системы

Э=Э(S(l, m, t)),

где l, m - векторы интенсивностей отказов элементов .

Уточним теперь понятие эффективности. Назовем технической эффективностью свойство сложной системы достигать своей цели при учете потоков отказов и восстановлений её элементов и соответствующего ремонтного персонала. Соответственно показатель Э(S(l, m, t)) будет называться критерием технической эффективности сложной системы.

Так как для заданной системы значение критерия Э однозначно определяется надежностными характеристиками l, m всех элементов, то Э(S(l, m, t)) является количественной мерой надежности сложной системы, не имеющей формализованных понятий «работоспособность» и «отказ».

По смыслу критерия технической эффективности его максимальное значение достигается в состоянии S1, когда исправны все элементы, а минимальное – в состоянии Sм, когда отказали все m элементов (рис. 3.56).

Рис. 3.56 – К определению минимального и максимального значения критериев качества Ii и эффективности : ○ – исправный элемент, ● – отказавший элемент

При любом произвольном Si, i¹1, i¹M, критерий Э(Si)=Эi удовлетворяет нестрогому неравенству

, i=2, 3, … , M-1.

Остаётся получить формулу для вычисления критерия Э(S).

В произвольный момент t, система случайным образом оказывается в одном из состояний Si, , а её мгновенная эффективность I принимает значение Ii. Обозначим вероятность нахождения системы в момент t в состоянии Si через Pi(t), . Так как мгновенная эффективность I в момент t является дискретной случайной величиной, принимающей значения I1, I2,…, IM, то её математическое ожидание или истинное среднее равно:

Далее легко определить среднюю техническую эффективность

Для вычисления Э требуется знание вероятностей Pi(t), .

 

Определение вероятностей состояния системы.

При известных интенсивностях lij, lji переходов системы из состояния Si в любое другое состояние Sj, и обратно из Sj в Si вероятности Рi нахождения сложной системы в состоянии Si, находятся как решения линейных дифференциальных уравнений Колмогорова

где в общем случае lij¹lji.

Сложная система всегда находится в одном из M состояний, поэтому для любого t и число дифференциальных уравнений можно уменьшить на единицу (для сложной системы M=2m и число уравнений достигает нескольких сотен и тысяч).

Для решения системы уравнений надо задать M (или, точнее M-1) начальных условий Pi(0). Если считать, что система включается полностью исправной, то

P1(0)=1, Pi(0)=0, .

Системы линейных дифференциальных уравнений высокой размерности целесообразно решать численно, используя для этого известные методы интегрирования, например, Рунге-Кутта 4-го порядка, или более точные явные и неявные методы Адамса с автоматическим выбором шага интегрирования.

При больших значениях времени t производные dPi/dt становятся малыми и тогда дифференциальные уравнения можно заменить на линейные алгебраические

где - стационарная вероятность нахождения системы в состоянии Si.

Так как в правую часть этого уравнения не входит , то оно разрешается относительно вероятности :

 

Анализ задачи оценивания технической эффективности.

Знание вероятностей Pi(t) и позволяет вычислить среднюю техническую эффективность системы:

и для стационарного режима системы

Критерии Э и имеют физическую размерность целевой функции I, что затрудняет сравнение эффективностей разных сложных систем с неоднородными показателями качества работы. В таких случаях удобно использовать безразмерный критерий технической эффективности:

 

или для стационарного режима

Эти критерии изменяются в интервале от 0 до 1 (здесь принято, что в состоянии SM имеем IM=0, а в состоянии S1 вероятности P1(t) и по договоренности равны 1, так как все m элементов системы работоспособны).

Из анализа задачи можно сделать ряд очевидных заключений:

1. Чем ближе к единице, тем более эффективна техническая

система, тем выше её надежность и ремонтопригодность в целом.

2. Если возможны r вариантов построения одной и той же сложной

системы из одних и тех же m элементов, и для каждого известны , r=1, 2, ... , r, то с позиции надежности наиболее предпочтителен вариант с наибольшим значением .

3. Если для решения некоторой проблемы создается несколько, например, две разные системы из разных элементов, и для них определены , причем , то с позиции надежности более выгодна система 1 с наибольшим значением критерия технической эффективности.

4. Если для двух разных систем соответствующие критерии ,

то целесообразно применять систему с наименьшей стоимостью изготовления и эксплуатации.

 

Анализ размерности задачи оценивания технической эффективности

Под размерностью задачи будем понимать число M возможных состояний системы, которое определяет число различных значений критерия Ii, , и вероятностей Pi(t) или , .

Число M состояний системы Si существенно зависит от количества m входящих в нее элементов M=2m (табл. 12).

Число элементов m
Число состояний М

Таблица 12

Зависимость числа состояний системы М от числа элементов m

Проанализируем в качестве примера трудоемкость задачи для m=16 ( система из 16 элементов – это «небольшая» система типа АСУТП). Для оценки технической эффективности системы из 16 элементов надо:

Знать: - критерий I,

- вектор интенсивности отказов l={l1, l2, … , l16};

- вектор интенсивности восстановления m={m1, m2, … , m16};

Определить:

- элементы матрицы интенсивностей переходов, размерностью 65536´65536;

- значения критерия эффективности I1, I2, … , Ii, … , I65536 (для этого 65536 раз выполняется расчет номинального режима или 65536 раз решается задача оптимизации Ii);

- функции P1(t), P2(t), … , P65536 (для этого численно интегрируется система из 65536 дифференциальных уравнений);

- значение Э0 (находится с помощью квадратурных формул трапеций или прямоугольников).

Понятно, что даже при таком относительно малом m трудоемкость оценивания технической системы оказывается чрезвычайно высокой, а при увеличении m до 100 и более определение Э0 рассмотренным методом становиться невозможным.

Высокая размерность задачи оценивания эффективности сложной системы негативно влияет и на свойства критерия , наиболее часто используемого при анализе и синтезе систем. Этот критерий представляет собой ограниченную кусочно-постоянную функцию 2m дискретных интенсивностей и способа соединения между собой элементов (структур и вариантов систем). Такая высокая размерность функции делает её малочувствительной к изменению состояний Si, , что заметно затрудняет решение оптимизационных задач синтеза сложных систем.

При фиксированном состоянии Si критерий в общем случае зависит от значения функционала I­I(x, y), который в свою очередь определяется режимными входными и выходными координатами X(t), Y(t). В состав вектора X(t) входят нагрузка, возмущения и управление. Обычно, при функционировании системы в номинальном («расчетном») и/или оптимальном режиме критерий Ii слабовыпуклый и имеет малую норму градиента . Слабая чувствительность Ii по переменным x, y позволяет считать критерий технической эффективности почти независимым или слабозависимым от режима функционирования системы в каждом состоянии Si, и использовать при расчете Э0 заранее рассчитанные значения Ii для номинальных режимов.

 

Понижение размерности задачи оценивания эффективности

Для понижения размерности задачи оценивания эффективности сложной системы следует уменьшать число М её возможных состояний Si, . Сделать это можно разными способами, в частности, путем «укрупнения» элементов и уменьшения их числа m.

Метод «крупных» элементов – блоков. Для некоторых сложных систем (типа АСУТП, информационно-вычислительных систем и др.) можно ввести новые, более «крупные» элементы – блоки, объединяющие ряд исходных основных элементов. Для простейших потоков отказов и восстановлений элементов интенсивности отказов и восстановлений блоков находятся по известным формулам

где к – число основных элементов с интенсивностями , включенных в один блок.

Среднее число блоков равно отношению , поэтому при k»3-8 размерность задачи оценивания эффективности существенно снижается. Так, например, в системе из 20 исходных элементов возможны 220 =1 048 576 состояний. Если удастся создать блоки из k=5 элементов, то число блоков окажется равным четырем и количество «блочных» состояний станет равно 24=16, следовательно размерность задачи снизится в раза.

Даже создание 10 блоков по 2 элемента каждый позволяет получить 210 = 1024 “блочных” состояния и снизить размерность задачи оценивания эффективности в раза.

Метод критериальных состояний. Понижение размерности задачи здесь достигается за счет введения нового понятия состояние системы, что обеспечивает значительное (в 10-100 раз), уменьшение числа М состояний. Так, если известен диапазон (шкала) изменения критерия I(S, R) сложной системы, то можно выделить несколько непересекающихся поддиапазонов DI1, DI2,…, DIm, …, DId, d<<M и рассматривать d новых критериальных состояний.

Под критериальным состояниемSm понимается такая структура сложной системы и режим работы её элементов, при которых значение критерия Im ÎDIm, . В частности, при анализе эффективности распределенных АСУТП рекомендуется вводить 3 или 4 подинтервала: оптимальный и/или нормальный (номинальный), резервный и аварийный. Понятно, что при столь малых числах d проблема размерности задачи становится неактуальной: вычисление вероятностей критериальных состояний Рm и значений Im не вызывает затруднений . Однако при этом возникает дополнительная задача выявления связей между каждым техническим «элементным» состоянием Sj, и критериальным состоянием Smk, (рис. 3.57).

Рис. 3.57 – К понятию критериального состояния сложной системы

Метод функциональных состояний. Применяется при анализе эффективности сложных систем с четко указанными функциями (например, АСУТП с централизованной и распределенной технической структурой).

Предположим, что сложная система из m элементов выполняет l функций, l<<m, т.е. l в 10-100 раз меньше m. Пусть известны все элементы системы, реализующие каждую j-ю функцию, j=1,2,…, l и образующие при этом некоторую простую подсистему с формализованными понятиями работоспособности и отказа. Тогда можно ввести понятие функционального состояния системы hj, однозначно определяемого числом и номерами отказавших функций. Общее число Мф функциональных состояний системы равно 2l.

При l<m и l<<m число функциональных состояний заметно уменьшается относительно числа М. Так, если l<0.5*m, то Мф<<М. Например, при m=20 имеем М=1048576, l=0.5∙20=10, Мф=210=1024; тогда , следовательно число состояний системы уменьшилось в 65536 раз.

Как и методе критериальных состояний, здесь возникает дополнительная (причем достаточно сложная) задача выявления связей между состоянием каждого элемента или техническим «элементным» состоянием Si, и функциональным состоянием Sф (рис. 3.58).

Рис. 3.58 – К понятию функционального состояния сложной системы

 

Помимо рассмотренных выше методов существуют еще несколько приемов уменьшения размерности задачи оценивания эффективности сложных систем, заключающиеся в объединении ряда элементов в небольшое число групп по тем или иным признакам, в частности по значениям стационарных вероятностей и введении понятия группового состояния системы Smг, m=1,2, …, кг. Число групп обычно на порядок меньше числа технических элементов m, что существенно (на 2-3 порядка) уменьшает число групповых состояний и снижает трудоемкость определения . Вместе с тем использование групповых состояний Smг влияет на точность вычисления (чем меньше групп, тем больше погрешность определения ) и требует выявления связей между каждым элементным состоянием Si, и групповым состоянием Smг, .