Надежность сложной системы

Сложная (не простая!) система состоит из большого числа элементов с изменчивыми связями и переменной структурой. Такая система, как правило, многофункциональна и отказы отдельных элементов не вызывают отказа всей системы, но почти всегда влияют на полноту и качество выполнения некоторых её функций и, тем самым вызывают частичные отказы и снижение качества функционирования всей системы. Примером подобной сложной системы может служить АСУТП с централизованной и, особенно распределенной структурами, а также многие информационно-вычислительные системы реального времени.

Главная особенность сложной системы – невозможность или затруднительность строгой объективной формулировки понятий «работоспособность» и «отказ», что, в свою очередь, делает невозможным применение введенных ранее функциональных и числовых показателей надежности Q(t), P(t), f(t), l(t), t_н, t_g, к_г, к_ог для описания поведения случайных величин: наработки Т и длительности восстановления Т^в.

В связи с этим появляется необходимость введения новых функциональных и числовых характеристик надежности сложной системы, базирующихся на понятии эффективности функционирования системы.

Модель функционирования сложной системы.

Пусть сложная система состоит из m восстановливаемых элементов, часть из которых может быть основными, а часть – резервными. При этом каждый элемент может находиться в состоянии работоспособности или отказа (восстановления); переходы из одного состояния в другое происходят мгновенно (рис. 3.53)

Рис. 3.53 – Схема функционирования элемента сложной системы

Присвоим каждому элементу системы индекс (имя) g, g=1,2,..., m.

В каждый момент времени t система находится в некотором техническом состоянии S_i, i=1,2,…,M, однозначно определяемом числом и номерами отказавших элементов. Например, в состоянии S₁ все m элементов системы исправны; в состоянии S₂ – отказал один элемент с номером g=1 (все остальные исправны); в состоянии S₃ – отказал один элемент с номером g=2 (остальные m-1 элемента работоспособны);при выходе из строя элементов с g=1 и g=2 возникает состояние S_m₊₂ и т.д.

Наконец, в состоянии S_M отказали все m элементов (состояние полной неработоспособности). Можно подсчитать общее число М=2^m разных состояний системы S_i, .

В процессе функционирования система мгновенно переходит из произвольного состояния S_i, в любое другое состояние S_j, вследствии отказов тех или иных элементов и/или ввода их в работу после окончания ремонта. Эти события – отказ и восстановление – происходят в случайные моменты времени, поэтому, считая потоки отказов и восстановлений простейшими, смену состояний можно описать случайным марковским процессом с непрерывным временем t и дискретными состояниями S_i, (рис. 3.54).

Рис 3.54 – График смены состояний сложной системы

Для марковского процесса переход из состояния S_i в состояние S_j определяется одним числовым параметром – интенсивностью перехода . В общем случае .

Интенсивности перехода l_i_,_j определяются интенсивностями отказов и восстановлений отдельных элементов системы,

Для удобства описания введем конечномерный вектор состояния системы , а также векторы интенсивностей отказов и восстановлений элементов , вектор интенсивностей переходов системы . При этом вектор L=L(l, ), а вектор состояний системы S=S(L)=S(l, ).

Эффективность функционирования сложной системы.

Любая сложная система создается для достижения той или иной цели. Способность (свойство) сложной системы достигать своей цели называют её эффективностью. Степень эффективности или количественная близость к поставленной цели характеризуют некоторой количественной мерой – критерием эффективности I.

Каждая цель в общем случае может описываться набором частных критериев качества . Используя известные методы преобразования векторных критериев к скалярным мы можем свести к одному обобщенному критерию эффективности I.

При анализе сложных автоматизированных систем в качестве критерия эффективности обычно принимают следующие показатели:

- технико-экономические (прибыль, себестоимость, эксплуатационные затраты и др.);

- технологические (производительность, КПД, степень превращения вещества и т.д.)

- информационные (время ожидания в очередях на обработку информации, вероятность решения задачи за заданное время, средняя скорость переработки информации и др.).

Отметим, что два первых типа критериев эффективности относятся к замкнутой системе «ТОУ - АСУ», третий критерий характеризует в основном АСУ или информационно-вычислительную систему.

Различают «мгновенную» эффективность сложной системы в любой момент времени t₀, оцениваемую значением критерия I(t₀), и усредненную эффективность функционирования сложной системы на заданном отрезке времени [0, T₀]

где T₀ – директивное время, например, горизонт планирования работы системы (квартал, декада, год и т.д.).

Критерии I и Э зависят от состояния системы S(t) в момент времени t, и режима работы R(t) системы в каждом из возможных состояний S_i, то есть

Э=Э(S(t), R(t))

Для упрощения задачи анализа эффективности будем полагать, что состояние S_i не зависит от режимов функционирования системы во всех предшествующих состояниях. Кроме того, пусть для каждого состояния S_i заранее известен расчетный (номинальный) или оптимальный режим функционирования системы R_i, , который «мгновенно» устанавливается при возникновении S_i. При этом режим R_i обеспечивает в состоянии S_i расчетное (номинальное) или оптимальное значение критерия I_i. Итак, имеем «цепочку» (рис. 3.55)

Рис. 3.55 – К расчету критериев качества I_i

При сделанных допущениях оказывается, что средняя эффективность Э зависит только от состояний S_i, , возникающих в случайные моменты времени t на интервале [0, T₀]:

Э=Э(S(t)),

То есть, эффективность опосредственно определяется безотказностью и ремонтопригодностью всех элементов системы

Э=Э(S(l, m, t)),

где l, m - векторы интенсивностей отказов элементов .

Уточним теперь понятие эффективности. Назовем технической эффективностью свойство сложной системы достигать своей цели при учете потоков отказов и восстановлений её элементов и соответствующего ремонтного персонала. Соответственно показатель Э(S(l, m, t)) будет называться критерием технической эффективности сложной системы.

Так как для заданной системы значение критерия Э однозначно определяется надежностными характеристиками l, m всех элементов, то Э(S(l, m, t)) является количественной мерой надежности сложной системы, не имеющей формализованных понятий «работоспособность» и «отказ».

По смыслу критерия технической эффективности его максимальное значение достигается в состоянии S₁, когда исправны все элементы, а минимальное – в состоянии S_м, когда отказали все m элементов (рис. 3.56).

Рис. 3.56 – К определению минимального и максимального значения критериев качества I_i и эффективности : ○ – исправный элемент, ● – отказавший элемент

При любом произвольном S_i, i¹1, i¹M, критерий Э(S_i)=Э_i удовлетворяет нестрогому неравенству

, i=2, 3, … , M-1.

Остаётся получить формулу для вычисления критерия Э(S).

В произвольный момент t, система случайным образом оказывается в одном из состояний S_i, , а её мгновенная эффективность I принимает значение I_i. Обозначим вероятность нахождения системы в момент t в состоянии S_i через P_i(t), . Так как мгновенная эффективность I в момент t является дискретной случайной величиной, принимающей значения I₁, I₂,…, I_M, то её математическое ожидание или истинное среднее равно:

Далее легко определить среднюю техническую эффективность

Для вычисления Э требуется знание вероятностей P_i(t), .

Определение вероятностей состояния системы.

При известных интенсивностях l_ij, l_ji переходов системы из состояния S_i в любое другое состояние S_j, и обратно из S_j в S_i вероятности Р_i нахождения сложной системы в состоянии S_i, находятся как решения линейных дифференциальных уравнений Колмогорова

где в общем случае l_ij¹l_ji.

Сложная система всегда находится в одном из M состояний, поэтому для любого t и число дифференциальных уравнений можно уменьшить на единицу (для сложной системы M=2^m и число уравнений достигает нескольких сотен и тысяч).

Для решения системы уравнений надо задать M (или, точнее M-1) начальных условий P_i(0). Если считать, что система включается полностью исправной, то

P₁(0)=1, P_i(0)=0, .

Системы линейных дифференциальных уравнений высокой размерности целесообразно решать численно, используя для этого известные методы интегрирования, например, Рунге-Кутта 4-го порядка, или более точные явные и неявные методы Адамса с автоматическим выбором шага интегрирования.

При больших значениях времени t производные dP_i/dt становятся малыми и тогда дифференциальные уравнения можно заменить на линейные алгебраические

где - стационарная вероятность нахождения системы в состоянии S_i.

Так как в правую часть этого уравнения не входит , то оно разрешается относительно вероятности :

Анализ задачи оценивания технической эффективности.

Знание вероятностей P_i(t) и позволяет вычислить среднюю техническую эффективность системы:

и для стационарного режима системы

Критерии Э и имеют физическую размерность целевой функции I, что затрудняет сравнение эффективностей разных сложных систем с неоднородными показателями качества работы. В таких случаях удобно использовать безразмерный критерий технической эффективности:

или для стационарного режима

Эти критерии изменяются в интервале от 0 до 1 (здесь принято, что в состоянии S_M имеем I_M=0, а в состоянии S₁ вероятности P₁(t) и по договоренности равны 1, так как все m элементов системы работоспособны).

Из анализа задачи можно сделать ряд очевидных заключений:

1. Чем ближе к единице, тем более эффективна техническая

система, тем выше её надежность и ремонтопригодность в целом.

2. Если возможны r вариантов построения одной и той же сложной

системы из одних и тех же m элементов, и для каждого известны , r=1, 2, ... , r, то с позиции надежности наиболее предпочтителен вариант с наибольшим значением .

3. Если для решения некоторой проблемы создается несколько, например, две разные системы из разных элементов, и для них определены , причем , то с позиции надежности более выгодна система 1 с наибольшим значением критерия технической эффективности.

4. Если для двух разных систем соответствующие критерии ,

то целесообразно применять систему с наименьшей стоимостью изготовления и эксплуатации.

Анализ размерности задачи оценивания технической эффективности

Под размерностью задачи будем понимать число M возможных состояний системы, которое определяет число различных значений критерия I_i, , и вероятностей P_i(t) или , .

Число M состояний системы S_i существенно зависит от количества m входящих в нее элементов M=2^m (табл. 12).

Число элементов m
Число состояний М

Таблица 12

Зависимость числа состояний системы М от числа элементов m

Проанализируем в качестве примера трудоемкость задачи для m=16 ( система из 16 элементов – это «небольшая» система типа АСУТП). Для оценки технической эффективности системы из 16 элементов надо:

Знать: - критерий I,

- вектор интенсивности отказов l={l₁, l₂, … , l₁₆};

- вектор интенсивности восстановления m={m₁, m₂, … , m₁₆};

Определить:

- элементы матрицы интенсивностей переходов, размерностью 65536´65536;

- значения критерия эффективности I₁, I₂, … , I_i, … , I₆₅₅₃₆ (для этого 65536 раз выполняется расчет номинального режима или 65536 раз решается задача оптимизации I_i);

- функции P₁(t), P₂(t), … , P₆₅₅₃₆ (для этого численно интегрируется система из 65536 дифференциальных уравнений);

- значение Э₀ (находится с помощью квадратурных формул трапеций или прямоугольников).

Понятно, что даже при таком относительно малом m трудоемкость оценивания технической системы оказывается чрезвычайно высокой, а при увеличении m до 100 и более определение Э₀ рассмотренным методом становиться невозможным.

Высокая размерность задачи оценивания эффективности сложной системы негативно влияет и на свойства критерия , наиболее часто используемого при анализе и синтезе систем. Этот критерий представляет собой ограниченную кусочно-постоянную функцию 2m дискретных интенсивностей и способа соединения между собой элементов (структур и вариантов систем). Такая высокая размерность функции делает её малочувствительной к изменению состояний S_i, , что заметно затрудняет решение оптимизационных задач синтеза сложных систем.

При фиксированном состоянии S_i критерий в общем случае зависит от значения функционала I_I(x, y), который в свою очередь определяется режимными входными и выходными координатами X(t), Y(t). В состав вектора X(t) входят нагрузка, возмущения и управление. Обычно, при функционировании системы в номинальном («расчетном») и/или оптимальном режиме критерий I_i слабовыпуклый и имеет малую норму градиента . Слабая чувствительность I_i по переменным x, y позволяет считать критерий технической эффективности почти независимым или слабозависимым от режима функционирования системы в каждом состоянии S_i, и использовать при расчете Э₀ заранее рассчитанные значения I_i для номинальных режимов.

Понижение размерности задачи оценивания эффективности

Для понижения размерности задачи оценивания эффективности сложной системы следует уменьшать число М её возможных состояний S_i, . Сделать это можно разными способами, в частности, путем «укрупнения» элементов и уменьшения их числа m.

Метод «крупных» элементов – блоков. Для некоторых сложных систем (типа АСУТП, информационно-вычислительных систем и др.) можно ввести новые, более «крупные» элементы – блоки, объединяющие ряд исходных основных элементов. Для простейших потоков отказов и восстановлений элементов интенсивности отказов и восстановлений блоков находятся по известным формулам

где к – число основных элементов с интенсивностями , включенных в один блок.

Среднее число блоков равно отношению , поэтому при k»3-8 размерность задачи оценивания эффективности существенно снижается. Так, например, в системе из 20 исходных элементов возможны 2²⁰ =1 048 576 состояний. Если удастся создать блоки из k=5 элементов, то число блоков окажется равным четырем и количество «блочных» состояний станет равно 2⁴=16, следовательно размерность задачи снизится в раза.

Даже создание 10 блоков по 2 элемента каждый позволяет получить 2¹⁰ = 1024 “блочных” состояния и снизить размерность задачи оценивания эффективности в раза.

Метод критериальных состояний. Понижение размерности задачи здесь достигается за счет введения нового понятия состояние системы, что обеспечивает значительное (в 10-100 раз), уменьшение числа М состояний. Так, если известен диапазон (шкала) изменения критерия I(S, R) сложной системы, то можно выделить несколько непересекающихся поддиапазонов DI₁, DI₂,…, DI_m, …, DI_d, d<<M и рассматривать d новых критериальных состояний.

Под критериальным состояниемS_m понимается такая структура сложной системы и режим работы её элементов, при которых значение критерия I_m ÎDI_m, . В частности, при анализе эффективности распределенных АСУТП рекомендуется вводить 3 или 4 подинтервала: оптимальный и/или нормальный (номинальный), резервный и аварийный. Понятно, что при столь малых числах d проблема размерности задачи становится неактуальной: вычисление вероятностей критериальных состояний Р_m и значений I_m не вызывает затруднений . Однако при этом возникает дополнительная задача выявления связей между каждым техническим «элементным» состоянием S_j, и критериальным состоянием S_m^k, (рис. 3.57).

Рис. 3.57 – К понятию критериального состояния сложной системы

Метод функциональных состояний. Применяется при анализе эффективности сложных систем с четко указанными функциями (например, АСУТП с централизованной и распределенной технической структурой).

Предположим, что сложная система из m элементов выполняет l функций, l<<m, т.е. l в 10-100 раз меньше m. Пусть известны все элементы системы, реализующие каждую j-ю функцию, j=1,2,…, l и образующие при этом некоторую простую подсистему с формализованными понятиями работоспособности и отказа. Тогда можно ввести понятие функционального состояния системы h_j, однозначно определяемого числом и номерами отказавших функций. Общее число М_ф функциональных состояний системы равно 2^l.

При l<m и l<<m число функциональных состояний заметно уменьшается относительно числа М. Так, если l<0.5*m, то М_ф<<М. Например, при m=20 имеем М=1048576, l=0.5∙20=10, М_ф=2¹⁰=1024; тогда , следовательно число состояний системы уменьшилось в 65536 раз.

Как и методе критериальных состояний, здесь возникает дополнительная (причем достаточно сложная) задача выявления связей между состоянием каждого элемента или техническим «элементным» состоянием S_i, и функциональным состоянием S_ф (рис. 3.58).

Рис. 3.58 – К понятию функционального состояния сложной системы

Помимо рассмотренных выше методов существуют еще несколько приемов уменьшения размерности задачи оценивания эффективности сложных систем, заключающиеся в объединении ряда элементов в небольшое число групп по тем или иным признакам, в частности по значениям стационарных вероятностей и введении понятия группового состояния системы S_m^г, m=1,2, …, к_г. Число групп обычно на порядок меньше числа технических элементов m, что существенно (на 2-3 порядка) уменьшает число групповых состояний и снижает трудоемкость определения . Вместе с тем использование групповых состояний S_m^г влияет на точность вычисления (чем меньше групп, тем больше погрешность определения ) и требует выявления связей между каждым элементным состоянием S_i, и групповым состоянием S_m^г, .