ЭКСПЛУАТАЦИЯ ИНФОРМАЦИОННЫХ СИСТЕМ
Износ и деградация систем. При плановой замене вычислительных и всех других средств необходимо постоянно учитывать и так называемый износ - утрату средствами обработки информации их потребительской стоимости (рис. 3).
| |||||||||||||||||||||
|
|
|
|
Рис. 6.2. Классификация видов износа
Различают два вида износа: физический и моральный. Под физическим износом понимают снижение или полную утрату изделием своих первоначальных качеств. При этом физический износ имеет место, как при использовании, так и при отсутствии такового, т.е. при простое. Износ технических средств при их использовании является естественным и особых разъяснений не требует. Программные средства при их использовании не изнашиваются. В случае бездействия износ технических средств все равно имеет место вследствие воздействия колебаний температуры и движения воздуха, старения материалов, из которых построены технические средства, и т.п. Именно по этим причинам все средства имеют ограниченный срок хранения.
Изделие постепенно теряет свои свойства - наступает его частичный износ. Скорость и степень износа определяются интенсивностью влияния разрушающих факторов, с одной стороны, и активностью обслуживания и ремонтных мероприятий - с другой. Однако наступает такое состояние изделия, когда ремонт уже не в состоянии вернуть ему его свойства - это полный износ. В этих случаях требуется замена изделия.
На ремонтные работы затрачиваются ресурсы: рабочее время, материалы и комплектующие. При нарастании проявлений износа требуется увеличить объем работ по его устранению и затраты на обслуживание. При достижении определенного состояния изношенности дальнейшее использование изделия станет неэффективным или даже убыточным и изделие следует заменить, что тоже потребует затрат. Физический износ I рода проявляется в снижении надежности, II рода - в снижении годовых эффективных фондов времени. Проведение планового технического обслуживания может давать заметное повышение надежности и тем самым снижение числа аварийных ситуаций и объема соответствующих ремонтных работ.
Наряду с физическим имеет место и моральный износ, также I и II рода. Износ I рода проявляется тогда, когда себестоимость производства такого же изделия снижается и оно может быть приобретено дешевле, чем используемое в настоящее время. Моральный износ II рода обусловлен научно-техническим прогрессом и появлением новых, более производительных и совершенных средств, имеющих лучшие пользовательские качества. Это приводит к изменениям в технике, технологии производства работ и в организации использования СИ. В последние годы во всех новых поколениях средств ОИ существенно улучшается показатель «цена/производительность». В связи с этим использование морально устаревших средств невыгодно.
Это еще раз показывает, что простои средств обработки информации всегда невыгодны: даже будучи в хорошем техническом состоянии, они не дадут их владельцу возможности выстоять в конкурентной борьбе и, более того, они будут прямо или косвенно приносить владельцу убытки.
Обобщая сказанное, можно заметить, что в сложных системах, состоящих из множества разнородных элементов, проявление износа их частей может быть различным: одни могут быть совершенно новыми и самого высокого на данный момент уровня, другие - изношенными и устаревшими, третьи - новыми, но устаревших моделей и т.д.
Организация системы - одно из ее качеств; она тоже может устаревать и становиться неэффективной. В связи с этим для характеристики степени износа сложных систем в целом более подходящим представляется понятие деградация. В качестве меры деградации можно понимать соотношение качеств и свойств рассматриваемой системы как в целом, так и по составляющим ее элементам с достигнутым на данный момент уровнем этих свойств и качеств, идеальным или реализованным в каких-либо известных вариантах систем, которые могут приниматься за эталон или за идеал.
Оценка степени износа или деградации системы - проблема не из простых. Для определения степени как физического, так и морального износа могут привлекаться экспертные оценки. В то же время могут использоваться и сведения о средних сроках службы, объемах выпуска новых поколений аналогичных средств, тенденциях применения тех или иных средств конкурирующими фирмами. Весьма информативными могут быть также данные о росте затрат на обслуживание: для планово-профилактических мероприятий и для устранения сбоев, отказов и аварийных ситуаций.
Интенсификация использования ресурсов. При оценке интенсивности использования ресурсов необходимо учитывать степень напряженности технологического процесса ОИ, а также организационные основы соответствующих подразделений и процессов. При этом в значительной степени может быть использован опыт, накопленный в отечественных ВЦ и АСУ.
Как в ВЦ, так и на предприятии в целом следует организовать определенный технологический процесс обработки информации и поддерживать требуемый уровень его эффективности. Необходимый для этого информационный менеджмент может строиться по аналогии с менеджментом производства продукции с заданными показателями процесса производства. Он включает: планирование, контроль (наблюдение), управление средствами производства в информационной инфраструктуре системы.
Особое значение здесь имеет управление ресурсами (менеджмент ресурсов или мощностей): в соответствии с технологическим процессом необходимо иметь в распоряжении нужные средства к определенному времени и на определенное время. Однако для ИТ свойственна высокая степень неритмичности, что обусловлено наличием множества «разнокалиберных» задач, высоким уровнем случайности обращений к ресурсам по многим из них, случайным характером потребностей в ресурсах даже для одной и той же задачи в разных ситуациях, как правило, относительно невысоким уровнем технологической культуры в сфере ИТ многих пользователей и т.д.
При этом каждый пользователь и каждая задача должны получить возможность выдать своему заказчику ожидаемый от них результат с высокими показателями эффективности. Это весьма непростая проблема для любой, даже вполне ритмично работающей и имеющей достаточные резервы мощностей системы; для сложных многопользовательских неоднородных ИС она становится одной из центральных.
Управление ресурсами предусматривает постоянное наблюдение и анализ реакций системы. Для этого необходимо описать информацию, используемую для выявления состояния системы ОИ и прикладных систем. Это могут быть периодически вводимые в систему специальные сообщения, автоматически выдаваемые служебные сообщения, а также сообщения, вырабатываемые по запросу. Во всех вариантах распределения и использования ресурсов необходимы определение всех видов затрат и контроль производительности как по отдельным операциям ИТ, так и по системе в целом.
В простейшем случае интенсивность использования ресурсов можно оценить в виде отношения:
,
откуда следует, что для повышения интенсивности ресурсов нужно сокращать долю времени, затрачиваемого на собственные нужды ТНЭ, и снижать брак, т.е. время ТНПР . Это вполне очевидно. Однако при этом в явной форме не учитывается мощность ресурса - работа, которая может быть выполнена им в единицу времени. Система в совокупности может быть охарактеризована некоторой достижимой потенциальной мощностью, которую она может развить в том или ином процессе. Эту характеристику определить совсем не просто, так как она включает не только мощности входящих в нее элементов, но учитывает особенности организации взаимодействия. Тем не менее, определив тем или иным способом (на основе элементарных действий, по стандартным тестам и т.п.) мощности элементов, можно оперировать этими характеристиками при расчете мощности как частей системы -подсистем, так и системы в целом.
Конечно, оценка степени использования ресурса системы в целом или ее части в виде показателя загрузки соответствующих мощностей представляет значительный интерес своей наглядностью: приобретенный новый процессор должен работать на пределе производительности; сканер должен сканировать не только все время, но и с использованием в полной мере всех его характеристик; сеть следует загружать, базы данных использовать и т.д.
Вычислить мощность и производительность можно далеко не всегда. Поэтому могут использоваться и статистические оценки показателей на основе стандартных процедур контроля производительности в активном или пассивном эксперименте. Задав такие оценки в качестве начальных значений нормативов, можно в процессе контроля и анализа параметров реальных процессов обработки информации развивать и совершенствовать нормативную базу управления использованием ресурсов ИС.
Обслуживание систем. Обслуживание ИС требует организации контроля их состояния. Однако характер контроля в ИС имеет существенные особенности. В классической постановке контрольные мероприятия ориентированы на результат деятельности, здесь первичной является ориентация на поставленную конечную цель. В соответствии с этим при организации контроля в ИС необходимо задать следующее: механизм образования системы целей для ОИ, принципы структурирования информационных и коммуникационных систем, направления развития требований к измерениям характеристик состояния системы, способы формирования модели контроля.
При таком методическом обеспечении может осуществляться проверка ИС или системы ОИ как часть общего комплекса контрольных мероприятий и проверок на предприятии. Сложность объекта проверки требует создания подходящих инструментальных (технических и программных) средств, например специальных утилит, экспертных систем и т.д. В интересах контроля применяются различные методы получения данных: анализ документов, устные опросы, письменные отчеты, тестирование прикладных систем, специальные испытательные системы и технологии и др.
Все шире внедряется дистанционное обслуживание ЭВМ и других технических средств. Восстановление вычислительного процесса после сбоев и сохранение и восстановление баз данных во многом обеспечиваются операционными системами. Организацию обслуживания обеспечивают ведение журнала эксплуатации ЭВМ и другая эксплуатационная документация.
Как объект обслуживания ИС имеет определенные специфические эксплуатационные свойства. В ИС сложно назначить нормы эксплуатационных показателей: нормы долговечности и технологического обслуживания, распределение норм надежности по компонентам системы. Однако можно построить систему технического обслуживания в составе подсистем профилактики и восстановления; на основе теории надежности могут быть определены нормы запасных элементов из условия достаточности, а также выполнен расчет экономически оптимальных норм запасных элементов [6].
Менеджмент данных. В настоящее время практически на всех предприятиях имеются достаточно обширные и разветвленные структуры данных. В совокупности накопленные данные начинают представлять все большую ценность для любого предприятия. Для многих предприятий данные со временем могут стать основной их ценностью. В связи с этим на предприятии необходимо организовать и постоянно осуществлять менеджмент данных.
Задачами менеджмента данных могут быть: участие в формировании структур данных, совершенствование информационных структур, прием и занесение данных в соответствующие компоненты информационной структуры (банки данных, базы знаний и др.), устранение выявленных (возникших) ошибок в данных, обеспечение адекватной комплексной защищенности данных, предоставление копий блоков данных в соответствии с ИТ, контроль данных, представляемых для помещения в банки (данные должны быть полными, актуальными, ценными, содержательными, качественными и т.п.), создание и ведение каталога данных и иных средств сервиса, предоставляемых потребителям данных.
С учетом особой важности для предприятия функции менеджмента данных, как правило, за его осуществление отвечает одно лицо - администратор данных. Для обеспечения успешного выполнения этих функций должна быть создана и постоянно находиться в распоряжении менеджера (администратора) данных специальная технология работы с данными, реализующая названные выше функции менеджмента на технологическом уровне. Это должны быть средства: ведения каталога; формирования структуры (архитектуры) данных; анализа данных по различным аспектам; менеджмента копирования и выдачи; приема, занесения и корректировки; обслуживания пользователей путем локализации и защиты их данных» предоставления инструментальных средств; проектирования и создания банков данных. По целому ряду функций на рынке предлагаются средства их поддержки.
Менеджмент данных не является ни в составе ИМ, ни на фирме в целом некой обособленной локализованной функцией управления, он должен пронизывать все предприятие. В связи с этим важно создание в сфере обращения данных полной и сбалансированной правовой базы. Именно в этой сфере ощущаются значительные недостатки, пробелы и упущения.
Одной из основных проблем менеджмента данных, если вообще не ключевой, является обеспечение защищенности данных, которое вписывается в проблему обеспечения комплексной защищенности ИС. Понятие «защита данных», принятое в отечественной практике (и в литературе) как основное, является весьма емким и нуждается в детализации. Необходимо также рассматривать в контексте защищенности данных все технические и технологические мероприятия, препятствующие потере, порче, искажению данных, несанкционированному доступу к ним и их недозволенной передаче куда-либо и кому-либо.
На предприятии эти мероприятия служат прежде всего целям охраны его «фирменных» секретов.
Кроме того, на каждом предприятии должна быть выработана стратегия менеджмента данных в условиях катастроф. При этом необходимо заранее оценить последствия катастроф, определить степень уязвимости данных в таких ситуациях, проанализировать возможности и пути минимизации воздействия катастроф на данные, определить приоритеты и индексы защиты для всех информационных компонентов и т.д. На этом основании нужно заранее разработать ИТ, учитывающие характер воздействия на систему рассматриваемого бедствия и предназначенные для применения во время катастроф. Должны быть при этом определены все лица, принимающие решения, круг их полномочий и компетенция, а также конкретные мероприятия по переводу системы в такой специальный режим и график их проведения. Далее должен вводиться специальный режим по преодолению воздействия катастрофы и ликвидации ее последствий с учетом оценки реальной ситуации: передача данных и других компонентов ИС на другой ВЦ, ввод в действие резервных мощностей, мобилизация работников и т.п.
Для отечественной практики затруднительно даже приблизительно оценить стойкость предприятия при катастрофах. В среднем по ФРГ предприятие могло тогда «прожить» при тотальном выходе из строя ИС только 4,8 дня. Этот весьма короткий срок свидетельствует о том, что ИТ и ОИ играют на предприятиях ФРГ значительную роль. По-видимому, эта роль на предприятиях нашей страны менее значительна, поэтому их стойкость по отношению к тяжелым происшествиям с ИС должна оказаться выше.
Анализ специфики ИТ, особенностей организации ИС предприятия и их взаимодействия с функциональными подразделениями показывает необходимость создания специальной технологической среды, обеспечивающей реализацию целей и задач ИМ. Основой такой среды может быть специализированное автоматизированное рабочее место. В составе первой очереди ИС возможно ограничиться одним комплексом АРМ, реализующим основные цели и задачи ИМ в той их совокупности, которая будет признана первоочередной.
6.2. ЭКСПЛУАТАЦИЯ СИСТЕМ «ЧЕЛОВЕК-МАШИНА»
6.2.1. СИСТЕМЫ «ЧЕЛОВЕК-МАШИНА»
В системах на основе ЭВМ значительное место занимают специфические вопросы согласования работы человека - «оператора» - и технологической части системы - «машины». Как самостоятельная проблема «человек-машина» возникла в явном виде совсем недавно. Обусловлено ее возникновение целым рядом факторов научно-технического прогресса:
– человека-оператора нельзя исключить ни из одной системы, сколь бы автоматизированной она ни была, остается хотя бы один человек;
– системный подход к изучению трудовой деятельности привел к выделению пограничной среды контакта «человек-машина» или системы «человек-машина» (СЧМ) в качестве самостоятельного поля научной деятельности, к появлению науки эргономики, объектом которой стала система «человек-машина-среда»;
– бурное развитие ЭВМ и информатизация общества ставят совершенно новые задачи перед разработчиками систем, базирующихся на ЭВМ;
– одной из коренных проблем человекомашинных, или эргатических, систем является повышение их надежности;
– значительное расширение круга операторских профессий, в которых ту или иную роль играют комплексы на основе ЭВМ;
– общее углубление представлений о взаимодействии человека и машины в процессе трудовой деятельности;
– неопределенность информации, лежащей на стыке наук (или сфер);
– машины могут предъявлять к человеку «нечеловеческие» требования. В результате стали раздаваться голоса, что «человеческий фактор» становится тормозом процесса. Однако автоматы, как оказалось, могут не все, а человек кое в чем превосходит машины: он хорошо учитывает случайный характер явлений, может предсказать их развитие и др.;
– вопросам создания вычислительной техники (вообще - машин) уделяется много внимания проектировщиками, вопросами же организации контакта «человек-машина» занимаются гораздо меньше;
– возрастание цены ошибки оператора при очевидной невозможности все автоматизировать как по требованиям обеспечения надежности, так и из-за необходимости обеспечить разумную стоимость.
Эти и другие аналогичные соображения привели (около 30 лет назад) к появлению цикла научных дисциплин, предметом которых являются те или иные аспекты взаимодействия человека и машины, как в общей постановке, так и применительно к приложениям в конкретных областях. К числу этих дисциплин относятся инженерная психология, теория эргатических систем, эргономика, техническая эстетика, системы отображения информации и др.
В настоящей книге основное внимание уделено вопросам, касающимся контакта «человек-ЭВМ». Здесь можно выделить следующие проблемы:
• эргономическое проектирование систем, т.е. проектирование систем на основе ЭВМ с учетом «человеческого фактора»;
• инженерно-психологические исследования работы на ЭВМ как специфической трудовой деятельности;
• определение рационального разделения функций между человеком-оператором и программно-технической средой СЧМ.
Эргономическое проектирование. По существу этой проблемы необходимо согласовать с «человеческим фактором» все вопросы ввода-вывода (темп, формы представления и т. д.) и отображения информации; клавиатуры и другие органы управления; средства коммуникации; конструктивное исполнение устройств. В этих системах важную роль играют вопросы технической эстетики, целесообразного формирования предметно-пространственной среды (формы и контуры устройств, компоновка основных блоков, специальная мебель для оснащения рабочего места оператора, формирование окружающего его пространства). Специфические системы должны создаваться для операторов, работающих в экстремальных условиях. Широко разрабатываются в СЧМ специальные системы отображения информации - индикаторные и информационные панели, экраны, проекторы, пульты и т.д. с использованием различных технических средств.
Для пользователей универсальных ЭВМ круг этих вопросов сужается, естественно, до вопросов формирования пользовательского интерфейса, экранных форм и т.д. Однако и эти вопросы являются важными, если оператору в этой среде приходится работать длительное время и принимать важные решения. В задачах использования таких мощных средств, какими являются ЭВМ, необходимо тщательно учитывать все нюансы, в том числе и то, что в системе «человек-ЭВМ» функционирует человек как элемент.
Инженерно-психологический аспект. В инженерной психологии речь идет прежде всего об исследовании свойств человека-оператора в той или иной среде трудовой деятельности. В этот аспект входит или тесно к нему примыкает исследование даже физиологических процессов, обусловленных именно контактом человека с машиной в СЧМ (утомляемость, производительность и т.д.), для чего широко исследуется зрительный анализатор в самых различных аспектах: биомеханическом, нейрофизиологическом, кибернетическом и т.д.
Заметно расширились биомеханические и физиологические исследования нервно-мышечного аппарата в различных условиях как интеллектуальной, так и физической операторской деятельности. В этом круге вопросов решаются проблемы совершенствования размещения органов управления и систем отображения информации, оцениваются затраты нервно-мышечной энергии, напряженность рабочих поз и утомляемость оператора, сопоставляются различные компоновки оборудования рабочего места и т.д.
Исследование человека-оператора как элемента СЧМ, в конце концов, позволяет определить его различные характеристики: статические, динамические, информационные, логические, энергетические и т.д. На основе полученных при этом данных в ряде случаев составляется математическая модель оператора. Варианты моделей могут быть самыми разными. Так, иногда оператор отображается передаточной функцией W^(s), т.е. эквивалентной линейной динамической системой, отражающей его специфические свойства: способности к прогнозированию, инерционность, запаздывание в обработке информации; например, передаточной функцией вида
,
где t - время «чистого» запаздывания;
аk и bi - коэффициенты.
Эта модель используется при работе оператора в динамических системах управления процессами. В ряде ситуаций оператор описывается логической моделью, тем или иным автоматом, алгоритмом и т.п. Такие подходы приняты при описании оператора, участвующего в процессах ОИ и принятия решения.
Математическая модель оператора включается в модель СЧМ при исследовании системы в целом с учетом «человеческого» фактора. Такие «модельные» исследования позволяют значительно сократить натурную отработку систем, включающих оператора, и найти основные проектные решения по параметрам ЭВМ и оператора, т.е. предъявить требования к его состоянию здоровья, физиологическим параметрам, квалификации, характеру образования и подготовке.
Разделение функций в системе «человек-машина». Проблема разделения функций в системе «человек-ЭВМ» между оператором («человеком») и ЭВМ («машиной») должна специально изучаться и конкретно разрешаться. При расширении в СЧМ круга функций ее программно-аппаратного комплекса потребуются изучение и моделирование всех процессов, происходящих в системе. Алгоритмизация и программирование моделей потребуют Дополнительных затрат на проектирование системы. Для реализации потребуется более мощная ЭВМ. Таким образом, произойдет удорожание СЧМ в целом, что нежелательно.
При расширении круга функций оператора возрастают требования к его квалификации, обученности, состоянию в процессе деятельности. В ряде случаев могут происходить сбои (срывы) в Деятельности оператора по той или иной причине, в частности в экстремальных ситуациях: увеличение темпов представления информации оператору или ее объема выше допустимого предела приведет, в конце концов, к ошибочным реакциям (действиям, решениям), т.е. к ошибкам оператора. В результате в СЧМ может иметь место авария или даже катастрофа.
Таким образом, задача разделения функций между оператором и ЭВМ, как правило, - задача оптимизационная, решение которой отыскивается как компромисс. В качестве критерия оптимальности может рассматриваться, в частности, надежность выполнения системой ее функций в форме наиболее подходящей к случаю характеристики. Как у оператора, так и у ПАК с расширением круга функций снижается надежность.
При рассмотрении в целом СЧМ как системы с обратными связями необходимо учитывать, что совместно человек-оператор и ЭВМ реализуют в системе некоторый заданный набор функций, которые в процессе работы или при проектировании могут перераспределяться. При расчете надежности будет справедлива последовательная схема, в которой с ростом числа функций и снижением надежности одного элемента уменьшается число функций другого элемента и повышается его надежность, поэтому можно представить некоторое оптимальное по надежности распределение функций [18].
Аналогичные задачи приходится решать, например, при обслуживании ИС, пусконаладочных работах, тестировании или регламентных работах: можно тестировать ЭВМ как автоматически, так и «вручную», т.е. с пульта. Однако это давно не практикуется. Создаются специальные тестирующие программы. Их включают в состав АРМа оператора в среде ЭВМ, с помощью которого и осуществляется тестирование на заданную глубину. Более того, все больше функций контроля состояния ЭВМ автоматически реализуется аппаратно, т.е. с использованием специальных встроенных избыточных элементов, реализующих автоматический контроль.
Определение уровня избыточности в технических средствах, разделение функций между программной и аппаратной средой и, наконец, разделение функций между оператором и ПАК - эти вопросы решаются при проектировании и при организации эксплуатации системы.
6.2.2. НАДЕЖНОСТЬ СИСТЕМЫ «ЧЕЛОВЕК-МАШИНА»
В работе информационных систем возможны сбои, отказы, другие ситуации, проводящие к невыполнению системой ее функций. Менеджеру в таких условиях следует опираться на адекватные модели, или описания, происходящего.
Для упрощения описания ситуаций и повышения наглядности получаемых результатов обычно принимаются следующие допущения [6]:
1) появление отказа технологической части системы и возникновение ошибки оператора являются взаимно независимыми редкими случайными событиями, т.е. появление двух и более одноименных событий за период времени (t, t+Dt) работы системы практически невозможно;
2) способность оператора работать без ошибок и возможность компенсации им возникших за период времени (t, t+Dt) ошибок являются взаимно независимыми его свойствами.
Ниже приводятся типовые ситуации анализа надежности систем. В качестве характеристики надежности при этом используется вероятность безотказной работы. Как известно, на ее основе с помощью известных преобразований могут быть получены и все другие стандартные характеристики.
Первый вариант – системы с некомпенсируемыми ошибками оператора и неустранимыми отказами технологической части. Надежность таких систем, естественно, является минимальной. Она может повышаться как за счет роста потенциальной надежности технологической части системы, так и за счет повышения надежности работы оператора как компонента системы (эти мероприятия здесь не рассматриваются).
Человеко-машинная система исправна в какой-то момент или на интервале времени, если оператор не допустил ошибки и при этом исправна технологическая часть системы. Тогда вероятность (p1(t, t+Dt)) безотказной работы человеко-машинной системы на интервале Dt времени от момента t1 до момента t2=t1+Dt с учетом принятых допущений определяется выражением
P1(t+Dt)=Pt (t1, Dt)p0(Dt) (6.5)
где Pt (t1, Dt) – вероятность безотказной работы технологической части системы в течение интервала времени (t, t+Dt);
p0(Dt) – вероятность безошибочной работы оператора (или операторов) на интервале времени Dt, которая определяется при условии, что при этом технологическая часть системы работала безотказно;
t1 – полное время, прошедшее от начала использования системы до начала рассматриваемого интервала Dt, который, в свою очередь, может характеризовать, например, рабочую смену в комплексной системе, сеанс связи, время выполнения того или иного приложения в системе и т.п.
Здесь оба сомножителя – невозрастающие функции. Однако первый сомножитель Pt (t1, Dt) уже в начальный момент t1 может быть меньше единицы, поскольку он отражает ресурс надежности системы, оставшийся у нее к этому моменту вследствие износа. Сомножитель p0(Dt) тоже убывает со временем, но его начальное значение равно единице, поскольку обычно оператор приступает к работе, находясь в функционально работоспособном состоянии. Убывание функции p0(Dt) отражает снижение работоспособности оператора со временем, обусловленное его утомлением, воздействием посторонних факторов, увеличением в процессе работы объема информации, подлежащей обработке для принятия решения, и тому подобными причинами.
Второй вариант – системы с возможностью частичной компенсации ошибок оператора: оператор, допустивший ошибку в работе и вовремя заметивший ее появление, тут же ее исправляет. Во многих случаях создатели системы такую возможность обеспечивают, по крайней мере, для некоторых ошибок и для типовых условий их возникновения. В этих условиях можно принять, что такие ошибки оператора устраняются им мгновенно.
Если возникающие отказы технологической части системы при этом не устраняются, то система в целом исправна тогда, когда не возникло отказа в технологической части и оператор или не совершил ошибочных действий, или допустил ошибку (ошибки), но тут же заметил ее (их) и мгновенно устранил. Тогда для определения вероятности безотказной работы всей системы справедлива следующая формула:
p2(t1, Dt) = pT(t1, Dt) {p0(Dt)+[1-p0(Dt)]r}, (6.6)
где r - вероятность устранения ошибки, допущенной оператором;
1-p0(Dt – вероятность ошибки оператора;
[1-p0(Dt)]r - вероятность совмещения ошибки оператора и факта ее мгновенного устранения, т.е. приращение вероятности безошибочной (или безотказной) работы оператора в течение рассматриваемого интервала времени.
Из сопоставления формул (6.5) и (6.6) видно, что p2(t1, Dt) > p1(t1, Dt), хотя возможно и p2(t1, Dt) à p1(t1, Dt), когда r à 0. это бывает при снижении возможностей оператора устранить допущенную им ошибку по всем составляющим этого процесса: выявление, идентификация, устранение, каждая из которых характеризуют определенные грани квалификации оператора. Как видно, обеспечивая для оператора квалифицированную , структурную и технологическую возможность так называемого быстрого отката, позволяющего ему просто и быстро отказаться от замеченных ошибочных действий, создатели ИС могут ощутимо повысить ее надежность.
Третий вариант – системы с возможностью компенсации отказов технологической части системы при невозможности устранения ошибок оператора: в сложных, т.е. многоэлементных и имеющих разнообразные и множественные внутренние и внешние связи, системах обычно предусматриваются специальные возможности ля автоматического устранения, по крайней мере, некоторых из возможных отказов. Так в системах обеспечивается свойство отказобезопасности, когда какое-то определенное число отказов не приводит к нарушению работоспособности системы как таковой. Контроль запаса надежности позволяет подкреплять надежность таких систем во время их исправной работы даже дистанционно, не ожидая глобального их отказа.
Это характерно, например, для современных ЭВМ и их базовых программных средств, в частности операционных систем, причем чем мощнее комплекс, тем более развиты в нем средства обеспечения отказобезопасности (см. например, краткое описание свойств операционной системы MVS/390 мейнфреймов серии ES/9000 фирмыIBM в [20]).
В условиях рассматриваемой задачи общей оценки надежности человеко-машинных систем все эти средства формируют величину pT(t1, Dt).
Кроме указанных возможностей, заложенных в технологической части системы, определенные возможности и функции оператора могут использоваться не только при управлении системой, но также и в сфере устранения ошибок или отказов технологической части системы. По-видимому, в ряде ситуации заметив отклонения в работе каких-либо технологических комплексов, человек-оператор может определить причины возникновения этих отклонений и подать управляющие воздействия в целях компенсации нештатных явлений или просто устранить возникший отказ. Так, обнаружив, что какая-то часть технологического комплекса системы начинает проявлять тенденцию к выходу из нормального режима работы, оператор может вывести ее из состава системы, ввести замену из резерва и таким образом сохранить работоспособность системы в целом. Однако очевидно, что оператор может компенсировать только некоторые неисправности и при условии, что он их заметил, идентифицировал и в состоянии компенсировать.
С позиции оператора отказ проявляется в системе в виде выхода на недопустимое значение некоторых контролируемого параметра, который может быть векторным, комплексным или составным; свойства которого и определяют алгоритмы компенсации оператором последствий отказа. Вмешательство оператора в целях компенсации проявления отказа можно представить тоже в виде некоторого случайного процесса hk(t). Если для обработки ситуации и выявления отказа оператору требуется время t k, то изменение параметра после вмешательства оператора будет описываться случайным процессом
Dh(t) = hT(t) - hT (t-tk).
Для каждой системы ее исправное состояние соответствует пребывание отклонения определяющего параметра Dh(t) в заданной области D, т.е.
Dh(t) ÎD (6.7)
Поскольку значение tk в каждой ситуации зависит от варианта комбинации состояний элементов и свойств оператора в части определения отказа, оно является случайным и может быть, в частности, недопустимо большим при эксплуатации системы. в связи с этим оператор в состоянии компенсировать только некоторые отказы в приемлемое время.
Описать приращение вероятности безотказной работы технологической части системы можно в виде условной вероятности py(t1, Dt, d) безотказной работы этой части системы в течение интервала (t1 , t1+Dt), определяемой при условии, что в некоторый момент d, где t1<d< t1+Dt, в ней произошел отказ, который обнаружен, идентифицирован и компенсирован оператором.
Тогда для расчета вероятности безотказной работы системы в таких условиях p3(t1, Dt) можно использовать следующую формулу:
p3(t1, Dt)= p0(Dt)[ pT(t1, Dt)+ pY(t1, Dt, d)], (6.8)
где сохранены и все ранее введенные обозначения.
Как видно из сопоставления выражений (6.5) и (6.8), обычно
p3(t1, Dt)> p1(t1,Dt), хотя возможно и p3(t1, Dt)à p1(t1,Dt), когда pY(t1, Dt, d)à 0, что бывает при снижении возможностей оператора по всем составляющим (выявление, идентификация, устранение) при компенсации отказов технологической части ИС.
Четвертый вариант – система с коррекцией ошибок оператора и компенсации отказов технологической части. Для определения вероятности ее безотказной работы в таких условиях p4(t1, Dt) на интервале (t1 , t1+Dt) в выражении (6.8), которое может рассматриваться как базовое, в качестве сомножителей p0(Dt) и pT(Dt) следует использовать расширенные выражения для них формул (6.6) и (6.8) соответственно. Тогда можно записать следующее выражение:
p4(t1, Dt)= {p0(Dt)+[1- p0(Dt)]r}[pT(t1, Dt)+ pY(t1, Dt, d)], (6.9)
где сохранены все обозначения. С учетом соотношений (6.5) , (6.6) и (6.8) выражение (6.9) можно представить в виде следующего равенства:
p4(t1, Dt)= p2(t1,Dt)+pY(t1,Dt, d){p0(Dt)+ [1- p0(Dt)]r}=
= p3(t1, Dt)+r[1- p0(Dt)][ PT(t1, Dt)+ pY(t1, Dt, d)]=
= p1(t1, Dt)+ pY(t1, Dt, d) p0(Dt)+ r[1- p0(Dt)][ pT(t1, Dt)+ pY(t1, Dt, d)[1- p0(Dt)].
Сопоставление выражений (6.6) и (6.9) показывает, что обычно p4(t1, Dt)> p2(t1, Dt), хотя возможно и p4(t1, Dt) à p2(t1, Dt), когда pY(t1, Dt, d)] à0. Аналогично сопоставление выражений (6.8) и (6.9) дает, что p4(t1, Dt)> p3(t1, Dt), хотя при rà0 p4(t1, Dt) à p3(t1, Dt).
Очевидно, возможно и p4(t1, Dt)à p1(t1, Dt), когда pY(t1, Dt, d)à0 и rà0, что также справедливо при определенных условиях.
Здесь можно отметить, что в приведенных выражениях члены p0(t1, Dt) и pT(t1, Dt) отражают характеристики надежности основных элементов системы и являются базовыми: на них строятся оценки достигнутого уровня надежности и соответственно – качества системы. Поэтому именно они характеризуют основной порядок значений вероятности и должны быть как можно ближе к единице. Величины r и pY(t1, Dt d) характеризуют факторы, которые позволяют повысить надежность за счет использования специфических свойств оператора как элемента системы в части его активного воздействия на технологические элементы комплекса человеко-машинной системы. Представленные и аналогичные модели могут обеспечить повышенные качества управления в текущих условиях и сформировать стратегические концепции для ИС по ее основным компонентам.