Краткие теоретические сведения. 1. Под контролем в вычислительных системах понимают процессы, обеспечивающие обнаружение ошибок в их функционировании

1. Под контролем в вычислительных системах понимают процессы, обеспечивающие обнаружение ошибок в их функционировании, вызванных отказами аппаратуры, сбоями в работе программного обеспечения или другими причинами. В сочетании с мероприятиями по резервированию контроль является одним из самых эффективных средств повышения надежности и достоверности обработки информации.

Средства контроля вычислительных и информационных систем подразделяются на аппаратные, программные и смешанные. Они характеризуются полнотой (глубиной) контроля, временем обнаружения ошибки и сложностью.

Полнота контроля оценивается как доля отказов, обнаруживаемых в результате контроля, от общего их количества. Время контроля определяется как интервал времени от момента возникновения ошибки до момента ее обнаружения. Сложность средств контроля характеризуется массой, габаритами, стоимостью, памятью, потребляемой энергией и другими параметрами.

По характеру контроль в ИС подразделяется на оперативный и тестовый.

Оперативный контроль осуществляется в ходе решения задач и позволяет в процессе их решения практически немедленно обнаруживать ошибку. Однако оперативный контроль в принципе неполный, поскольку выполняется на случайных, не приспособленных для целей контроля задачах. Тестовый контроль осуществляется в специально отведенные промежутки

времени на основе решения специальных, тестовых задач. Он основан на тестах, обеспечивающих полный контроль всех элементов системы (аппаратуры, команд программы) за короткое время. Недостаток тестового контроля – потеря дополнительного процессорного времени, расходуемого на тесты.

По объекту контроля различают контроль аппаратуры (АЛУ, функциональные преобразователи, память, управление, ввод-вывод), программного обеспечения и работы операторов. Поскольку все виды контроля имеют определенные ограничения, на практике применяют их сочетания.

2. На основании известных значений интенсивностей отказов и восстановлений можно поставить и решать задачу о надежности системы «контролирующее устройство - объект контроля».

Пусть система может находиться в состояниях 00, 01, 10, 11 с вероятностями р00, р01, р10, р11, где первый индекс показывает состояние контролирующего устройства, а второй - состояние объекта контроля (0 – работоспособное состояние, 1 - состояние отказа). Граф состояний такой системы приведен на рис. 5. Обозначения на графе имеют следующий смысл: λ0, λк интенсивности отказов объекта контроля и контролирующего устройства; μк, μ0, μ01 - интенсивности восстановления соответственно контролирующего устройства, объекта контроля при работоспособном контролирующем устройстве, объекта контроля при отказавшем контролирующем устройстве:

 

 

 

Рис. 1. Граф состояний отказоустойчивой системы с непрерывным контролем.

 

Для определения коэффициента готовности системы необходимо составить систему дифференциальных уравнений Колмогорова и решить ее при помощи преобразований Лапласа или одним из численных методов. В частности, в стационарном режиме dPij/dt=0 и, следовательно, решается система линейных алгебраических уравнений относительно вероятностей состояний (методом Гаусса или исключения переменных). В результате получаем значение коэффициента готовности системы с контролем:

 

kгк=р00+р10.

 

 

Задание на работу

1. Освоить основные методы аппаратного и программно-логического контроля в вычислительных системах.

2. Для отказоустойчивой системы с непрерывным контролем, граф состояний которой приведен на рис. 5, определить коэффициент готовности. В расчетах принять значения интенсивностей отказов в пределах 10-6 - 10-4 1/ч, интенсивностей восстановления - 0,01-1,0 1/ч. Для сравнения получить величину коэффициента готовности системы без контролирующих устройств.

3. Составить отчет по работе, содержащий все этапы выполнения задания.

Контрольные вопросы

1. Какие виды контроля (по целевому назначению и глубине) используются в системах обработки информации?

2. Назовите и охарактеризуйте основные методы контроля.

3. Какие методы аппаратурного контроля применяются в информационных системах?

4. Как влияют контроль и диагностика на показатели надежности сложной системы?

Лабораторная работа №4