Краткие теоретические сведения. 1. Под контролем в вычислительных системах понимают процессы, обеспечивающие обнаружение ошибок в их функционировании
1. Под контролем в вычислительных системах понимают процессы, обеспечивающие обнаружение ошибок в их функционировании, вызванных отказами аппаратуры, сбоями в работе программного обеспечения или другими причинами. В сочетании с мероприятиями по резервированию контроль является одним из самых эффективных средств повышения надежности и достоверности обработки информации.
Средства контроля вычислительных и информационных систем подразделяются на аппаратные, программные и смешанные. Они характеризуются полнотой (глубиной) контроля, временем обнаружения ошибки и сложностью.
Полнота контроля оценивается как доля отказов, обнаруживаемых в результате контроля, от общего их количества. Время контроля определяется как интервал времени от момента возникновения ошибки до момента ее обнаружения. Сложность средств контроля характеризуется массой, габаритами, стоимостью, памятью, потребляемой энергией и другими параметрами.
По характеру контроль в ИС подразделяется на оперативный и тестовый.
Оперативный контроль осуществляется в ходе решения задач и позволяет в процессе их решения практически немедленно обнаруживать ошибку. Однако оперативный контроль в принципе неполный, поскольку выполняется на случайных, не приспособленных для целей контроля задачах. Тестовый контроль осуществляется в специально отведенные промежутки
времени на основе решения специальных, тестовых задач. Он основан на тестах, обеспечивающих полный контроль всех элементов системы (аппаратуры, команд программы) за короткое время. Недостаток тестового контроля – потеря дополнительного процессорного времени, расходуемого на тесты.
По объекту контроля различают контроль аппаратуры (АЛУ, функциональные преобразователи, память, управление, ввод-вывод), программного обеспечения и работы операторов. Поскольку все виды контроля имеют определенные ограничения, на практике применяют их сочетания.
2. На основании известных значений интенсивностей отказов и восстановлений можно поставить и решать задачу о надежности системы «контролирующее устройство - объект контроля».
Пусть система может находиться в состояниях 00, 01, 10, 11 с вероятностями р00, р01, р10, р11, где первый индекс показывает состояние контролирующего устройства, а второй - состояние объекта контроля (0 – работоспособное состояние, 1 - состояние отказа). Граф состояний такой системы приведен на рис. 5. Обозначения на графе имеют следующий смысл: λ0, λк – интенсивности отказов объекта контроля и контролирующего устройства; μк, μ0, μ01 - интенсивности восстановления соответственно контролирующего устройства, объекта контроля при работоспособном контролирующем устройстве, объекта контроля при отказавшем контролирующем устройстве:
Рис. 1. Граф состояний отказоустойчивой системы с непрерывным контролем.
Для определения коэффициента готовности системы необходимо составить систему дифференциальных уравнений Колмогорова и решить ее при помощи преобразований Лапласа или одним из численных методов. В частности, в стационарном режиме dPij/dt=0 и, следовательно, решается система линейных алгебраических уравнений относительно вероятностей состояний (методом Гаусса или исключения переменных). В результате получаем значение коэффициента готовности системы с контролем:
kгк=р00+р10.
Задание на работу
1. Освоить основные методы аппаратного и программно-логического контроля в вычислительных системах.
2. Для отказоустойчивой системы с непрерывным контролем, граф состояний которой приведен на рис. 5, определить коэффициент готовности. В расчетах принять значения интенсивностей отказов в пределах 10-6 - 10-4 1/ч, интенсивностей восстановления - 0,01-1,0 1/ч. Для сравнения получить величину коэффициента готовности системы без контролирующих устройств.
3. Составить отчет по работе, содержащий все этапы выполнения задания.
Контрольные вопросы
1. Какие виды контроля (по целевому назначению и глубине) используются в системах обработки информации?
2. Назовите и охарактеризуйте основные методы контроля.
3. Какие методы аппаратурного контроля применяются в информационных системах?
4. Как влияют контроль и диагностика на показатели надежности сложной системы?
Лабораторная работа №4