Достоверность функционирования информационной системы

Раздел 3. Технические средства информационных технологий

Лекция № 9. Информационные основы контроля работы цифровых

Автоматов

 

1 Основные характеристики надежности ЭВМ. Функции систем

Контроля и диагностирования.

Систематические коды. Контроль по четности, нечетности, по Хеммингу.

 

Литература: 1. Каган Б.М. Электронные вычислительные машины и

системы: Учеб. Пособие для вузов. – 2-е изд., перераб.

и доп. – М.: Энергоатомиздат, 1985.

 

1 Основные характеристики надежности ЭВМ.

Функции систем контроля и диагностирования

 

Среди основных показателей качества информационных систем можно выделить надежность, достоверность и безопасность.

Безопасностьинформационной системы (ИС) характеризуется способностью системы обеспечить защиту информации от несанкционированного доступа с целью ее раскрытия,изменения или разрушения. Названный показатель не является предметом обсуждения данной лекции. Вопросы обеспечения безопасности информационных систем будут изучаться в дисциплине «Методы и средства защиты компьютерной информации».

Характер и важность задач, решаемых ИС, предъявляют высокие тре­бования к таким их показателям, какнадежностьидостоверность функционирования. Рассмотрим эти показатели более подробно.

Надежность информационной системы

Под надежностью понимается свойство изделия (элемента, узла, устройства, ма­шины, системы) выполнять заданные функции, сохранять свои характеристики в установленных пределах при определенных условиях эксплуатации.

Надежность – комплексное свойство системы. Оно включает в себя более простые свойства, такие как безотказность, ремонтопригодность, долговечность и др.

Безотказность – свойство системы сохранять работоспособное состояние в течение некоторого времени.

 

Одним из основных элементов любой информационной системы является ЭВМ. В процессе функционирования ЭВМ в ней могут возникать отказы.

 

Под от­казом понимается событие, заключающееся в полной или ча­стичной утрате машиной (системой) работоспособности.

 

Отказ ЭВМ — это такое нарушение ее работоспособности, для восста­новления которой требуются определенные действия обслужи­вающего персонала по ремонту, замене и регулировке неис­правного элемента, узла или устройства. Безотказность может измеряться средним временем наработки машины на один отказ.

Отказы бывают:

внезапныеипостепенные;

зависимые и независимые;

полныеи частичные;

устойчивые и самоустраняющиеся;

аппаратные, программные и т.д.

 

Ремонтопригодностьесть степень приспособленности машины или системы к предупреждению, обнаружению и устра­нению отказов.

 

Ремонтопригодность определяет потерю рабо­тоспособности машины вследствие необходимости произво­дить устранение неисправностей и может измеряться средним временем устранения неисправности.

 

Достоверность функционирования информационной системы

 

Работа ЭВМ заключается в выполнении преобразований информации, основными из которых являются передача инфор­мации в пространстве (между отдельными блоками и устрой­ствами машины), хранение информации (передача информации во времени), арифметические и логические преобразования. В силу указанной специфики рабочего процесса очень важной характеристикой ЭВМ является достовер­ность ее функционирования.

 

Достоверность функционированияесть свойство машины (системы), определяемое безошибочностью производимых машиной (системой) преобразований информации и характеризуемое закономерностями появления ошибок из-за сбоев.

 

Сбоемназывают кратковременное самоустраняющееся на­рушение нормального функционирования машины.Сбои имеют слу­чайный характер и могут возникать даже тогда, когда маши­на совершенно исправна. Например, при резких колебаниях температуры в помещении происходит деформация печатных плат, что может вызвать кратковременное нарушение контак­та. Сбои могут возникать под влиянием внешних электро­магнитных импульсов, при резких колебаниях напряжения сети и т. д. После сбоя машина длительное время может работать нормально.

Сбой сопровождается искажением инфор­мации при операциях ее передачи, хранения или обработки. Следовательно, если не устранить последствия сбоя, то задача может оказаться неправильно решенной из-за искажений в данных, промежуточных результатах или в самой про­грамме.

Сбой является частным видом отказа. Однако если при отказе для восстановления работоспособ­ности машины или системы необходимо устранить неисправ­ность в аппаратуре, то при сбое требуется восстановить лишь достоверность информации, что хотя и связано с потерями ра­бочего времени ЭВМ (например, на повторный пуск про­граммы или ее части), но не требует ремонта или регулировки аппаратуры. В силу этого восстановление достоверности функ­ционирования сравнительно легко может быть автоматизиро­вано.

Достоверность функционирования ЭВМ можно оценить средним временем наработки машины на один сбой. Для более полной оценки достоверности функционирования вводят в со­став характеристик надежности ЭВМ среднее время восстано­вления достоверности информации после сбоя.

Для уменьшения вероятности сбоев принимаются меры для уменьшения помех в цепях электронных схем: согласование на­грузок электронных схем, специальные методы монтажа и вы­полнения заземлений схем.

Пользователь должен быть уверен в правильности произво­димых машиной расчетов, особенно при работе ЭВМ в реальном времени с выдачей управляющих воздействий на объект управления.

Если вычислительная машина не обеспечивает пользователя средствами контроля достоверности ее функционирования, он вынужден непроизводительно затрачивать машинное время на двойной просчет, решение контрольных вариантов и т. д.

Выбор методов повышения надежности ЭВМ и их эффек­тивность в значительной мере зависят от того, является вычис­лительная машина восстанавливаемой или невосстанавливае­мой, обслуживаемой или необслуживаемой системой.

Система называется восстанавливаемой, если во время экс­плуатации может производиться ремонт для устранения возни­кающих отказов. Система считается обслуживаемой, если допу­скается периодическое проведение профилактических испыта­ний для выявления элементов и узлов, параметры которых близки к предельно допустимым. Целью профилактических ис­пытаний является увеличение среднего времени наработки на отказ в период между профилактическими работами.

Профилактическое обслуживание связано с потерями рабо­чего времени машины и затратами труда обслуживающего персонала. Эти потери по своему характеру близки к потерям, связанным с устранением отказов, и они должны учитываться наряду с показателями надежности устройств машины при на­значении периодов и объема профилактического обслуживания.

Очевидно, что чем выше надежность ЭВМ, тем больше мо­жет быть период между профилактическими работами. Чем меньше тратится машинного времени и квалифицированного труда на профилактические работы и устранение неисправно­стей, тем выше степень обслуживаемости ЭВМ, т. е. степень приспособленности машины к процессам обслуживания.

 

1.3 Функции систем контроля и диагностирования

 

Чтобы уменьшить потери от сбоев и отказов, порождающих ошибки, надо предотвратить распространение ошибки в вычис­лительном процессе, так как в противном случае существенно усложнятся и удлинятся процедуры проверки правильности ра­боты программы, определения и устранения искажений в про­грамме, данных и промежуточных результатах. Для этого необходимо обнаруживать появление ошибки в выполняемых машиной преобразованиях информации воз­можно ближе к моменту ее возникновения. С этой целью надо иметь систему автоматического контроля правильности ра­боты ЭВМ, которая при появлении ошибки в работе машины немедленно приостанавливает выполнение программы. Нали­чие такой системы освобождает пользователя от забот по кон­тролю достоверности и снижает связанные с этим потери (на двойной просчет задачи, прогон контрольных вариантов, работу схем контроля и т.д.).

Для уменьшения времени восстановления достоверности информации после очередного сбоя следует иметь систему автоматического восстановления вычис­лительного процесса, распознающую характер (сбой или отказ) ошибки и при сбое автоматически восстанавливающую досто­верность информации и выполнение программы, а при отказе – извещающую обслуживающий персонал о необходимости ре­монта машины.

Для повышения комплексного коэффициента использования ЭВМ необходимо повышать обслуживаемость машины и добиваться уменьшения потерь времени на устранение отказов (повышение ремонтопригодности) и на проведение профилактических ра­бот. Эти потери времени в таких сложных объектах, как ЭВМ, в первую очередь связаны с поиском места неисправности. Важнейшим средством уменьшения указанных потерь и повы­шения обслуживаемости ЭВМ является система автоматиче­ского диагностирования, позволяющая локализовать неисправ­ность.

Обнаружение ошибок должно производиться в машине не­прерывно и, следовательно, не должно вызывать заметного снижения быстродействия машины. Поэтому эта функция воз­лагается обычно на быстродействующие аппаратурные сред­ства контроля, которые позволяют почти полностью совме­стить во времени выполнение основных и контрольных опера­ций.

Для снижения затрат машинного времени и труда на про­филактические испытания следует снабжатьЭВМ аппаратурно-программными средствами автоматизации контроля.

Продукция вычислительной машины — информация – не имеет своего эталона, т. к. машина решает задачу вычисле­ния заранее неизвестных величин. Это условие определяет свои особые формы контроля, в основе которых лежитисполь­зование избыточной информации в процессе работы машины.

При использовании аппаратурных средств автоматизации контроля речь идет об аппаратурной избыточности, сущность которой можно охарактеризовать следующим:

- все операции выполняются параллельно на одинаковых компонентах системы, а результаты их работы затем сравниваются, что позволяет выявить ошибки;

- в случае выхода из строя какого-либо компонента его резервные аналоги продолжают работу без остановки, а отказавший компонент заменяется на работоспособный.

Программная избыточность предусматривает:

- последовательное во времени выполнение одних и тех же информационных процессов и дублирование данных;

- автоматическое восстановление отказавших операционных систем, программ-приложений и искаженных данных.

Кпрограммным средствамотносятся такжеконтрольные про­граммыили специальные приемы программирования, позво­ляющие проверять правильность работы ЭВМ. Контроль может быть произведен с помощью программ тестовых задач (т. е. задач с известным решением), пропускаемых перед решением основной задачи. При правильном решении тесто­вых задач имеется определенная вероятность, что в течение некоторого ближайшего промежутка времени машина будет работать правильно.

Контроль во время решения основной задачи осуществля­ется путем введения в выполняемую программу специальных контрольных процедур, позволяющих установить достовер­ность решения всей задачи или ее части. Для этого проводят двойной просчет для одной и той же программы с последую­щим сравнением результатов. Иногда используют проверку вычислений по неиспользованным в основном алгоритме со­отношениям, например, проверка правильности вычисления SIN(x) и COS(x) по формуле SIN2 Х + COS2 Х = 1 и т.п.

 

 

2 Систематические коды. Контроль по четности,

нечетности, по Хеммингу

 

При контроле передачи информации наибольшее распро­странение получили методы информационной избыточности, использующие коды с обнаружением и коррекцией ошибок.

Если длина кода п разрядов, то таким двоичным кодом можно представить максимум 2п различных слов. Если все раз­ряды слова служат для представления информации, код назы­вается простым (неизбыточным). Коды, в которых лишь часть кодовых слов используется для представления информации, на­зываются избыточными. Часть слов в избыточных кодах является запрещенной, и появление таких слов при передаче информации свидетельствует о наличии ошибки.

Принадлежность слова к разрешенным или запрещенным словам определяется правилами кодирования, и для различных кодов эти правила различны.

Различают коды равномерные и неравномерные. В равномерных кодах все слова содержат одинаковое число разрядов. В неравномерных кодах число разрядов в словах мо­жет быть различным. В вычислительных машинах применяют­ся преимущественно равномерные коды.

Способность кода обнаруживать или исправлять ошибки определяется так называемым минимальным кодовым расстоя­нием.

 

Кодовым расстоянием между двумя словами называется число разрядов, в которых символы слов не совпадают. Если длина слова п, то кодовое расстояние может принимать значе­ния от 1 до п.

Минимальным кодовым расстоянием данного ко­да называется минимальное расстояние между двумя любыми словами в этом коде. Если имеется хотя бы одна пара слов, от­личающихся друг от друга только в одном разряде, то мини­мальное расстояние данного кода равно 1.

Простой (неизбыточный) код имеет минимальное расстоя­ние dmin = 1. Для избыточных кодов dmin > 1. Если dmin ³ 2, то любые два слова в данном коде отличаются не менее чем в двух разрядах, следовательно, любая одиночная ошибка при­ведет к появлению запрещенного слова и может быть обнару­жена.

В общем случае, чтобы избыточный код позволял обнару­живать ошибки кратностью r, должно выполняться условие

 

 

Действительно, одновременная ошибка в r разрядах слова создает новое слово, отстоящее от первого на расстоянии r. Чтобы оно не совпало с каким-либо другим разрешенным сло­вом, минимальное расстояние между двумя разрешенными словами должно быть хотя бы на единицу больше, чем r.

Для исправления r -кратной ошибки необходимо, чтобы но­вое слово, полученное в результате такой ошибки, не только не совпадало с каким-либо разрешенным словом, но и оставалось ближе к правильному слову, чем к любому другому разрешен­ному слову. От правильного слова новое отстоит на расстоя­нии r. Следовательно, от любого другого разрешенного слова оно должно отстоять не менее чем на r + 1, а минимальное ко­довое расстояние должно быть не менее суммы этих величин: