Резервирование информации

Резервирование (резервное копирование) – процесс создания запасных страховых копий файлов, документов, программ, баз данных для безопасного и экономного (за счет применения сжатия, архивирования) хранения в отдельном от исходного носителя месте (т.е. на другом носителе информации). Резервные копии больших информационных массивов часто создаются и хранятся на стримерах, которые используют в качестве носителя информации магнитную ленту. При отсутствии другого носителя, иногда резервные копии размещают вместе с оригиналом. В этих случаях рекомендуется защищать носитель информации от возможности дальнейшей записи.

Процесс создания резервных копий во многих операционных системах может быть автоматизирован с помощью встроенных утилит (в Windows – утилита BackUp). Когда тот или иной файл изменяется, операционная система автоматически присваивает ему атрибут А, предназначенный для архивирования. Программа (утилита) резервного копирования в назначенное время (например, после окончания работы всех сотрудников или всех пользователей в локальной сети) или по заранее заданному расписанию просматривает все доступные ей носители информации. Найдя файлы с атрибутом А, она создает на другом носителе их сжатые резервные копии.

В случае потери или порчи исходного файла (случайное удаление, отказ носителя информации, разрушение или повреждение после воздействия вредоносных программ) та же утилита может восстановить работоспособную копию файла из имеющейся резервной копии.

Работая с документами Word, содержащими много рисунков или имеющими большой объем (от 1 Мб), целесообразно создавать резервные копии вручную после очередного редактирования документа. Если это структурированный документ – сохранять отдельные части в отдельных файлах (например, Глава 1 .doc, DiaBa2.doc и т.п.). Если структурировать документ, сохранить отдельные части в разные файлы не удается, сохранять каждую редакцию документа в отдельный файл (например, 1 ДипломPaб.doc, 2ДипломPaб.doc и т.п.).

Создание защитных атрибутов

Пользователь в большинстве случаев руководствуется принципом – компьютер сам все правильно сделает, а как, меня не интересует. К сожалению, компьютер применить принцип полного доверия к себе не может. Поэтому он постоянно проверяет выполнение своих команд. Случайные ошибки сложных преобразований информации всегда вероятны. Особенно это касается преобразований главных действующих лиц – хранителей информации – файлов, и прежде всего при архивировании и пакетной пересылке по сети. Но всегда ли мы работаем с полными, целыми, едиными информационными объектами? Конечно, нет. При перемещении файла из одной папки в другую в пределах одного логического или сетевого диска реального изменения положения файла на носителе не происходит. Так как папка представляет собой файл, в котором регистрируются файлы и другие папки, то реально перемещается, изменяет место на носителе только имя файла из одного регистрационного файла (исходная папка) в другой (папка назначения). Следовательно, можно, когда это уместно, работать не с самим исходным информационным объектом. Проще и быстрее работа осуществляется с его представителем, имеющим, как правило, гораздо меньший объем.

Хеширование

Хеширование (англ, hashing – кромсать, рубить, резать) – создание на основе исходного информационного объекта произвольного в общем случае объема нового объекта – представителя, имеющего меньший, чем исходный, объем (длину в битах). Новый информационный объект, полученный в результате преобразования исходного и имеющий меньшую длину, называется хешем (в литературе можно встретить вариант записи хеш или термин хеш-функция).

В повседневной жизни хеширование широко применяется, но редко так называется. Филиалы фирм или дипломатические представительства – это тоже своеобразные хеши. В словарях, справочниках, индексированных базах данных поисковых систем ключевой набор символов – представитель (хеш) позволяет очень быстро найти исходный информационный объект: статью, набор документов, сайт в Интернете. Хешами являются аббревиатуры, псевдонимы, цифровые "заменители" символьных фраз – код города, номер телефона, номер счета и т.п. В криминалистике хеш – отпечаток пальца площадью в 2 кв. см, позволяющий идентифицировать личность человека, площадь кожи которого около 2 кв. м. Запомним, что маленький хеш может применяться для идентификации исходного информационного объекта гораздо большего объема.

В компьютере адреса, имена, команды, исходные данные для обработки, файлы представлены в виде двоичных последовательностей (иногда их называют битовыми строками). Применяя к этим последовательностям математические преобразования определенного вида, получают их хеши.

Почему все данные нельзя заменить хешами?

Хеш не заменяет собой исходный информационный объект. Зная только хеш, нельзя восстановить по нему сам объект, но можно идентифицировать, сравнивать объекты между собой.

Если у двух объектов хеши разные, то объекты обязательно отличаются. Если хеши одинаковые – исходные объекты, скорее всего, тоже совпадают. В общем случае однозначного соответствия между исходными объектами и хешами нет. Естественно, что разная математическая обработка одного исходного объекта даст разные хеши, которые нельзя сравнивать между собой. Однако имеет место обратная ситуация, когда разные исходные информационные объекты после обработки но одному математическому алгоритму дают одинаковые хеши. Это – так называемые коллизии, случаи не столь частые, но не применимые на практике.

Большинство пользователей может встретить хеширование при сохранении паролей в компьютере. Если парольную фразу обработать, получить и сохранить ее хеш, то снижается скорость атаки на пароли. В ряде случаев становится невозможной словарная атака. Хеширование паролей – это стандартная процедура с выбором алгоритма построения хеша, встроенная во многие операционные системы и запускаемая, когда пользователь включает в соответствующем диалоговом окне галочку Сохранить пароль.

Следует помнить, что хешированию подвергается информационный объект, например файл, целиком. Если это файл с документом, то кроме собственно содержимого документа в хеш "попадают" и свойства файла с документом (имя, тип, объем, атрибуты, дата создания, дата последнего изменения, дата последнего открытия, свойства собственно документа).

Пример. Возьмем файл Пароль1234.doc с документом Word. Объем файла равен 19 968 байт. Если обработать данный файл с помощью программы AutoSign, то будет создан хеш объемом всего 68 байт (в Unicode):

A83E3 AI F3764E9D1AED5 A558E7DC65ECE7.

Хеширование лежит в основе многих преобразований информации, предназначенных для подсчета контрольных сумм, шифрования, аутентификации, формирования электронной цифровой подписи.