Сохранение электронных документов во времени

 

Традиционно, при сохранении документов главное внимание уделялось долговечности физического носителя, на котором записан документ. Архивы сохраняли содержание, структуру, контекст и аутентичность документов путем сохранения носителя, на котором документы записаны, в том порядке, в котором документы использовались и накапливались. В случае электронных документов, этот подход не решает задачу обеспечения доступа к ним через длительные интервалы времени.

Это связано с тем, что технологические средства, необходимые для воспроизведения документов, изменяются быстрее, чем разрушаются сами носители. С точки зрения обеспечения доступа к архивным электронным документам, одно из решений состоит в сохранении этих документов вместе с технологической средой. Однако для государственных архивов было бы очень дорого содержать все возможные конфигурации аппаратного и программного обеспечения. Такой подход может привести к нерациональному расходованию ресурсов, без гарантии того, что документы останутся доступными при необходимости в будущем.

Так же непрактично было бы осуществлять преобразование всего объема поступающих в государственный архив документов в один стандартный формат. Стандарты программного и аппаратного обеспечения содействуют повышению совместимости и длительной доступности, но сами стандарты изменяются с течением времени в ответ на коммерческие и промышленные потребности, поэтому они сами по себе не обеспечивают продолжительной доступности в периоды времени, требуемые для архивов. Такой подход не является наиболее эффективным по стоимости решением и может использоваться только в тех случаях, когда другие способы не дают результатов.

Поэтому одной из важнейших задач является выбор форматов файлов ЭД, которые бы отвечали не только текущим потребностям, но и были бы пригодны для последующей конвертации и миграции данных. Этим требованиям отвечают только широко распространенные и стабильные форматы.

 

 


3 Обеспечение сохранности и доступности электронных документов в организациях

 

Общие требования

 

Проблема обеспечения доступности ЭД, предназначенных для длительного хранения, должна решаться еще до их создания, иначе принятые меры могут не дать желаемого результата. Уже при проектировании или внедрении системы, предназначенной для создания и обращения ЭД в организации, необходимо осуществлять планирование жизненного цикла ЭД. Цель этого мероприятия – обеспечение создания официальных, подлинных, воспроизводимых и пригодных для хранения ЭД.

ЭД на протяжении всего жизненного цикла должны иметь реквизиты, позволяющие их идентифицировать.

Подлинность официальных ЭД должна быть удостоверена в установленном порядке.

ЭД должны быть защищены от хищения, утраты, искажения, подделки и несанкционированного доступа.

Все санкционированные изменения ЭД (исправления, дополнения и т. п.) подлежат учету и регистрации.

ЭД, вышедшие из оперативного обращения, должны храниться в ведомственном архиве или в подразделении, выполняющем функции ведомственного архива.

Для отбора ЭД на архивное хранение должна проводиться экспертиза ценности. Порядок проведения экспертизы ценности регламентируется нормативно-методическими документами государственного органа по архивам и делопроизводству Республики Беларусь.

По истечении срока хранения в ведомственном архиве ЭД с временным сроком хранения уничтожаются, ЭД с постоянным сроком хранения передаются на государственное хранение.

 

 

Планирование жизненного цикла ЭД

 

Планирование жизненного цикла ЭД предусматривает определение требований к ЭД таким образом, чтобы они были доступными и воспроизводимыми на всех стадиях жизненного цикла.

В процессе планирования должны принимать участие:

- специалисты по проектированию или внедрению информационных систем, в среде которых происходит создание и/или обращение ЭД;

- специалисты службы нормоконтроля и специалисты, ответственные за хранение ЭД в организации;

- специалисты государственного органа по архивам и делопроизводству или уполномоченной им организации.

Планирование жизненного цикла ЭД осуществляется на основании перечня типовых ЭД, образующихся в процессе деятельности организации. Перечень, согласованный с государственным органом по архивам и делопроизводству Республики Беларусь, должен быть утвержден ее вышестоящим органом государственного управления.

Процесс планирования включает:

- установление порядка согласования, утверждения и регистрации ЭД;

- классификацию ЭД в соответствии с перечнем типовых ЭД;

- предварительную экспертизу ценности ЭД по видам документов в соответствии с классификацией ЭД и определение сроков их хранения;

- выработку требований по защите ЭД и определение порядка доступа к ним;

- определение порядка резервного копирования и хранения резервных копий ЭД;

- установление порядка хранения, внесения изменений и тиражирования ЭД, а также уничтожения ЭД, не подлежащих постоянному хранению;

- определение процедур передачи ЭД на ведомственное хранение и создания сопроводительных документов, согласование форматов ЭД и дополнительных реквизитов ИПХ;

- определение порядка ведомственного хранения и передачи ЭД на государственное хранение.

 

Одной из задач, решаемых при планировании жизненного цикла ЭД, является выбор форматов файлов ЭД, которые обеспечивали бы не только потребности создателей и пользователей ЭД, но и учитывали бы требования государственного архива к форматам файлов ЭД, передаваемых в архив.

 

 


4 Выбор оптимальных форматов файлов электронных документов

Характеристика проблемы

 

Рынок программного обеспечения предполагает большое количество программ для обработки текстов, хранения информации в базах данных, проведения расчетов в электронных таблицах и обработки графических изображений. Однако часто данные, обрабатываемые каким–либо продуктом, хранятся в специфическом формате и поэтому недоступны для других программ. Иногда об этом просто не задумываются, хотя порой создатели и заказчики информационных систем умышленно проводят политику неразглашения сведений о внутренней организации данных. Достигаемый при этом выигрыш может быть полностью сведен на нет в случае устаревания информационной среды (так называемой «платформы», т.е. операционной системы в сочетании с определенными аппаратными средствами), в которой функционируют такие программы и системы. В итоге пользователь окажется привязан к программе, работающей, например, только на платформе MS DOS, лишая себя преимуществ более современной информационной среды Windows. Если же в будущем новые поколения операционных систем перестанут поддерживать эмуляцию DOS, данные вообще могут быть утрачены вместе с устаревшим оборудованием.

Поэтому одной из важнейших задач является выбор форматов файлов ЭД, которые обеспечивали бы не только текущие потребности создателей и пользователей ЭД, но и были бы пригодны для последующей конвертации и миграции данных в случае модернизации аппаратного или программного обеспечения. Как правило, для этого пригодны только широко распространенные и стабильные форматы, нередко являющиеся стандартами де-факто для определенных типов данных. При выборе формата следует учитывать, как долго предстоит хранить документ (т. е. относится он к документам временного или постоянного хранения), как часто он используется и с какими целями.

Сроки хранения ЭД предварительно определяются на основании Перечня типовых ЭД, образующихся в процессе деятельности организации путем проведения экспертизы ценности на стадии планирования его жизненного цикла. При отборе ЭД на архивное хранение проводится повторная экспертиза ценности, в ходе которой сроки хранения конкретных документов могут быть уточнены. От сроков хранения зависит степень программной и аппаратной независимости, которую должен обеспечивать формат файлов. Для хранения ЭД с постоянным сроком хранения должны использоваться форматы файлов, согласованные с государственным архивом, либо к моменту передачи в государственный архив ЭД должны быть преобразованы в установленные форматы.

Частота использования ЭД определяет требования к тому, насколько легко данные должны преобразовываться при воспроизведении, а также к возможностям поиска информации внутри документа. Очевидно, что часто используемые документы требуют мощных поисковых средств, которые, как правило, применимы только при хранении информации в определенных символьных или двоичных форматах.

Цели использования ЭД на стадии архивного хранения также влияют на выбор формата. Если использование документа ожидается исключительно с целью удостоверить факт какого-то действия или события (например, факт совершения платежа или зачисления сотрудника в штат организации), предпочтителен формат, обеспечивающий надежную защиту информации и ее отображение в форме, максимально близкой к первоначальной. Если же ЭД может использоваться в научных целях или при создании других документов, желательно иметь возможность редактировать данные или экспортировать их в программы работы с текстом, графикой и т. п.

В данном документе приводятся характеристики некоторых форматов, использование которых сегодня представляется наиболее перспективным, хотя и не избавленным от проблем.

 

Текст

Текст является неотъемлемой частью практически всех документов - как традиционных, так и электронных. Даже если основное содержание ЭД составляет графическая или аудиовизуальная информация, текст присутствует в его названии, реквизитах, информационно-поисковой характеристике. Этот текст, хранимый на носителе в закодированном виде, должен быть пригодным для воспроизведения.

 

С точки зрения архивного хранения следует различать три вида текстовых документов:

§ простые тексты, для которых имеет значение прежде всего информация, а не внешнее оформление (форматирование);

§ отформатированные тексты, которые необходимо сохранить в первоначальном виде с сохранением типов и размеров шрифтов, отступов, разбиения на страницы и т. п.;

§ гипертекстовые документы.

 

Хранение простых текстов

Оптимальным способом хранения текстовой информации считается так называемый формат ASCII (American Standard Code for Information Interchange), разработанный Американским национальным институтом стандартизации в 1968 г. Все символы текста (буквы, цифры, пробелы, знаки препинания), а также управляющие символы (знаки конца строки, конца абзаца, начала и конца выделенного текста и т.п.) в этом формате задаются восьмизначными кодами в соответствии с избранной кодовой таблицей. Таким образом, кодирование каждого символа требует восьми битов или одного байта машинной памяти, что бывает очень удобно при определении размеров текста. Формат ASCII является программно-независимым и воспроизводится практически всеми текстовыми редакторами.

Кодовые таблицы содержат разные символьные эквиваленты для одних и тех же восьмизначных двоичных кодов. Программы, использующие разные кодовые таблицы, по-разному воспроизводят на экране или на печати одни и те же символы. Поэтому в создаваемом ЭД или его информационно-поисковой характеристике должно в явном виде указываться, какие кодовые таблицы в нем использованы.

При сохранении текста в данном формате следует учитывать, что при воспроизведении он может быть отображен шрифтами разных типов и размеров, а также выведен на печать при разных значениях параметров страницы (длина и количество строк, величина полей и междустрочных интервалов и пр.). При этом внешний вид одного и того же текста может сильно различаться. Это может затруднить возможность ссылаться на определенное место документа (например, при его цитировании). Поэтому целесообразно использовать нумерацию разделов и подразделов документа, при необходимости – вплоть до нумерации абзацев.

Одним из способов избежать проблем при воспроизведении может быть сведение форматирования к минимуму, т. е. представление текста в виде линейной последовательности символов, разбитой на строки. Единственным управляющим символом в этом случае является «конец строки», отражаемый кодом клавиши «Ввод» («Enter»). Абзацы начинаются от левого края без отступа и отделяются друг от друга пустой строкой (двойным нажатием клавиши «Ввод»), между словами всегда ставится строго один пробел, отсутствуют переносы, выделения курсивом, подчеркивания и т. п. Заголовки и примечания оформляются, как обычные абзацы, разбивка на страницы отсутствует.Текст, сохраненный таким способом, может быть одинаково воспроизведен практически любым текстовым редактором, а затем при необходимости отформатирован средствами этого редактора. Рекомендуется хранить таким образом всю сопроводительную документацию к ЭД.