Форматы электронных документов, применяемых в управленческой деятельности

 

Слово «формат» имеет много значений. В области компьютерных технологий под термином «формат» понимается структура информационного объекта. Например, форматом файла называют способ организации элементов информации (битов, байтов) в файле, а формат электронного документа определяет способ расположения и представления данных в электронном документе.

Существует множество различных форматов электронных документов. В целом их можно разделить на «однопрограммные», т. е., контролируемые и поддерживаемые только одним программным разработчиком, и «многопрограммные», которые поддерживаются несколькими разработчиками и могут обрабатываться различными программами.

Основные форматы электронных документов.

 

1. Текстовые форматы. Они чаше всего создаются при помощи текстовых процессоров. Наиболее распространенными текстовыми форматами являются:

1) однопрограммные форматы Microsoft Word, WordPerfect, которые имеют расширение той программы, в которой создаются;

2) формат RTF, который поддерживается различными программными приложениями и при этом сохраняет заданное форматирование текста;

в) формат PDF (Portable Document Format), который содержит изображение страницы, включающее текст и графику. Файлы в формате PDF могут быть прочитаны при помощи различных программ, предназначенных только для чтения файлов, однако создаются только при помощи программы Adobe Acrobat.

2. Графические форматы. Они хранят изображение (например, фотографию, рисунок) и делятся на два основных типа:

1) векторные форматы, которые хранят изображение как набор геометрических фигур. Среди них наиболее распространены:

а) формат DXF (Drawing Interchange Format), широко применяемый в программах компьютерного дизайна, используемых инженерами, архитекторами;

б) формат EPS (Encapsulated PostScript), широко используемый в настольных издательских системах;

в) формат CGM (Computer Graphics Metafile) широко применяемый во многих графических редакторах (например, в редакторе Photoshop);

2) растровые форматы, которые хранят изображение как набор точек-пикселей. При изменении масштаба изображения растровая графика получает искажения. Среди растровых форматов наиболее распространены:

а) формат BMP (Bitmap) – относительно низкокачественный формат, чаще всего используемый в текстовых процессорах;

б) формат TIFF (Tagged Image File Format), широко применяемый во многих программных приложениях;

в) формат GIF (Graphics Interchange Format), широко используемый в программах, предназначенных для Интернета.

3. Форматы баз данных создаются при помощи систем управления базами данных (СУБД). Они состоят из полей и таблиц, содержащих отдельные элементы информации. Программа позволяет устанавливать связи между разрозненными элементами. Например, база данных о покупателях может содержать поля с именами покупателей, адресами и сведениями о покупках. Эти поля могут быть организованы в отдельные таблицы (например, одна таблица для всех полей с именами покупателей). Базы данных можно конвертировать в текстовый формат, но при этом будут утрачены связи между полями и таблицами (например, может получиться 10 страниц имен, 10 страниц адресов и 1000 страниц сведений о покупках, т. е. бессвязная информация).

4. Форматы электронных таблиц. Файлы в формате электронных таблиц хранят в ячейках числа и взаимосвязи между этими числами. Так, одна ячейка может содержать формулу, которая суммирует данные двух других ячеек. Как и файлы баз данных, файлы электронных таблиц обычно имеют формат той программы, при помощи которой созданы. Некоторые программы могут импортировать и экспортировать данные других источников, в том числе программ, предназначенных для такого обмена данными (например, формат DIF (Data Interchange Format). Файлы электронных таблиц можно преобразовать в текстовые файлы, но значения и взаимосвязи между числами при этом будут утрачены.

5. Видео – и аудиоформаты. Эти форматы содержат движущиеся изображения (цифровое видео, анимацию) и звуковые данные, которые чаше всего создаются и просматриваются при помощи соответствующих программ и хранятся в однопрограммном формате. Наиболее используемыми из них являются форматы Quick Time и MPEG (Motion Picture Experts Group).

6. Языки разметки, также называемые форматами разметки, содержат встроенные инструкции по отображению и понятности содержав файла. К ним относятся:

1) SGML (Standard Generalized Markup Language), который используете во многих странах мира в государственных органах и является международным стандартом;

2) HTML (Hypertext Markup Language), который используется для отображения почти всей информации в сети World Wide Web;

3) XML (Extensible Markup Language) – относительно простой язык, основанный на SGML и получивший популярность при управлении информацией и обмене ею.

Формат PDF, созданный фирмой Adobe Systems Inc., весьма популярен при обмене документами и широко используется для документов сети Интернет, потому что он позволяет сохранить оригинальный внешний вид документов и затрудняет внесение изменений в документ. По оценке компании Adobe уже пол миллиарда людей загрузили ее бесплатную программу просмотра PDF-файлов, многие предприятия выбрали данный формат в качестве стандарта для передачи и хранения документов, а немало независимых разработчиков предлагают продукты, поддерживающие PDF, причем некоторые бесплатно.

Модифицированная версия формата, названная PDF-Archive (PDF-A), рассматривается за рубежом в качестве одного из двух основных форматов, которые могут в будущем использоваться для архивного хранения электронных документов. Вторым форматом является XML.

Можно утверждать, что наибольшее распространение в сфере управления в настоящее время получили документы, создаваемые при помощи текстовых процессоров, особенно программы Microsoft Word. Значительное количество управленческих документов создается и в формате электронных таблиц (чаше всего при помощи табличного процессора Microsoft Excel), и в формате презентационных слайдов (подготовленных при помощи системы подготовки презентаций Microsoft PowerPoint). Немало электронных документов порождают такие относительно недавно появившиеся технологии, как электронная почта, видеоконференции, веб-сайты. В перспективе крупными «производителями» электронных документов могут стать многие другие технологии, например геоинформационные системы, операторские центры.

Каждый из форматов электронных документов имеет свои достоинства и недостатки при использовании в документационном обеспечении управления. Например, текстовые форматы (Word Perfect, Microsoft Word, RTF и др.) удобны для проведения контекстного поиска по документам в базе данных, а графические форматы (PDF, TIFF и др.) позволяют получить при сканировании изображение документа со всеми его внешними особенностями, хранить документы в том же виде, что и на бумаге, со всеми подписями и визами.

Формат MS Word весьма удобен при редактировании документа и групповой работе с ним, однако файл MS Word хранит много скрытой информации (прежде всего о сделанных в файле изменениях) и, следовательно, весьма небезопасен с точки зрения утечки служебной информации. В ряде случаев, таких как коммерческое предложение или проект контракта, скрытая информация позволяет установить, каковы были исходные предположения и кто оказал на текст наибольшее влияние.

При групповой подготовке документа анализ правки дает возможность узнать не только фамилии людей, ее сделавших, но и кто какой именно вклад внес в итоговый вариант.

Основной вопрос, возникающий в связи с форматами электронных документов, – это вопрос конвертации и (или) миграции электронных документов. При конвертации изменяется формат электронного документа, а при миграции производится перемещение электронного документа с одной программной платформы или носителя на другой без изменения формата. Однако и при миграции может понадобиться конвертация электронного документа. Например, при перемещении электронного документа из операционной системы Macintoch в операционную систему Microsoft Windows необходима конвертация электронного документа в новый формат (например, RTF или Word 2000).

При этом возможно 3 основных типа потерь, которые необходимо учитывать при хранении электронных документов:

1) потеря данных. При потере данных в определенной степени теряется и содержание документа. Электронный документ становится неполноценным и недостоверным;

2) потеря внешнего вида, структуры электронного документа. Например, при конвертации текстовых документов в формат RTF можно утратить некоторые особенности внешнего вида документов;

3) потеря связей между данными (в электронных таблицах, базах данных) также делает документ неполноценным.

Необходимо учитывать, что копия документа может быть юридически признана таковой только в случае, если она создана проверенным способом и является точной, полноценной и надежной для длительного использования.

Второй вопрос, связанный с форматами и управлением электронными документами, – это вопрос сжатия файлов (компрессии). Преимуществами сжатия файлов являются экономия занимаемого места при хранении, более быстрая и простая передача файлов. Недостатки сжатия файлов заключаются в том, что оно может привести к потере данных. Кроме того, оно вызывает необходимость использования дополнительного программного обеспечения – программ сжатия файлов (WinZip, ZipMagic и др.), которым также присуши проблемы устаревания, многоверсионности, зависимости от платформы.

Возможности использования PDF-Archive формата в электронных архивах ограничены: в частности, формат PDF-A не подходит для архивного хранения аудиовизуальных документов.

Подводя итоги: следует отметить, что ни один из форматов электронных документов не может считаться универсальным для длительного архивного хранения, поскольку довольно быстро меняются техника, технологии и программное обеспечение.