Создание и редактирование электронных, текстовых служебных документов

При подготовке текстовых документов на компьютере используются следующие основные группы операций.

Операции ввода позволяют перевести исходный текст из его внешней формы в электронный вид, то есть, в файл, хранящийся на компьютере. Под вводом текста не обязательно понимается машинописный набор с помощью клавиатуры. Существуют аппаратные средства, позволяющие выполнять ввод текста путем сканирования бумажного оригинала, и программы распознавания образов для перевода документа из формата графического изображения в текстовый формат.

Операции редактирования (правки) позволяют изменить уже существующий электронный документ путем добавления или удаления его фрагментов (строк, блоков, рисунков, таблиц), перестановки частей документа, слияния нескольких файлов в один или, наоборот, разбиения единого документа на несколько более мелких. Ввод и редактирование при работе над текстом часто выполняют параллельно.

При вводе и редактировании формируется содержание текстового документа. Оформление документа задают операциями форматирования. Команды форматирования позволяют оформить документ в том виде, в котором он будет выглядеть на экране монитора или на бумаге после печати на принтере. Наименьшим форматируемым элементом документа является символ, затем – абзац, страница и раздел.

Создание и оформление документов основано на использовании шаблонов документов и стилей оформления.

Стиль – это совокупность всех параметров оформления, определяющих вид символа, абзаца, страницы или раздела. Как правило, стили хранятся в самом документе. Вместе с тем, их удобно хранить в компактном виде в отдельном файле, называемом шаблоном. Шаблон содержит стили и текстовые заготовки, используемые в документах определенного типа.

Основной набор типовых операций, осуществляемых с помощью современных программных средств обработки текстовых документов, включает операции, производимые над документом в целом, над абзацами документа и над его фрагментами.

К операциям, производимым над документом в целом относятся:

· создание нового документа (присвоение документу уникального имени и ввод текста документа с помощью клавиатуры);

· загрузка имеющегося на внешнем носителе документа в оперативную память;

· сохранение документа (копирование документа из оперативной памяти во внешнюю);

· распечатка документа (создание бумажной копии документа).

Отметим, что операция удаления документа в целом отсутствует в программных средствах обработки текстовых документов, в силу того, что редактор работает с копией документа, находящейся в оперативной памяти, а сам документ может находиться во внешней оперативной памяти, либо на другом компьютере.

Все дальнейшие операции производятся над документом, загруженным в оперативную память с внешнего носителя, и работа в среде текстового процессора осуществляется практически с копией документа, но все производимые изменения необходимо периодически сохранять.

Операции, производимые над абзацами, изменяют параметры абзаца как структурного элемента текста. Необходимые параметры абзаца задаются с помощью:

· выравнивания строк абзаца (влево, вправо, по центру, по ширине);

· задания величины отступа в красной строке абзаца;

· задания ширины и положения абзаца на странице;

· задания межстрочного расстояния внутри абзаца и др.

Операции, производимые с фрагментами текста, включают выделение фрагмента текста, его перемещение, копирование или удаление. Фрагментами текста могут быть отдельный символ, слово, группа слов, абзац и т.д. Поэтому возможно удаление этих объектов в отличие от удаления документа в целом. Выделенный фрагмент текста можно напечатать, произвести контекстный поиск и замену символов, применить шрифтовое выделение и ряд других операций.

Далее перечислим другие наиболее часто используемые операции для обработки документа в целом или выделенных фрагментов.

Контекстный поиск и замена. Предварительно разметив текст, требующий многократного обращения к определенным местам документа можно использовать быстрый поиск нужных мест документа по аналогии с закладками в обычной книге (например, при подготовке статьи путем многократного редактирования документа). Можно также задать некоторый образец (символ, слово, группа слов или цепочка символов) и подать команду поиска. Поиск по образцу удобен, например, при замене термина в документе (например, имеется документ, в тексте которого встречается год2014, с помощью контекстного поиска и замены можно быстро изменить его на 2015 год).

Режим автоматического переноса слов используют для улучшения внешнего вида текста. При выключенном режиме автоматического переноса слово, не поместившееся на строке, полностью переносится на следующую строку, но в этом случае края текста остаются неровными. При включенном режиме автоматического переноса реализуется мягкий вариант переноса: слово автоматически переносится в соответствии с правилами переноса слов русского или другого языка.

Проверка правописания слов и синтаксиса выполняется специальными программами, которые могут быть автономными, например «Орфо», или встроенными в текстовый процессор. Эти программы значительно различаются по своим возможностям. Наиболее мощные из них проверяют не только правописание, но и склонение, спряжение, пунктуацию и даже стиль. Кроме проверки ошибок пунктуации и выдачи предложений по их устранению, этот режим обеспечивает выявление некоторых ошибок стиля, в частности, неправильное использование заглавных и строчных букв, повторение одного и того же слова несколько раз подряд, отсутствие пробела между словами, отсутствие второй кавычки и т.п. Все указанные ошибки выявляются на основе сравнения, разработанного текста с хранящимися в памяти основными правилами. Заметим, что используемый в рамках текстового процессора набор таких правил существенно ограничен. Словарь синонимов поможет избежать повторений и сделает элегантным ваш стиль изложения.

Установка общих параметров страницы предусматривает размер полей, размер и ориентацию бумаги, нумерацию страниц, колонтитулы. Существует также команда запрета разрыва страниц, которая используется, когда вы хотите, чтобы определенная часть документа (например, таблица) находилась на одной странице, если таблица не умещается на странице, то она переносится целиком на следующую страницу. Для введения нумерации страниц в создаваемом вами документе текстовый процессор предложит специальное меню, в котором вы сможете указать все интересующие вас условия нумерации: месторасположение на листе номера страницы, отказ от нумерации первой страницы, использование колонтитулов и другие. Использование колонтитулов позволяет лучше ориентироваться в документе, а также использовать дополнительные возможности рекламы.

Некоторые текстовые процессоры позволяют использовать макросы. Макросом называют файл, в котором хранится программа часто повторяющейся последовательности действий, заданная пользователем. Макрос имеет уникальное имя. С помощью макросов можно автоматизировать многие типовые технологические этапы при работе с документами, например, макрос, выполняющий последовательность команд по созданию стиля для каждого абзаца документа. После вызова макроса записанная в нем последовательность действий или команд будет в точности воспроизведена автоматически.

Операции сохранения записывают отредактированный документ или его фрагмент, находящийся в оперативной памяти, на диск для постоянного хранения. Расширение файла сохраненного документа обычно присваивается текстовым процессором автоматически. Например, в текстовом процессоре Word документу присваивается расширение *doc. или *docх.. Возможны режимы «Сохранить и продолжить редактирование», «Сохранить и выйти», «Выйти без сохранения».

Текстовые процессоры с помощью резервного копирования обеспечивают защиту созданных документов от возможной утраты. Для этого специальной командой сохранения обеспечивается режим, когда одновременно хранятся два файла одного и того же документатекущий и резервный. После внесения изменений в документ предыдущая его версия автоматически сохраняется как резервный файл, а отредактированная версия рассматривается как текущий файл.

Важным фактором защиты создаваемых документов является функция автосохранения, которая может выполняться как обычная операция сохранения или как специальная операция сохранения текущего состояния текстового процессора в специальном файле. В последнем случае при аварийном прекращении работы это состояние может быть восстановлено, включая содержимое всех окон, положение курсоров в окнах и т.п.

Вывод:

Основной набор типовых операций, осуществляемых с помощью современных программных средств обработки текстовых документов, включает операции, производимые над документом в целом, над абзацами документа и над его фрагментами.

Форматы текстовых файлов

ТХТ

Один из первых (если не первый) текстовых форматов, широко используется по сей день. Так как текст хранится в виде последовательности символов, то размер файла в байтах равен числу символов плюс непечатаемые символы (знак пробела, табуляции, знак конца абзаца и другие – их еще называют знаками форматирования). За счет этого достигается малый размер файла. Однако возможности по форматированию подобных документов сильно ограничены. По сути – это просто текст. Из-за простоты кодировки это расширение позволяет использовать файл на разных операционных системах, платформах, различными текстовыми программами.

RTF – «Rich Text Format»

Свободный межплатформенный формат хранения размеченных текстовых документов, созданный Microsoft в 1987 году. Ныне он широко распространен, поэтому большинство современных текстовых редакторов его поддерживают. Созданный RTF на платформе Windows воспринимается и редактируется на других платформах (Apple, Linux и другие). RTF позволяет производить и сохранять достаточно сложное форматирование, вставлять сноски, колонтитулы, рисунки, таблицы и формулы, хотя в этом он все же уступает формату DOC. Уступает он DOC и в объеме файлов: сложные документы более компактно хранятся в DOC-файлах. Однако RTF выигрывает спор с DOC в отношении безопасности, так как не использует макросы. Поэтому зараженные макровирусами файлы Word можно «вылечить» сохранением в RTF-формат. Кроме того, формат RTF устойчив к повреждению файла. Если в DOC-файле изменить хотя бы один байт, то он уже не откроется в Word. А повреждение файла в формате RTF может привести только к потере поврежденного куска текста.

DOC

Сначала это расширение использовалось для обозначения простых текстовых файлов без форматирования, однако в начале 90-х компания Microsoft фактически его «приватизировала». Поэтому сейчас DOC ассоциируется только с продуктами этой компании. Этот формат обеспечивает большие возможности по форматированию текста (включены сценарии, макросы). За счет этого ухудшилась совместимость с текстовыми редакторами сторонних разработчиков. В файле этого формата содержится огромное количество информации о шрифтах, начертании символов, абзацных отступах и интервалах, даже если все это вам совсем не нужно. Именно из-за этой дополнительной информации файл, содержащий только текст, превышает размер RTF-файла. Однако при включении в документ различных графических элементов и изображений DOC выигрывает в размере и обеспечивает большую совместимость.

DOCX

С появлением Office 2007 компания Microsoft перешла на новые форматы, базирующиеся на Office Open XML. Формат представляет собой zip-архив, содержащий текст в виде XML, графику и другие данные. Для уменьшения размера файла используется ZiP-компрессия. Документы обратно совместимы с Office 2000/XP/2003, только если установлен Microsoft Office Compatibility Pack (найти и скачать его можно с официального сайта Microsoft, размер файла 27,8 Мб).

ODT/ODF

ODF «Open Document Format» – общее наименование открытого формата документов для офисных приложений (текст, таблицы, рисунки, базы данных, презентации). Текстовые данные хранятся в файлах с расширением ODT. Стандарт был разработан индустриальным сообществом OASIS и основан на XML-формате. 1 мая 2006 года принят как международный стандарт ISO/IEC 26300. Федеральное Агентство по Техническому Регулированию и Метрологии, входящее в состав Министерства Промышленности и Торговли Российской Федерации, издало приказ об утверждении формата OpenDocument (ODF) в качестве национального стандарта. (Национальный стандарт ГОСТ РИСО/МЭК 26300-2010 «Информационная технология. Формат Open Document для офисных приложений (OpenDocument) v1.0, идентичный международному стандарту ISO/IEC 26300:2006). Введен в действие – 1 июня 2011 года. ODF доступен для всех и может быть использован без ограничений. Эдакая бесплатная альтернатива закрытым форматам Microsoft. Для того чтобы производить чтение и запись формата ODF в продуктах Microsoft, был выпущен плагин Sun ODF Plugin for Microsoft Office. Поддержка ODF в Microsoft Office 2007 была введена с выпуском с Service Pack 2. К сожалению, по-прежнему уступает по распространенности RTF и DOC.

HTML

Hypertext Markup Language -«язык разметки гипертекста». Стандартный язык разметки документов в интернете (расширение .htm/html). Веб-страницы создаются при помощи языка HTML (или XHTML). HTML был разработан британским ученым Тимом Бернерсом-Ли в 1991 году как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области верстки. Текст с разметкой HTML должен был без стилистических и структурных искажений воспроизводиться на различных устройствах. Однако позже активное внедрение мультимедийного и графического оформления нарушило эти планы. Для просмотра HTML-документов не нужны специальные редакторы, достаточно стандартных средств, встроенных в операционную систему. По открытости, индексируемости, конвертируемости и читаемости превосходит любые другие форматы. К сожалению, графика обычно сохраняется в отдельной папке.

PDF

Portable Document Format – переносимый формат документов. Кроссплатформенный формат электронных документов с использованием ряда возможностей языка PostScript. Права на данный формат выкупила, а позже и доработала фирма Adobe Systems. В первую очередь предназначен для представления в электронном виде полиграфической продукции. Для просмотра можно использовать официальную бесплатную программу Adobe Reader, а также программы других разработчиков. Удобен тем, что решена проблема с искажением форматирования, неправильным отображением внедренных графических элементов, отсутствием тех или иных шрифтов. Файл на любой платформе будет отображен в таком же виде, в каком он был создан. Традиционным способом создания PDF-документов является следующий: документ как таковой готовится в своей программе, а затем экспортируется в PDF. Некоторые программы имеют возможность для прямого экспорта (без использования виртуального принтера). Например, OpenOffice.org.

DjVu

Технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов – книг, журналов, рукописей и пр., где наличие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоемким их полноценное распознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов. Очень распространен, многие библиотеки используют его для хранения отсканированных научных книг. DjVu иногда называют «тексто-графическим» форматом. Суть технологии DjVu заключается в автоматическом разбиении изображения на несколько участков (например, текст, логотип фирмы и растровая фотография), для каждого из которых выбирается оптимальный алгоритм сжатия. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области – ссылки, что позволяет реализовывать удобную навигацию. Дает выигрыш в размере файла по сравнению с GIF-форматом в среднем в полтора-два десятка раз.

XML-форматы

Еxtensible Markup Language. Существует довольно много текстовых форматов, созданных для одного конкретного устройства или программы. Например, электронные книги. К ним можно отнести Rocket e`book (.rb), Microsoft Reader (.lit), PalmDoc, MobiPocket (.pro) и т.д. Как правило, все они созданы с помощью языка XML. Самым удачным и самым распространенным из них является формат FictionBook (FB2). На данный момент это самый прогрессивный и перспективный формат для электронных книг. Единственный его недостаток – длительные временные затраты при подготовке начального текста, что окупается удобством чтения. В FictionBook упор сделан на структурирование документа: с помощью тегов можно выделять различные области текста (главы, заголовки, цитаты, врезки). Как на экране будет выглядеть документ, зависит от программы, в которой будет он открыт.

Среди множества программ для редактирования текста документов, используемых в организациях, наиболее популярен текстовый редактор Microsoft Word. Он позволяет:

• выводить текст редактируемого документа на экран дисплея;

• вносить в него изменения, дополнения, исправления;

• переставлять местами фрагменты текста;

• автоматически проверять орфографию;

• использовать различные шрифты;

• обогащать текст таблицами, рисунками, диаграммами и др.;

• работать одновременно с несколькими документами;

• переносить фрагменты одного документа в другой.

Новые версии офисных комплексов позволяют осуществлять коллективную работу с документами, взаимодействовать с Интернетом.

В федеральных органах исполнительной власти создаются и используются электронные документы, создаваемые в электронной форме без предварительного документирования на бумажном носителе, а также электронные образы документов, полученные в результате сканирования документов и хранящиеся в системе электронного документооборота.

Электронный документ должен быть оформлен по общим правилам делопроизводства и иметь реквизиты, установленные для аналогичного документа на бумажном носителе, за исключением оттиска печати и изображения Государственного герба РФ.