Системы управления контентом — взгляд снизу.

Под «взглядом снизу» мы понимаем анализ ключевых элементов, входящих в ECM.

Информация поступает на предприятие или создается на нем, обрабатывается, используется для поддержки принятия разного рода решений, хранится, доставляется пользователям (публикуется на корпоративном портале или путем других средств доставки информации пользователям), архивируется и утилизируется.

Есть два вида хранилища информации. Одно из них (в документах AIIM оно обозначается как Store — Хранение) представляет собой некое расширенное, постоянно доступное хранилище данных (структурированных и неструктурированных), которое регулярно пополняется из разных источников с помощью различных процедур.

Второе хранилище (в документах AIIM оно обозначается как Рreserve — Архивирование) — это архивы, которые обычно хранятся на внешних носителях и, как правило, удалены от основной системы. Последнее подразумевает долгосрочное, надежное хранение и резервное копирование статичной, неизменной информации и, как правило, сопровождается системой управления записями (RMS), призванной помочь компаниям соответствовать государственным и отраслевым нормам. В качестве систем управления информацией применяются системы автоматизации бизнес-процессов (Workflow/BPM), управления документами (Document Management Systems), управления веб­контентом (CMS/WCMS), управления цифровыми активами (Digital Aasset Management Systems), управления записями (Records Management Systems, RMS).

В ряде случаев при наличии более дешевых предложений и отсутствии внутренней компетенции отдельные работы могут быть переданы на аутсорсинг сторонним организациям. Например, аутсорсинговые услуги могут включать такие операции, как сканирование документов, распознавание текста, ввод данных в базы данных и информационные системы заказчика, ввод и обработка данных с анкет, ввод и редактирование текстов, проверка документов, преобразование документов к заданному виду, сортировка документов и т.п. К разновидностям аутсорсинга можно отнести также хостинг обслуживания и администрирования ECM-ПО, который подразумевает централизованное управление тиражируемым программным обеспечением при условии, что приложения находятся на территории поставщика услуг, а заказчик имеет удаленный доступ к этому ПО. Это также могут быть хостинговые услуги по длительному хранению документов (как бумажных, так и электронных) в больших складах с контролируемыми условиями хранения.

12.2 Система ввода (Input/Capture).

Система ввода документов включает функции создания, захвата и обработки вводимой информации. Контент может поступать из двух источников (см. рис. 2) — это могут быть документы, создаваемые в офисных приложениях или получаемые путем заполнения форм, и информационные материалы, импортированные из различных корпоративных приложений (они могут передаваться из ERP-приложений, финансовых приложений, электронных форм и т.п.).

Если документ вводится с бумажного носителя, то на первом этапе производится его сканирование и создается электронная копия документа. Затем, если это необходимо, выполняется распознавание отсканированных документов с помощью OCR-программ.

Перевод документов разных видов в электронный формат имеет свою специфику: для ввода фотографий достаточно электронного изображения, если документ содержит текст — требуется распознать его, если это анкета — то обычно нужна только содержащаяся в ней информация. Под обработкой форм подразумевается способность программного обеспечения принять отсканированные формы, извлечь данные из ячеек и распознать строки и столбцы в таблицах для заполнения баз данных. Особенностью ввода форм, заполненных от руки, является необходимость распознавания «рукопечатного» текста. Рукопечатным называется текст, вписываемый от руки печатными буквами по одной в каждый квадратик анкеты для автоматического распознавания машиной. Технология распознавания рукопечатных символов (Handprint Character Recognition, HCR) позволяет переводить изображения рукопечатных символов в ASCII-коды. Задачи распознавания при вводе форм необязательно связаны с текстом — также может потребоваться распознавание различных меток. Технология OMR (Optical Mark Recognition — оптическое распознавание меток) позволяет обнаружить наличие или отсутствие отметок в определенных областях.

Технология IDR (Intelligent Document Recognition) означает интеллектуальное распознавание документов, то есть способность автоматически определять тип документа, исходя из его макета и структуры.

Далее производится агрегация — процесс объединения данных из разных источников ввода, систем авторинга и др.

На этапе классификации осуществляется индексация — определение специфических атрибутов документа или записей в базе данных для облегчения поиска.

Решения по автоматизации ввода предлагают такие компании, как EMC (Captiva), ABBYY и Cognitive Technologies.

12.3Автоматизация бизнес-процессов (Workflow/BPM).

Выигрыш от внедрения ECM-системы можно получить только при интеграции ее с основными бизнес-системами предприятия. ПО для управления рабочим процессом следует рассматривать как связующее звено между средствами управления контентом и транзакционными системами. Управление Workflow позволяет организациям автоматизировать бизнес-процессы и существенно сократить необходимость в дополнительных контактах в виде электронных писем и других средств коммуникации. Системы ECM, как правило, включают автоматизацию бизнес-процессов, сопряженных с жизненным циклом документа. В ходе разработки документа и после его создания участники бизнес-процессов передают документ по определенным маршрутам переходов (например, утвердить документ или отправить его на доработку).

Workflow-система — это система автоматизации бизнес-процессов, которая обеспечивает передачу документов, информации или заданий от одного участника к другому для выполнения действий в соответствии с определенным набором правил.

Бизнес­процесс — это логически связанный набор рабочих потоков (workflows), рабочих шагов и задач. Система управления бизнес-процессами (Business Process Management System) — это совокупность приложений, поддерживающих задачи управления бизнес-процессами, включая задачи моделирования, оперативного управления, администрирования, мониторинга, анализа показателей эффективности и обеспечения поддержки слаженного взаимодействия людей и информационных систем. Прежде чем управлять процессом, нужно его описать. Для этого есть множество инструментов — как встроенных в BPM-системы, так и существующих в виде отдельных продуктов. К задачам Workflow/BPM обычно относят: визуализацию процессов и организационных структур; ввод, администрирование, визуализацию и доставку сгруппированной информации с ассоциированными документами или данными; средства напоминания, установки дедлайнов и делегирования задач. Системы для управления рабочим процессом присутствуют в продуктах таких компаний, как IBM (FileNet), EMC (Documentum), Open Text (Hummingbird) и Microsoft (SharePoint). К этой группе также можно отнести компании SAP и Oracle, в составе ERP-систем которых есть развитые модули управления потоками работ.