Обзор рынка ECM-систем. ЕСМ- технологии для формирования профессиональных сообществ.

 

На рынке ЕСМ-систем можно выделить два основных сегмента: свободно распротраняемые и коммерческие системы.

Свободно распространяемые системы

Рассмотрим следующие CMS-системы: eZ Publish 3.2, APC ActionApps, Mambo 4.0.14 и Xoops (версии 2.0.5 и 2.0.6). Каждая из них позиционируется разработчиками как система для создания любого сайта (от корпоративного портала до домашней странички) и управления его содержимым. Система eZ Publish предназначена также для создания и управления содержимым Internet-магазина, новостного сайта, фотогалереи или форума. APC ActionApps имеет уникальное свойство добавления динамических разделов на существующем сайте и способна управлять содержимым многих сайтов. Но все-таки правильнее говорить, что CMS-системы предназначены для создания, модификации, публикации и обмена информацией.

Прежде чем начать использование какой-либо CMS необходимо определиться, с какими типами контента вы хотите работать — будут ли на вашем сайте статьи, фильмы, новости, форумы и т.п. Обычно CMS-системы поставляются с некоторым количеством готовых к работе встроенных типов контента, а часть из них позволяют редактировать встроенные типы контента или создавать новые (eZ Publish, APC ActionApps). Но есть и системы, в которых все типы контента строго фиксированы (Xoops, Mambo).

Каждому пользователю системы должна быть приписана какая-то роль, в соответствии с которой он сможет выполнять определенные действия. При этом, пользователи могут объединяться в различные группы с назначенными правами. Некоторые системы позволяют создавать новые группы и устанавливать им права, отличные от прав существующих групп (eZ Publish, ActionApps, Xoops), и это свойство иногда оказывается очень полезным.

Выбирая CMS-систему, всегда хочется получить максимум функциональности при минимуме затрат, да и на поддержку хочется тратить как можно меньше времени и усилий. Чтобы хоть как-то приблизится к этому идеалу, нужно для начала определить необходимый минимум задач, которые должна решать система. При создании, документ наделяется набором характеристик, определяющих текущий этап его жизненного цикла, поэтому стоит обратить внимание на следующее: насколько гибка структура контента конкретной системы, насколько прост процесс создания контента, как он упорядочивается, как происходит управление рабочим потоком документов и возможно ли использование контента совместно с другими информационными системами.

Преимущества систем с гибкой структурой контента очевидны. Они позволяют по мере надобности расширять и добавлять новые типы контента средствами самих систем, не занимаясь, например, поиском на стороне подходящей функциональности. С другой стороны, при наличии множества свободно распространяемых модулей (типов контента) можно работать и с системами, имеющими фиксированную структуру контента. Однако в этом случае нужно быть готовым покопаться в коде, поскольку реализация некоторых модулей может оказаться неполной.

Основной инструмент создания контента для CMS-систем — Web-браузер. Некоторые системы позволяют использовать также автономного клиента (например, ActionApps) или Windows-клиента. При создании контента важно, насколько прост и интуитивно понятен такой процесс. С этой точки зрения стоит разобраться, какие возможности разметки документов предоставляет конкретный CMS-инструментарий. Нужно выяснить, имеет ли она встроенные, специфичные только для нее, средства разметки или можно пользоваться стандартными средствами типа HTML; создается контент с помощью обычных HTML-форм или встроенных редакторов наподобие WordPad и т.п.

eZ Publish, Mambo и ActionApps предлагают использовать HTML для разметки документов, в то время как Xoops располагает и собственными средствами разметки. Применять для упрощения создания контента встроенный текстовый редактор, похожий на Word Pad, можно лишь в Mambo. Чаще всего документы создаются с помощью средств, привычных для их авторов, и хранятся в виде файлов на локальных машинах, поэтому при внесении документа в систему управления содержимым полезно иметь возможность загрузки файлов с локальной машины. Среди рассматриваемых CMS-систем этим свойством в полной мере не обладает ни одна. В Mambo и ActionApps можно загружать на сервер текстовые файлы и рисунки некоторых форматов, а в Xoops и eZ Publish — только рисунки.

Следующий важный момент — каталогизация и упорядочивание контента. В eZ Publish весь контент сайта представляется в виде дерева узлов (узлы — это инкапсуляции контент-объектов). Упорядочивание контента внутри дерева производится с помощью контейнеров (папок), под которые помещаются соответствующие объекты (как в файловой системе). Для задания местоположения объекта (определения узлов, которые с ним ассоциируются) используется свойство location. С его помощью при создании или редактировании объекта можно определить, где дополнительно будет отображаться объект кроме места его создания. В добавлении к иерархической структуре, дерево контент-узлов может быть разделено на логические разделы (секции).

Для упорядочивания контента в ActionApps используется расширяемая система категорий: в системе изначально имеется набор категорий, а администратор может их изменять или добавлять собственные. Для этого служит специальный встроенный редактор, который позволяет моделировать иерархическую структуру (в категории может быть одна или несколько подкатегорий). В Mambo и Xoops тоже применяются системы категорий, но поскольку эти продукты построены по модульному принципу, наличие или отсутствие системы категорий зависит от модуля. Скажем, для модуля «статьи» существуют категории, а для модуля «форум» — нет. Но какую бы категорию в модуле «статьи» вы ни создали, структура документов в ней будет такой же, как и во всех других категориях данного модуля, — деление на категории чисто смысловое. Если в модуле используется система категорий, можно создавать новые категории, удалять или менять тип доступа для существующих.

Механизм каталогизации eZ Publish кажется более функциональным и развитым, но слишком сложным для понимания. Применение же для этих целей категорий, как в остальных системах, гораздо более привычно и понятно, но не позволяет решить, например, проблему отображения документа одновременно в двух категориях.

В eZ Publish и ActionApps реализована поддержка национальных алфавитов. Администраторский интерфейс ActionApps настраивается на несколько языков. Каждая версия контента может существовать на разных языках, но при работе с русским языком порой возникают небольшие проблемы. Дело в том, что в коде этих систем прописана кодировка ISO-8859-1, и для создания документов на русском языке ее приходится менять на KOI8-R или WIN-1251. В системах Mambo и Xoops поддержка русского языка вполне удовлетворительна, но в сами эти системы поддержка многоязычности не входит. В Mambo язык вообще зашит в код системы, а переводы применимы только к тому, что хранится в базе данных, поэтому все равно приходится искать непереведенные фразы и изменять их самостоятельно. Русскоязычному пользователю удобнее работать с Xoops, но надо подготовиться к тому, что с появлением новых, непереведенных, модулей в системе будут возникать слова на английском языке.

Теперь обратим внимание на то, как CMS-системы управляют потоком документов, позволяют ли они создавать различные версии одного документа и дают ли возможность администраторам следить за процессом публикации документов.

Реальный контент eZ Publish, который хранится внутри контент-объектов, может существовать в одной или нескольких версиях. Каждый раз, когда контент редактируется, создается его новая версия, а старая остается нетронутой. Эта система версий позволяет пользователям возвращать/отменять изменения, а чтобы предотвратить переполнение базы данных старыми неиспользуемыми версиями, администратор может установить ограничение на количество версий для контент-класса. Собственно версия документа в eZ Publish описывается с помощью следующих характеристик: номер версии, статус документа (черновик, опубликованный, архивный), язык, создатель, дата изменения. Автоматически контролируется авторство документов: нельзя редактировать чужие документы, можно только создавать их копии и редактировать их. Контролируется и статус документа; несколько версий документа нельзя опубликовать одновременно, поскольку статус опубликованной имеет только одна из них. Существует возможность создавать для разных языков разные версии документа. Документы со статусом «архивные» нельзя редактировать и публиковать (для редактирования создается их копия — черновик).

В системе ActionApps поддерживается основной процесс одобрения: автор документа имеет право на его публикацию. Отличие от eZ Publish состоит в том, что документ публикуется сразу после его добавления в систему. При этом статус документа ActionApps может изменяться следующим образом: активный (active), ожидающий рассмотрения (pending), устаревший (expired), в процессе написания (hold bin), ожидающий удаления (trash bin). Каждый документ, будучи создан, сразу становится активным (публикуется). Потом его можно переместить в другую категорию, но для этого необходимо иметь хотя бы права редактора слайса. Понятие версии документа в ActionApps не применяется, впрочем, как и в Xoops, и в Mambo.

В системах Xoops и Mambo нет общей системы категорий и унифицированного способа описания документов. Описание зависит от модуля (тип контента), к которому принадлежит документ. Но таких понятий, как версия документа, нет. В Xoops не применяется и понятие статуса документа, но некоторые документы (в зависимости от модуля) можно заносить в архив. В системе Mambo документ имеет статус опубликованного, архивного, одобренного или находящегося в процессе редактирования. Архивные статьи можно редактировать. Статьи, добавленные пользователями, должны быть одобрены администратором. В целом описание документов в системах Mambo и Xoops недостаточно полное и не удовлетворяет даже основам стандарта Dublin Core (один из наиболее распространенных наборов элементов для описания структуры и смысла документов, который создается уже в течение нескольких лет международной группой The Dublin Core Initiative, dublincore.org). Таким образом, для этих систем «отрезан» один из путей решения проблем совместного и повторного использования контента, организации распределенных хранилищ данных.

Наиболее развитую систему управления документами, на мой взгляд, предоставляет eZ Publish. Версия 3.2 этой системы поддерживает основной процесс одобрения (право публикации документа имеет только его автор), работу с версиями и трансляциями документов, простейшее отслеживание ревизий.

Немаловажно, как рассматриваемые системы используют контент совместно с другими информационными системами. Самые развитые возможности в этом плане имеет ActionApps: обеспечивается обмен информацией внутри самой системы и с другими сайтами APC ActionApps (в терминах данной системы такое свойство называется content pooling). Обмен информацией осуществляют редакторы или администратор. Также поддерживаются отображение категорий и полей для общего контента, импорт и экспорт контента из других баз данных. Все это впечатляюще, но сложновато. Наконец, ActionApps (как и eZ Publish и Xoops) поддерживает использование заголовков RSS.

Напоследок резюмируем, как осуществляется управление жизненным циклом контента в CMS-системах. При создании документа, он наделяется набором характеристик (статус, автор, дата устаревания и т.п.), соответствующих текущему этапу его жизненного цикла. Затем документ может быть модифицирован, как и его описание, с помощью средств CMS. Если автор документа не обладает достаточными правами, документ проходит процесс одобрения и после этого может быть опубликован. При определенных условиях (например, была установлена дата устаревания документа или его редко читают) документ может быть занесен в архив. Вообще говоря, такие документы заносятся в архив для облегчения и ускорения доступа к актуальным документам, но некоторые системы (например, Mambo) просто дублируют информацию в архив. Архивные документы хранятся отдельно, но могут быть прочитаны и отредактированы (это зависит от системы). Как архивные, так и актуальные документы можно экспортировать на другие сайты, в другие информационные системы, конвертировать в другие форматы и т.п.

Коммерческие системы

Рассматриваемые в этом разделе продукты нацелены преимущественно на решение проблем предприятий, поэтому могут быть классифицированы как ECM-системы. Поскольку эти системы — коммерческие, не всегда можно выяснить, какие модели данных используются при их построении. Кроме того, ECM в принципе сложно классифицировать по предложенному нами сценарию, поскольку они, как правило, состоят из наборов различных сервисов и приложений, каждое из которых может использовать свою модель данных.

Documentum

Documentum — ведущий поставщик программного обеспечения для интегрированного управления документами и контентом. В области управления документами его ближайшими соперниками являются Open Text, IBM и FileNet, а в сфере управления контентом — Vignette, Stellent и Interwoven.

В области управления документами решения от Documentum наиболее надежны благодаря возможностям репликации контента и управления им на очень высоком уровне детализации (для переиспользования и перенацеливания), а также поддержке преобразований сложно структурированных документов, расширяемости репозитория и поддержке XML. Реализация Collaboration Edition в Documentum 5 и приобретение этой компанией eRoom заставило считать Documentum прямым конкурентом Open Text и Interwoven. Важные достоинства Documentum состоят в глубоком знании процессов управления потоком документов, контроля версий и управления архивами. Однако решения Documentum могут оказаться менее эффективными, чем некоторые решения-конкуренты, при обработке представления документов на больших Web-сайтах.

Система Documentum имеет объектно-реляционную архитектуру (т.е. объектная модель данных отображается на реляционную базу данных), поэтому в нашей классификации может быть отнесена к объектным CMS-системам.

FileNet

Этот поставщик, фокусирующийся на ECM, долго был лидером на данном рынке, а купив компанию eGail FileNet, вышел на рынок WCM. Это позволило FileNet предложить широкий спектр услуг организациям, реализующим решения для управления контентом. До сих пор компания фокусируется преимущественно на управлении процессами и поддержке транзакционного контента. В 2003 году FileNet представила архитектуру P8, которая поддерживает среды Microsoft и Java. Предлагаются следующие пакеты: Business Process Manager — автоматизация сложных бизнес-процессов; Content Manager — управление, совместное использование и доступ к документам или другим формам контента; Web Content Manager — автоматизация создания, одобрения и публикации контента на Web-сайтах; Image Manager — управление фиксированными типами контента, включая изображения, факсы и т.п.

IBM

Система IBM Content Manager позволяет организациям получать, хранить, управлять и распространять все формы цифрового контента, включая отсканированные текстовые документы, XML, HTML и мультимедиа. Недавно IBM перепроектировала данный программный продукт, усовершенствовав его, добавив в него функции управления документами, в том числе возможности контроля версий и поддержки ODMA. Это позволило позиционировать Content Manager как полное интегрированное решение для управления документами, предназначенное для потребителей, которые хотят пользоваться универсальным продуктом одного поставщика.

Другой ключевой момент — WCM-возможности. Корпорация анонсировала объединение Content Manager с WebSphere Portal, который обеспечивает возможности публикации в Web. Теперь Content Manager будет представлять собой репозиторий для WebSphere-портала. Content Manager также объединен с WebSphere Portal с помощью портлетов, позволяющих пользователю получать доступ к контенту всех типов. После приобретения компании Tarian Software, поставщика решений для управления записями, IBM расширила спектр своего ECM-инструментария за счет средств управления жизненным циклом контента.

Модель данных Content Manager — объектно-ориентированная.

Open Text

Open Text Livelink — это документо-ориентированный продукт, который кроме сервисов управления документами предоставляет мощный набор инструментов для совместной работы, включая групповые расписания, календари и возможности управления процессом работ. Livelink поддерживает Java, ActiveX, PDF и HTML. Эта система была разработана для корпоративных intranet-сред, не поддерживает интеграцию с репозиториями Microsoft Exchange, а ее интеграция с Lotus Notes/Domino возможна только в одном направлении. Livelink поддерживает поисковые запросы на естественном языке и кластеризацию результатов по темам, средства управления потоком документов и модули взаимодействия в режиме реального времени.

Архитектура системы — модульная, что позволяет отнести Open Text Livelink к системам модульного типа.

Interwoven

Interwoven — один из ведущих поставщиков средств WCM. Платформа для управления контентом Interwoven 5 нацелена на крупные компании из списка Fortune 500 и организации, нуждающиеся в контроле за критически важными бизнес-процессами. Платформа управляет всеми формами контента на протяжении всего его жизненного цикла. Ядро Interwoven 5 состоит из модулей TeamSite (управление контентом), MetaTagger (категоризация) и OpenDeploy (распространение контента). Дополнительные компоненты позволяют разрабатывать разнообразные Web-службы. Система имеет «гибридную» архитектуру, что означает возможность хранения контента как в базах данных, так и в файловой системе. При этом используется объектная модель данных.

Stellent

Как и Documentum, компания Stellent пришла на рынок WCM-приложений из области документно-ориентированных продуктов. CMS-решение этой компании состоит из сервера контента (Stellent Content Server), пакетного приложения для управления контентом и прикладных модулей. В состав последних входят Stellent Content Publisher (публикация контента на Web-сайтах) и Stellent Dynamic Converter (конвертирование при необходимости из исходного бизнес-контента в форматы, которые можно просматривать через Internet). Stellent Content Publisher и Stellent Dynamic Converter тесно связаны с Stellent Content Server; при совместном использовании они обеспечивают комплексное решение для управления контентом и автоматизации создания сайтов. Это решение реализует семь главных функций: Contribution, Native Source Management, Conversion, Web Source Management, Publishing, Deployment и Personalization. Подверженный влиянию своих документно-ориентированных «корней», Stellent Content Server не так хорош при построении сайтов из семейства компонентов, как продукты TeamSite и Vignette Content Server, которые проектировались именно для создания динамических сайтов.

Решение Stellent относится к модульной модели.

Vignette

Vignette — один из главных соперников Documentum в области WCM, который будет конкурировать с этой фирмой и в области Smart Enterprise Suite. Компания Vignette предлагает разнообразные средства создания Web-сайтов, интегрированные с технологиями электронной коммерции и аппаратом администрирования бизнес-процессов. Решение Vignette включает в себя функционал WCM, средства персонализации, портал и инструменты для интеграции приложений. Его архитектура — сервис-ориентированная, и в нашей классификации это решение наиболее близко к модульному типу.