Документарный анализ

Реализация базы данных и ее предварительное моделирование не могут производиться без анализа документов, участвующих в деятельности предметной области, что нашло отражение в предыдущих разделах, когда проводился анализ бизнес-процессов и функций. Рассмотрение этих документов позволило выявить ряд информационных объектов предметной области, участвующих в реализации функций и задач, а также выделить из них атрибуты, значения которых могут быть сформированы в процессе выполнения соответствующих функций и задач.

До настоящего момента рассматривался процессно-ориентированный подход к анализу предметной области и выделения ее информационной составляющей, подготавливая информацию о необходимых информационных структурах, давая базовые сведения о будущем представлении базы данных.

Под процессно-ориентированным подходом понимается технология рассмотрения предметной области и ее составляющих с точки зрения выделения и детализации реализуемых процессов, обозначая информационные объекты в качестве элементов, обеспечивающих эффективную работу с данными.

Документарный анализ, при том, что он используется в процессно-ориентированном подходе, является инструментом другого подхода к анализу предметной области — информационно-ориентированному. Такой анализ не дает понимания процессов, выполняемых в предметной области, но позволяет выделить систему документооборота и задачи обработки документов в части наполнения их сведениями и движения между заинтересованными сотрудниками предметной области.

Под информационно-ориентированным подходом понимается процесс анализа информационных объектов предметной области, к которым, в первую очередь, относятся документы, в котором рассматриваются атрибуты как источники сведений о предметной области и правила движения информации в рамках организационной структуры организации, деятельность которой изучается.

Такое разделение в подходах анализа предметной области зачастую приводит к реализации различных видов информационных систем, обрабатывающих данные. Так, при процессно-ориентированном подходе реализуется информационная система, где деятельность пользователя строится по принципу выполнения операций бизнес-процессов, а документы, которые участвуют в бизнес-процессах, являются либо отчетными формами, либо промежуточными информационными элементами, либо исходными сведениями, которые невозможно получить из базы данных.

В то же время, при информационно-ориентированном подходе построенная информационная система во главу угла будет ставить операции по наполнению электронных документов данными и определение правил вспомогательного наполнения на основе ранее сформированных документов. Таким образом, информационно-ориентированный подход приводит к появлению системы электронного документооборота как полнофункциональной реализации либо системы документарного хранения данных, формирующего архив документов.

Говорить о том, что один подход лучше другого, нельзя, поскольку у них стоят разные целевые задачи и реализация информационной системы вполне может быть обоснованной и в том и в другом случае. Однако в информационно-ориентированном подходе есть одно неоспоримое преимущество перед процессно-ориентированном подходом — это возможность детального рассмотрения движения документов между элементами упорядоченной структуры организации, что в рамках процессно-ориентированного подхода в явном виде не представляется, хотя и может быть выделено на основе сведений о бизнес-процессах, функциях, реализующих их подразделениях и сотрудниках, и информационных объектах, о которых известно, то они являются документами в предметной области.

Информационно-ориентированный подход главным в рассмотрении предметной области выделяет документ как источник информации о структуре обрабатываемых данных. Таким образом, документарный анализ предметной области, с точки зрения информационно-ориентированного подхода, предполагает определение нескольких моделей работы с документами:

• движение документов между подразделениями (документооборот), что базируется на знании организационной структуры фирмы и выделении владельцев, ответственных, создателей и пользователей документов;

• последовательность взаимодействия документов, где определяется процесс передачи данных из одних документов в другие с момента зарождения исходного документа, основанного на сведениях из предметной области, не имеющихся в информационной системе, до завершения наполнения сведениями последнего документа, завершающего логическую цепочку обработки документов, что выражается, как правило, выходом документа во внешнюю среду за пределы предметной области.

Модель последовательности взаимодействия документов частично формирует процесс работы сотрудников организации, но иллюстрирует

не столько выполняемые бизнес-процессы, сколько задачи внесения в документы соответствующих сведений в отдельные атрибуты.

Использование информационно-ориентированного подхода наряду с процессно-ориентированным, в качестве вспомогательного инструмента анализа предметной области, является очень полезным, поскольку существенно уточняет некоторые функциональные задачи сотрудников организации, определяет процессы движения документов и информационных объектов предметной области, а также позволяет еще раз проверить корректность описанных ранее структур информационных объектов и, при необходимости, уточнить их, добавив новые атрибуты, или скорректировать само наполнение информационными объектами процессов предметной области.

Для построения модели документооборота необходимо предварительно понимать организационную структуру фирмы и, возможно, выделить функциональные роли сотрудников в разрезе работы с документами.

Под ролью в организационной структуре понимается логически законченная функциональная деятельность сотрудника или подразделения, направленная на решение бизнес-задачи или управление работой с документами.

Здесь надо понимать, что роль по работе с документами должна определять именно полноценное управление выделяемыми документами, что выражается не только и не столько в наполнении документов сведениями, сколько в организации движения документа между подразделениями и определении правил его использования. То есть роль по работе с документами определяет, что соответствующий сотрудник или подразделение являются владельцами документа и управляют работой с ним. Такое выделение ролей свойственно для информационно-ориентированного подхода, нежели для процессно-ориентированного, что объясняется точкой зрения рассмотрения предметной области.

В результате анализа организации выделяется се структура в виде взаимосвязи подразделений и сотрудников, их соподчинения и формируется модель организационной структуры (рис. 2.32). На первичном этапе анализа организационная структура будет содержать только элементы "Подразделение" и "Сотрудник", поскольку о документах пока речь не идет, но впоследствии, когда появится информация о движении документов, модель организационной структуры пополнится элементами "Роль".

Представленный пример организационной структуры показывает, что в рассматриваемом электронном магазине имеются четыре основных структурных подразделения, которые отвечают за соответствующие функции:

— отдел продаж обеспечивает управление продажей товаров и услуг, предоставляя коммуникацию с клиентами (покупателями);

- финансовый отдел занимается вопросами финансового обеспечения закупок, получения финансовых средств от клиентов (покупателей);

склад реализует задачи размещения товаров на территории складских помещений и контроль поступления и выдачи товаров;

— отдел закупок обеспечивает планирование закупок товаров в соответствии со сведениями о потребностях клиентов.


Рис. 2.32. Организационная структура электронного магазина



Некоторые подразделения включают в себя ряд вспомогательных подразделений, выделяя отдельные функции, учитывая особенности их проведения и требования законодательства и внутренних регламентов. Также каждое подразделение представляется руководителем (например: начальник отдела продаж и т.д.) и исполнителями функций подразделения. Именно эти ресурсы (сотрудники) будут исполнять функциональные роли, обеспечивающие формирование и движение документов, а также обработку данных из базы данных.

Выделение организационной структуры, и в частности сотрудников организации с их функциональными ролями, ввиду современной структуры базы данных, включающей не только структуры данных и процедуры обработки, но и пользователей с ролями доступа к объектам базы данных, является важной частью разработки базы данных, и особенно в части работы с документами, поскольку понимание доступности и функций обработки данных документов позволит разработчику точно выделить правила, по которым каждый пользователь информационной системы будет взаимодействовать с базой данных.

Теперь, когда известна организационная структура и определены функциональные особенности каждого подразделения и сотрудников, можно переходить к рассмотрению непосредственного документооборота. Первое представление документооборота, в интересах дальнейшей реализации базы данных, отражает движение документов между подразделениями. Причем, данное представление не отражает последовательность создания и движения документов, а отражает только перемещение документов от источника к получателю. Такое отражение документооборота обусловлено тем, что, во-первых, ранее уже рассматривался процесс работы с документами в форме бизнес-процессов и вспомогательных процессов обработки информационных объектов, а во-вторых, суть модели документооборота в рассматриваемом представлении отражает доступность документов отдельным подразделениям и участникам процессов предметной области. Это позволит сформировать требования к форме доступности данных, документов и процедур обработки в разрезе отдельных пользователей и их ролей.

Различные модели документооборота называются документограммами. Одной из таких моделей документооборота является диаграмма, отражающая движение документов между подразделениями организации. Эта модель позволяет разработчику увидеть и оценить количество документов, обрабатываемых отдельными подразделениями организации, и определиться с доступностью как самих документов, так и процедур обработки и отдельных информационных элементов (атрибутов и записей) пользователям информационной системы, что найдет свое отражение в базе данных при организации системы информационной безопасности уровня СУБД.

Основной принцип построения такой документограммы (модели документооборота) определяет, что узлами в модели являются подразделения и, в случае необходимости, отдельные категории сотрудников (рис. 2.33). Па связях же между подразделениями в документограмме отражаются документы, перемещаемые в направлении, указываемом соответствующей стрелкой.

Рис. 233. Пример документограммы движения документов


Документограммы могут быть достаточно большими, особенно когда речь идет о большом перечне документов, перемещаемых между подразделениями. В связи с этим, они зачастую формируются для реализации отдельных бизнес-процессов, а возможно, и для бизнес-функций. В результате разработчик получает наглядную модель того, с какими документами и какие подразделения работают. Особо нужно отметить наличие в документограмме элемента "Информационная система", которая может разбиваться на отдельные модули, если это необходимо для уточнения модели. Обычно в документограммах элементы типа "Информационная система" не используются, поскольку физически не являются ни поставщиками, ни потребителями документов, но, когда речь идет о реализации системы, где информационная система является участником процесса, то ее появление в документограмме обосновано.

В рассматриваемом примере элемент "Информационная система" самостоятельно, без участия подразделений организации формирует каталог товаров для клиента. Конечно, ранее этот каталог товаров был создан соответствующими структурными подразделениями организации, но, поскольку разрабатываемое решение не предполагает работу по автоматизации такой задачи этих подразделений, рассматриваем, что каталог товаров уже существует и периодически корректируется, но подразделения, которые занимаются его корректировкой, с клиентом напрямую не взаимодействуют. В таком случае можно говорить, что документ "Каталог товаров" для клиента формирует модуль информационной системы, отвечающий за предоставление списка товаров по указанным параметрам, который может быть представлен, например, поисковой подсистемой.

В итоге формирования документограммы формируется понимание основных функций работы с документами. Так, например, когда документ в документограмме поступает на вход структурного подразделения или сотрудника, то это может рассматриваться как операция чтения и использования документа. Если документ в документограмме выходит из структурного подразделения организации, то это определяет операцию создания документа с внесением в него основных или полных сведений. Если документ проходит через структурное подразделение, т.е. поступает на вход и движется далее через выходной поток, то здесь возможны операции "Согласование", "Утверждение", "Корректировка", "Наполнение", "Транспортирование" и т.д. В зависимости от того, какие функции работы с документами разработчики стремятся отразить при формировании документограммы, возможны различные варианты интерпретации процессов работы с документами. Поскольку на документограмме достаточно сложно отразить эти процессы, то для этого используются органиограммы (рис. 2.34), где не только иллюстрируется работа подразделений с документами, но и отражаются выполняемые над документами операции.

Рис. 2.34. Пример органиограммы работы с документами


В данной органиограмме могут использоваться следующие обозначения: • Р — рождение документа, когда в форму документа заносятся первичные данные или формируются из другого документа;

• И — использование документа, где с документом не происходит никаких операций, кроме чтения и, возможно, печати в твердую бумажную копию;

• С — согласование документа, когда сотрудник организации проверяет правильность наполнения документа и возможность его использования для дальнейших операций;

• У — утверждение документа, когда руководитель подразделения или организации придает юридическую силу документу для последующего его использования в качестве регламентирующего и руководящего документа;

• Н — наполнение документа, где участник процесса вносит в документ дополнительные сведения;

• X — хранение документа, где рассматривается задача накопления заполненных документов в архив;

• Т — транспортирование документа, где участник процесса работы с документом не производит с ним никаких действий, но обеспечивает его передачу другому участнику бизнес-процессов.

Таким образом, органиограмма существенно уточняет документограмму, давая более детальную информацию разработчику базы данных по использованию отдельных функций при работе с документами (отчетными формами) и сведениями, которые в них содержатся. Но документо- граммы и органиограммы не дают всей полноты информации о работе с данными в документах, что требует формирования еще одного элемента анализа документоборота, называемого таблицей доступности элементов документов (табл. 2.6).

Таблица 2.6

Доступность документов

№ п/п

Документ

Участник

Операции

Периодичность

1

Каталог

Информационная система

Ф

По требованию

2

товаров

Клиент

Ч

3

Заказ

- " -

Д И У ч п

- ” -

4

клиента

Отдел продаж

ч и

5

Склад

ч п

6

Бухгалтерия

ч п

7

...

...



Данная таблица даст возможность увидеть форму работы с документом и с его данными отдельных участников информационной системы. Расширение этой таблицы возможно в части указания конкретных типов пользователей, сопряженных с сотрудниками организации, и выделения ролей пользователей с одновременным их указанием на уровне организационной структуры. Такой процесс позволит, при рассмотрении вопросов информационной безопасности базы данных, определить четкие схемы доступа пользователей к данным, процедурам, представлениям, таблицам и прочим объектам. Для описания доступности документов и их элементов используются следующие операции доступа:

• Ф — формирование документа, представляемого в форме чтения сведений из других источников (документ, база данных, информационная система);

• Д — добавление данных, предполагающее внесение новых записей в документ, используя интерфейсные формы ввода;

• И — изменение данных, обеспечивающее внесение сведений через интерфейсные средства ввода вместо уже существующих сведений;

• У — удаление существующих данных;

• Ч — чтение данных или документа в целом;

• П — возможность вывода на печатающее устройство документа в его печатной форме.

Опускаясь глубже в документы, разработчики баз данных анализируют их структурный состав. Такой анализ позволяет выделить атрибутивный состав документов и информационных объектов, представленных в этих документах (рис. 2.3*5).

Рассмотрение документа позволяет выделить основные группы атрибутов, которые в нем присутствуют: "Заказ", "Организация-продавец", "Клиент-покупатель", "Товары". Это можно сделать, основываясь на структуре документа и понимании отношения отдельных атрибутов к тому или иному информационному объекту. Так, например, таблица со списком товаров выделяется самостоятельным оформлением в документе, структурированностью и позволяет сделать вывод о самостоятельности данного информационного объекта. Тем не менее, рассмотрев таблицу товаров, можно увидеть итоговую строку, где отражена общая стоимость заказанных товаров, что имеет отношение не к каждой товарной позиции в документе, а ко всему заказу и этот параметр документа должен быть отделен от рассмотрения таблицы и учтен при анализе информационного объекта "Заказ". Важно понимать, что такой анализ достаточно трудоемок и требует в процессе рассмотрения документа сразу выделять информационные объекты, определяя их атрибутивное наполнение.

Как правило, в структурированных документах, которых большинство в информационных системах, эго можно сделать достаточно легко, выделив, хотя бы, базисные группы атрибутов и объединив их в информационные объекты. Но, когда речь идет о неструктурированных документах (заявления, приказы, распоряжения и т.д.), то правильное выделение информационных объектов и их атрибутивного состава зачастую становится неразрешимой задачей. Поэтому в документарном анализе иногда прибегают к упрощенному методу, когда атрибуты выделяются без привязки к информационным объектам, а их группирование осуществляют в процессе моделирования логической модели базы данных, отбрасывая часть атрибутов за ненадобностью, а часть атрибутов, используя правила нормализации, объединяют в информационные логические структуры. Для проведения такой работы разработчиками формируется специальная таблица описания атрибутов документов (табл. 2.7).

Рис. 2.35. Пример документа "Заказ клиента"


Таблица 2.7

Пример описания атрибутов документа

п/п

Атрибут

Тип

данных

Алгоритм

Описание

1. Заказ клиента (Д1)

1.1

Номер заказа

С-Ч

Порядковый номер документа "Заказ клиента", представляемый кодированным номером, содержащим три компонента, разделенных знаком "-": тип заказа (К — заказ клиента), порядковый номер заказа в течение года (состоит из 4 цифр с ведущими нулями), год оформления заказа

1.2

Дата оформления

д

Дата, когда заказа окончательно был оформлен и передан в обработку менеджеру магазина. После оформления заказа внесение любых изменений недопустимо

1.3

Организация

с

Наименование организации, в которой был оформлен заказ клиента




п/п

Атрибут

Тип

данных

Алгоритм

Описание

1.4

Адрес (организации)

С

Совокупность элементов географического позиционирования организации. Представляется разделенными знаком "," элементами: индекс, город, улица, номер дома, номер строения, номер корпуса

...

...

1.8

11омер по порядку

Ч

Порядковый номер в таблице выбранных в заказ товаров. Представляется только для документа.

...

...

...

...

1.12

Стоимость

товара

Ч

1.104.11

Вычисляемое значение стоимости конкретной позиции товара в заказе клиента, основанное на перемножении количества приобретаемого товара на цену единицы

...

...

...

...


При таком описании атрибутивного состава разработчиком обязательно дается пояснение в колонке "Описание" сути рассматриваемого атрибута и особенностей его использования. Наряду с этим, в колонке "Алгоритм" показывается формула, по которой производят вычисление соответствующего значения, давая возможность при реализации базы данных правильно определить правило вычисления: вычисляемое ноле таблицы, запрос выборки с вычислением и т.д.

Чтобы можно было корректно создать формулы, поскольку зачастую для вычисления необходимо обращаться к разным информационным объектам или документам, нумерацию атрибутов группируют в рамках каждого отдельного документа, используя нумерацию и ее применение в кодировании документов, что показано в строке с наименованием документа.

Как правило, документы, используемые в предметной области, практически полностью содержат информацию о структурах объектов, их наименовании и классификации. Для этого в шапках таблиц, если документ представлен табличной структурой, самый нижний уровень представляет атрибут объекта, следующий уровень при рассмотрении в направлении верхних строк шапки таблиц — объект предметной области, а последующие уровни — классы объектов.

Если документ представляется в свободной форме, где явно не обозначены структуры объектов, то выделение объектов производят на основании анализа естественного языка, используя имена существительные в качестве их идентификации.