Модель процесса накопления.

В автоматизированных системах обработки информации и упра­вления данные являются основой для формирования концептуаль­ной модели реального производственного процесса. Обработка ин­формации при наличии алгоритмов управления требует входных данных, в процессе обработки формируются промежуточные и вы­ходные данные. При структуризации данных могут возникать новые знания, формироваться информационный ресурс с целью оптималь­ного управления производством. При известном наборе функци­ональных задач автоматизированной системы, составляющих ее функциональную структуру, и совокупности алгоритмов решения вычислительных задач, входящих в алгоритмическую структуру АСУ, возникает проблема создания информационного обеспечения. Информационная технология в управлении производством, в науч­ных исследованиях, в проектировании, в обучении требует целенап­равленного накопления данных. В основе этого процесса должны лежать формализованные модели, позволяющие синтезировать ин­формационную базу АСУ.

Инфологическая модель предметной области. Исходная инфор­мация для синтеза информационной базы формально представляет­ся в виде инфологической модели предметной области. Эта модель совместно с наборами хранимых данных и алгоритмами обработки информации позволяет построить каноническую схему информаци­онной базы, от которой можно перейти к логической схеме, а от нее — к физическому уровню реализации информационного обес­печения. Таким образом, процесс обработки сопровождается накоп­лением данных.

Построение инфологической модели предусматри­вает определение:

1) множества данных и функциональных отноше­ний между ними;

2) значений данных и функциональных отношений, задающих способы обращения к ним при реализации алгоритмов;

3) выбор оптимальных вычислительных схем алгоритмов.

Инфологическую модель предмет­ной области задают следующие параметры:

{Dk} — множество имен элементов данных dk с длиной lk;

zk— количество изменений значения данных за определенный интервал

времени;

aj — множест­во алгоритмов;

fj — частота реализации j-го алгоритма;

N=N1È N2È N3— множество наборов данных, где N1, N2, N3

со­вокупности входных, промежуточных и выходных данных

соответ­ственно;

Ф— совокупность функциональных отношений.

 

Вычислительный граф системы обработки и информационный граф системы позволяют формализованно определить инфологическую модель предметной области. В процессе обработки и накоп­ления данных формируются новые наборы данных, при этом можно различать два крайних случая:

1. Формирование набора данных на основе вычислительного
алгоритма
, т. е. для имеющихся входных наборов данных на основе
вычислений получают выходные данные. Последовательность использования вычислительных модулей для формирования выход­ного набора данных определяется вычислительной граф-схемой алгоритма в виде ориентированного графа без петель. В вершинах графа располагаются вычислительные модули, а дуги графа отображают отношение предшествования между ними.

2. Вычисление значений набора данных по имеющимся старым
значениям
и по совокупности изменений, возникающих в первичном
наборе данных. Эти процедуры осуществляются на основе алгоритмов корректировки набора данных. Корректировка возможна в том
случае, если корректируемый набор данных уже ранее был запрошен и хранится в информационной базе.

Таким образом, в модели накопления данных может быть выяв­лено два основных типа алгоритма нахождения новых наборов: вычислительный алгоритм и алгоритм корректировки набора дан­ных. Реализация вычислительного алгоритма при запросе обычно необходима тогда, когда запрашиваемый набор данных не хранится в информационной базе. При наличии этого набора более удобно использовать алгоритм корректировки. Вычислительный алгоритм реализуется на базе информационного графа системы, алгоритм корректировки базируется на списке изменений, вносимых в первич­ный набор данных.

Независимо от используемого алгоритма вычислительный мо­дуль выполняет определенные процедуры, включающие в себя дей­ствия над данными. На логическом уровне возникает задача специ­фикации действий, т. е. определение входных и выходных наборов данных для действий, а также взаимосвязей между различными действиями. При этом можно выделить два типа функциональных (логических) элементов: элементы — действия Qи элементы — объекты действий D. Элементы действия Qхарактеризуются внешними связями и ресурсами. Такой элемент реализует опреде­ленное преобразование над данными с использованием в качестве ресурсов элементов типа Qи элементов типа D. В качестве объектов действий выступают данные, которые характеризуются именем, типом и значением. Тип определяет множество значений, которые принимают объекты данного типа. Объект действий задается струк­турой, т. е. составом компонентов и связей между ними. Элемент Qвзаимодействует с элементами D1, О2, D3через связи типа: 1 — «вход», 2 — «выход», 3— «вход — выход» (рис. 6).

 


Рис. 6

 

Каноническая структура информационной базы. При известной инфологической модели предметной области, наличии вычисли­тельного и информационного графов возникает проблема создания модели накопления данных, в основе которой лежит задача выбора хранимых данных. Пусть совокупность используемых наборов дан­ных Nразделена на N1первичных (входных), N2 промежуточных и N3выходных наборов данных, т. е. N=N1È N2È N3.

Получение наборов данных N3 осуществляется на основе вычислительных ал­горитмов и алгоритмов корректировки. Вычислительный алгоритм представляется вычислительной схемой, т. е. подграфом вычисли­тельного графа. Алгоритм корректировки базируется на множестве первичных данных N1. Даже при наличии лишь двух классов ал­горитмов возникает задача выбора типа алгоритма в соответствии с запросом пользователя. Если по запросу необходимо получить некоторый набор данных, то в качестве критерия выбора типа алгоритмов можно использовать полное время создания этого на­бора по данному запросу. При использовании вычислительного алгоритма это время складывается из времени, которое затрачива­ется на получение входных наборов данных для выбранного вычис­лительного модуля, и времени вычислении набора данных этим модулем. Для сравнения необходимо найти время, которое затрачи­вается в случае применения алгоритма корректировки. Корректи­ровка набора целесообразна, если структура данных уже ранее была задана в одном из предыдущих запросов. В качестве дополнитель­ного ограничения при решении задачи выступает объем использу­емой памяти. Рациональное сочетание вычислительных алгоритмов и алгоритмов корректировки данных позволяет уменьшить суммар­ное время реализации всех запросов при накоплении данных.

Инфологическая модель предметной области позволяет подойти к решению двух задач: задачи синтеза информационной базы и за­дачи управления вычислительным процессом. При синтезе инфор­мационной базы необходимо установить ее структуру. Представле­ние информации пользователей дает каноническая структура ин­формационной базы, поэтому построение модели накопления дан­ных должно базироваться на синтезе канонической структуры. Это проводится при следующих требованиях:

- единство инфологической модели для множества предметных областей, обслуживаемых ин­формационной базой;

- выбор безизбыточного набора информацион­ных элементов и связей между ними;

- реализация интерфейса пользователя с информационной базой в терминах инфологической модели предметной области;

- возможность простого перевода поня­тий канонической структуры в понятия логического и физического уровней представления информационной базы.

Решение задачи син­теза канонической структуры информационной базы предполагает:

1) выбор и упорядочение ключевых реквизитов для множества
бинарных отношений, хранимых в информационной базе;

2) формирование логических записей на основе объединения
значений реквизитов;

3) определение множества логических записей и связей между
ними на основе критерия минимума суммарного времени работы
с наборами данных как в режиме вычислительных алгоритмов, так
и в режиме алгоритмов корректировки.

Упорядочение ключевых реквизитов отношений должно базиро­ваться на возможности физической реализации информационной базы. Учитывая, что современные СУБД не могут реализовать п-арные отношения между данными, представим любое отношение в виде совокупности бинарных отношений. Это означает упорядоче­ние реквизитов, входящих в ключ каждого функционального от­ношения Ф, что можно осуществить на основе построения графа, отображающего (di dj)2, где i¹J; i, j=1-N; 1 < r < N-1. Для этого графа матрица Q, отображающая взаимосвязь между отдельными данными и группами данных, имеет вид

 

 

В общем случае под di, dj можно понимать некоторые обобщен­ные информационные элементы, представляющие собой элементы данных либо группы, составленные из этих элементов: qij = 1, если существует взаимосвязь (в том числе возможна и семантическая) между элементами di, dj; qij = 1 при отсутствии взаимосвязи. Если строка матрицы Qсодержит все нулевые элементы, то этой строкой отображаются входные данные. В информационном графе эти дан­ные соответствуют корневым вершинам. Если столбец матрицы Qсодержит все нулевые элементы, то он отображает терминальные, т. е. выходные, данные. На информационном графе эти данные соответствуют концевым вершинам. Остальные информационные элементы, отображаемые строками и столбцами матрицы Q, отне­сем к групповым элементам. На информационном графе они распо­лагаются в промежуточных вершинах. Объединение множеств значе­ний реквизитов можно выполнить на основе оценки взаимосвязи групповых элементов с подчиненными им выходными.