Транзакции и методы сериализации транзакций

Поддержание механизма транзакций – показатель уровня развитости СУБД. Корректное поддержание транзакций одновременно является основой обеспечения целостности баз данных (и поэтому транзакции вполне уместны и в однопользовательских персональных СУБД), а также составляют базис изолированности пользователей во многопользовательских системах. Часто эти два аспекта рассматриваются по отдельности, но на самом деле они взаимосвязаны.

Под транзакцией понимается неделимая с точки зрения воздействия на БД последовательность операторов манипулирования данными (чтения, удаления, вставки, модификации) такая, что либо результаты всех операторов, входящих в транзакцию, отображаются в БД, либо воздействие всех этих операторов полностью отсутствует. Лозунг транзакции – «Все или ничего»: при завершении транзакции оператором COMMIT результаты гарантированно фиксируются во внешней памяти (смысл слова commit – «зафиксировать» результаты транзакции); при завершении транзакции оператором ROLLBACK результаты гарантированно отсутствуют во внешней памяти (смысл слова rollback – ликвидировать результаты транзакции).

Во многопользовательских системах с одной базой данных одновременно могут работать несколько пользователей или прикладных программ. Предельной задачей системы является обеспечение изолированности пользователей, т.е. создание достоверной и надежной иллюзии того, что каждый из пользователей работает с БД в одиночку. В связи со свойством сохранения целостности БД транзакции являются подходящими единицами изолированности пользователей. Действительно, если с каждым сеансом работы с базой данных ассоциируется транзакция, то каждый пользователь начинает работу с согласованным состоянием базы данных, т.е. с таким состоянием, в котором база данных могла бы находиться, даже если бы пользователь работал с ней в одиночку.

Для того, чтобы добиться изолированности транзакций, в СУБД должны использоваться какие-либо методы регулирования совместного выполнения транзакций. План (способ) выполнения набора транзакций называется сериальным, если результат совместного выполнения транзакций эквивалентен результату некоторого последовательного выполнения этих же транзакций.

Сериализация транзакций – это механизм их выполнения по некоторому сериальному плану. Обеспечение такого механизма является основной функцией компонента СУБД, ответственного за управление транзакциями. Система, в которой поддерживается сериализация транзакций, обеспечивает реальную изолированность пользователей.

Основная реализационная проблема состоит в выборе метода сериализации набора транзакций, который не слишком ограничивал бы их параллельность. Приходящим на ум тривиальным решением является действительно последовательное выполнение транзакций. Но существуют ситуации, в которых можно выполнять операторы разных транзакций в любом порядке с сохранением сериальности. Примерами могут служить только читающие транзакции, а также транзакции, не конфликтующие по объектам базы данных.

Между транзакциями могут существовать следующие виды конфликтов:

W-W – транзакция 2 пытается изменять объект, измененный не закончившейся транзакцией 1;

R-W – транзакция 2 пытается изменять объект, прочитанный не закончившейся транзакцией 1;

W-R – транзакция 2 пытается читать объект, измененный не закончившейся транзакцией 1.

Практические методы сериализации транзакций основывается на учете этих конфликтов.

Существуют два базовых подхода к сериализации транзакций – основанный на синхронизационных захватах объектов базы данных и на использовании временных меток. Суть обоих подходов состоит в обнаружении конфликтов транзакций и их устранении.

Для каждого из подходов имеются две разновидности – пессимистическая и оптимистическая. При применении пессимистических методов, ориентированных на ситуации, когда конфликты возникают часто, конфликты распознаются и разрешаются немедленно при их возникновении. Оптимистические методы основываются на том, что результаты всех операций модификации базы данных сохраняются в рабочей памяти транзакций. Реальная модификация базы данных производится только на стадии фиксации транзакции. Тогда же проверяется, не возникают ли конфликты с другими транзакциями.

Ограничимся рассмотрением более распространенных пессимистических разновидностей методов сериализации транзакций.

Синхронизационные захваты.Наиболее распространенным в централизованных СУБД (включающих системы, основанные на архитектуре «клиент-сервер») является подход, основанный на соблюдении двухфазного протокола синхронизационных захватов объектов БД. В общих чертах протокол состоит в том, что перед выполнением любой операции в транзакции T над объектом базы данных r от имени транзакции T запрашивается синхронизационный захват объекта r в соответствующем режиме (в зависимости от вида операции).

Основными режимами синхронизационных захватов являются:

· совместный режим – S (Shared), означающий разделяемый захват объекта и требуемый для выполнения операции чтения объекта;

· монопольный режим – X (eXclusive), означающий монопольный захват объекта и требуемый для выполнения операций занесения, удаления и модификации.

Захваты объектов несколькими транзакциями по чтению совместимы, т.е. нескольким транзакциям допускается читать один и тот же объект, захват объекта одной транзакцией по чтению не совместим с захватом другой транзакцией того же объекта по записи, и захваты одного объекта разными транзакциями по записи не совместимы. Правила совместимости захватов одного объекта разными транзакциями изображены на следующей таблице:

Таблица 1

Правила совместимости захватов одного объекта разными транзакциями

  X S
- да да
X нет нет
S нет да

В первом столбце приведены возможные состояния объекта с точки зрения синхронизационных захватов. При этом «–» соответствует состоянию объекта, для которого не установлен никакой захват. Транзакция, запросившая синхронизационный захват объекта БД, уже захваченный другой транзакцией в несовместимом режиме, блокируется до тех пор, пока захват с этого объекта не будет снят.

Заметим, что слово «нет» в нашей таблице соответствует описанным ранее возможным случаям конфликтов транзакций по доступу к объектам базы данных (WW, RW, WR). Совместимость S-захватов соответствует тому, что конфликт RR не существует.

Для обеспечения сериализации транзакций (третьего уровня изолированности) синхронизационные захваты объектов, произведенные по инициативе транзакции, можно снимать только при ее завершении. Это требование порождает двухфазный протокол синхронизационных захватов – 2PL. В соответствии с этим протоколом выполнение транзакции разбивается на две фазы:

· первая фаза транзакции – накопление захватов;

· вторая фаза (фиксация или откат) – освобождение захватов.

Достаточно легко убедиться, что при соблюдении двухфазного протокола синхронизационных захватов действительно обеспечивается сериализация транзакций на третьем уровне изолированности. Основная проблема состоит в том, что следует считать объектом для синхронизационного захвата?

В контексте реляционных баз данных возможны следующие альтернативы:

· файл – физический (с точки зрения базы данных) объект, область хранения нескольких отношений и, возможно, индексов;

· отношение – логический объект, соответствующий множеству кортежей данного отношения;

· страница данных – физический объект, хранящий кортежи одного или нескольких отношений, индексную или служебную информацию;

· кортеж – элементарный физический объект базы данных.

Гранулированные синхронизационные захваты. При применении этого подхода синхронизационные захваты могут запрашиваться по отношению к объектам разного уровня: файлам, отношениям и кортежам. Требуемый уровень объекта определяется тем, какая операция выполняется (например, для выполнения операции уничтожения отношения объектом синхронизационного захвата должно быть все отношение, а для выполнения операции удаления кортежа – этот кортеж). Объект любого уровня может быть захвачен в режиме S или X. Вводится специальные протокол гранулированных захватов и новые типы захватов: перед захватом объекта в режиме S или X соответствующий объект более верхнего уровня должен быть захвачен в режиме IS, IX или SIX.

IS (Intented for Shared lock) по отношению к некоторому составному объекту O означает намерение захватить некоторый входящий в O объект в совместном режиме. Например, при намерении читать кортежи из отношения R это отношение должно быть захвачено в режиме IS (а до этого в таком же режиме должен быть захвачен файл).

IX (Intented for eXclusive lock) по отношению к некоторому составному объекту O означает намерение захватить некоторый входящий в O объект в монопольном режиме. Например, при намерении удалять кортежи из отношения R это отношение должно быть захвачено в режиме IX (а до этого в таком же режиме должен быть захвачен файл).

SIX (Shared, Intented for eXclusive lock) по отношению к некоторому составному объекту O означает совместный захват всего этого объекта с намерением впоследствии захватывать какие-либо входящие в него объекты в монопольном режиме. Например, если выполняется длинная операция просмотра отношения с возможностью удаления некоторых просматриваемых кортежей, то экономичнее всего захватить это отношение в режиме SIX (а до этого захватить файл в режиме IS).

Предикатные синхронизационные захваты. Несмотря на привлекательность метода гранулированных синхронизационных захватов, следует отметить, что он не решает проблему фантомов (если, конечно, не ограничиться использованием захватов отношений в режимах S и X). Для решения этой проблемы необходимо перейти от захватов индивидуальных объектов базы данных, к захвату условий (предикатов), которым удовлетворяют эти объекты. Проблема фантомов не возникает при использовании для синхронизации уровня отношений именно потому, что отношение как логический объект представляет собой неявное условие для входящих в него кортежей. Захват отношения – это простой и частный случай предикатного захвата.

Поскольку любая операция над реляционной базой данных задается некоторым условием (т.е. в ней указывается не конкретный набор объектов базы данных, над которыми нужно выполнить операцию, а условие, которому должны удовлетворять объекты этого набора), идеальным выбором было бы требовать синхронизационный захват в режиме S или X именно этого условия. Но если посмотреть на общий вид условий, допускаемых, например, в языке SQL, то становится абсолютно непонятно, как определить совместимость двух предикатных захватов. Ясно, что без этого использовать предикатные захваты для синхронизации транзакций невозможно, а в общей форме проблема неразрешима. Эта проблема сравнительно легко решается для случая простых условий. Будем называть простым условием конъюнкцию простых предикатов, имеющих вид имя-атрибута { = > < } значение

Для простых условий совместимость предикатных захватов легко определяется на основе следующей геометрической интерпретации. Пусть R отношение с атрибутами a1, a2, ..., an, а m1, m2, ..., mn - множества допустимых значений a1, a2, ..., an соответственно (все эти множества – конечные). Тогда можно сопоставить R конечное n-мерное пространство возможных значений кортежей R. Любое простое условие «вырезает» m-мерный прямоугольник в этом пространстве (m <= n).

Тогда S-X, X-S, X-X предикатные захваты от разных транзакций совместимы, если соответствующие прямоугольники не пересекаются.

Это иллюстрируется следующим примером (Рис.1), показывающим, что в каких бы режимах не требовала Т1 захвата условия (1<=a<=4) & (b=5), а Т2 – условия (1<=a<=5) & (1<=b<=3), эти захваты всегда совместимы. Пример: (n = 2) .

Заметим, что предикатные захваты простых условий описываются таблицами, немногим отличающимися от таблиц традиционных синхронизаторов.

 

Рис.10. Предикатный синхронизационный захват Т1 и Т2

 

Метод временных меток. Альтернативный метод сериализации транзакций, хорошо работающий в условиях редких конфликтов транзакций и не требующий построения графа ожидания транзакций, основан на использовании временных меток.

Основная идея метода состоит в следующем: если транзакция T1 началась раньше транзакции T2, то система обеспечивает такой режим выполнения, как если бы T1 была целиком выполнена до начала T2. Для этого каждой транзакции T предписывается временная метка t, соответствующая времени начала T. При выполнении операции над объектом r транзакция T помечает его своей временной меткой и типом операции (чтение или изменение).

Перед выполнением операции над объектом r транзакция T1 выполняет следующие действия:

· Проверяет, не закончилась ли транзакция T, пометившая этот объект. Если T закончилась, T1 помечает объект r и выполняет свою операцию.

· Если транзакция T не завершилась, то T1 проверяет конфликтность операций. Если операции неконфликтны, при объекте r остается или проставляется временная метка с меньшим значением, и транзакция T1 выполняет свою операцию.

· Если операции T1 и T конфликтуют, то если t(T) > t(T1) (т.е. транзакция T является более "молодой", чем T), производится откат T и T1 продолжает работу.

· Если же t(T) < t(T1) (T "старше" T1), то T1 получает новую временную метку и начинается заново.

К недостаткам метода временных меток относятся потенциально более частые откаты транзакций, чем в случае использования синхронизационных захватов. Это связано с тем, что конфликтность транзакций определяется более грубо. Кроме того, в распределенных системах не очень просто вырабатывать глобальные временные метки с отношением полного порядка (это отдельная большая наука).

Но в распределенных системах эти недостатки окупаются тем, что не нужно распознавать тупики, а как мы уже отмечали, построение графа ожидания в распределенных системах стоит очень дорого.

Понятие и содержание информационного обеспечения. Определение информационной системы. Схема понятий информационного обеспечения

Информационное обеспечение является составной частью более широкого понятия информационных процессов. В нор­мативно-правовой трактовкеинформационные процессы определяются как «процессы создания, сбора, обработки, накоп­ления, хранения, поиска, распространения и потребления информации»\ и охватывают тем самым все сферы человеческой деятельности.

Информационное обеспечение чаще всего соотносится с организационно-управленческой и производственно-технологи­ческой сферой. Поэтому подинформационным обеспечением будем понимать совокупность процессов сбора, обработки, хра­нения, анализа и выдачи информации, необходимой для обеспе­чения управленческой деятельности и технологических процес­сов.

Основополагающим в определении информационного обеспечения является понятие информации.

Термининформация происходит от латинского informatio – разъяснение, изложение. До середины нашего столетия информация трактовалась как сведения, передаваемые людьми устным, письменным или другим (знаками, техничес­кими средствами) способом. После 50-х годов на фоне бурного развития средств связи и телекоммуникаций, возникновения и внедрения в различные сферы жизни электронно-вычислительной техники появились новые, расширенные трактовки понятия информация. Информацию в вероятностно-статистичес­ком (или энтропийном) подходе стали трактовать как уменьшение степени неопределенности знания о каком-либо объекте, системе, процессе или явлении, или изменение неопреде­ленности состояния самого объекта, системы, явления, про­цесса. Такую трактовку по имени ее автора, американского математика К. Э. Шеннона еще называют информацией по Шеннону.

Известна также и широко используется философская, или точнее говоря, общенаучная трактовка понятия информации как изменение объема и структуры знания воспринимающей системы. При этом под воспринимающей системой понимается не только собственно сам человек или его производные (кол­лектив, общество), но и, вообще говоря, любая система, напри­мер биологическая клетка, воспринимающая при рождении ге­нетическую информацию.

Существует еще и нормативно-правовая трактовка поня­тия информации, которая используется в законодательных актах, регламентирующих информационные процессы и технологии. Так, в часности, в законе РФ «Об информации, информатизации и защите информации» (от20.02.95№24-ФЗ)дается следующее определение термина на «информация» – сведения о лицах, предметах, фактах, событиях и процессах независимо от способа их представления. Добавим в связи с этим еще один важный нормативно-правовой аспект. Статья 128 Гражданско­го кодекса РФ информацию, наряду с вещами (включая деньги, ценные бумаги и иное имущество, в том числе имущественные права), работами и услугами, результатами интеллектуальной деятельности, нематериальными благами, определяет видом объектов гражданских прав, распространяя на нее тем самым весь институт гражданского права, включая права собственно­сти и авторское право.

Как представляется, в контексте рассмотрения содержания информационно-аналитической сферы наиболее подходящим является объединение общенаучной и нормативно-правовой трактовки понятия информации. Поэтому в дальнейшем инфор­мацию будем понимать как изменение объема и структуры зна­ния о некоторой предметной области (лица, предметы, факты, события, явления, процессы) воспринимающей системой (человек, организационная структура, автоматизированная информационная система) независимо от формы и способа представления знания.

При рассмотрении понятия информационного обеспечения в контексте обработки информации важное значение имеет понятие данных. От информации данные отличаются конкретной формой представления и являются некоторым ее подмноже­ством, определяемым целями и задачами сбора и обработки информации. К примеру, данные по сотрудникам какой-либо организации в виде формализованных учетных карточек кад­рового подразделения содержат лишь некоторый перечень не­обходимых сведений (ФИО, год рождения, образование, семейное положение, должность и т. д.) в отличие от огромного количества сведений, характеризующих каждого конкретного человека. Поэтому определим данные как информацию, отражающую определенное состояние некоторой предметной области в конкретной форме представления и содержащую лишь наиболее существенные с точки зрения целей и задач сбора и обработки информации элементы образа отражаемого фрагмента действительности.

Таким образом, информация на стадии данных характери­зуется определенной формой представления и дополнительной характеристикой, выражаемой термином структура.

Структура данных связана с понятиемпредставления ин­формации и определяется функциональной, логической, тех­нологической и т. п. структурой той предметной области, информацию о которой содержат данные. Вместе с тем данные могут быть представлены и в неструктурированной форме, что предопределяет технологические особенности их накопления и обработки. Таким образом, можно выделить неструктуриро­ванную и структурированную форму представления данных.

В качестве примеранеструктурированной формы можно привести:

• связный текст (т. е. документ на естественном языке – на литературном, официально-деловом и т.д.);

• графические данные в виде фотографий, картинок и про­чих неструктурированных изображений.

Примерамиструктурированной формы данных являют­ся:

• анкеты;

• таблицы;

• графические данные в виде чертежей, схем, диаграмм.

Способы сбора, анализа и обработки структурированных и неструктурированных данных существенно различаются. Наи­более развитыми в настоящее время, с точки зрения задач обработки и анализа информации, являются программные сред­ства обработки структурированных данных, т. к. структуриза­цию можно считать первичной и наиболее трудно формализуемой и алгоритмизируемой обработкой.

В плане оперирования с информацией в процессах ее со­здания (порождения), сбора, выдачи и потребления важное зна­чение имеет понятиедокументированной информации или просто документа. Можно сказать, что в большом количестве случаев информация предстает и фигурирует в образе документа, исключая ту часть информационных процессов, которые оперируют исключительно с данными, как, например, в автомати­зированных системах управления технологическими процесса­ми – АСУТП, где информация порождается в виде показаний датчиков (входные данные), обрабатывается, выдается и потреб­ляется в виде управляющих сигналов (выходные данные) на технологическое оборудование.

Как и в случае с понятием самой информации, существует несколько трактовок термина документ – историческая, орга­низационно-управленческая и нормативно-правовая трактов­ка.

Исторически документ понимался (и в определенных слу­чаях понимается сейчас) как объект, средство, способ для удо­стоверения личности, прав собственности и т. д.

В организационно-управленческом смысле документ пони­мается как служебный или организационно-распорядительный документ, т. е. как форма и способ выражения организационно-управленческих решений и воздействий.

В нормативно-правовом аспекте документ определяется как зафиксированная на материальном носителе информация с реквизитами, позволяющими ее идентифицировать.

Для традиционного «бумажного» документа совокупность реквизитов, идентифицирующих конкретный документ, опре­деляется соответствующими ГОСТами и руководящими доку­ментами по делопроизводству или отраслям технологической документации. Не вдаваясь в детали, отметим, что важнейшим реквизитом, идентифицирующим традиционные документы, является подпись должностного лица. Подобный подход для компьютерной информации в настоящее время развит в виде техники «электронных цифровых подписей», основанных на криптографических методах, также закреплен соответствующими ГОСТами и применяется в телекоммуникационных систе­мах передачи данных. Вместе с тем такие особенности компьютерной формы информации, как возможность ее эталонного копирования (т. е. практически мгновенного и в любых количе­ствах порождения полностью идентичных копий, экземпляров), делают процесс идентификации документов в компьютерной форме и в более широком смысле аспект юридического статуса документов в вычислительной среде сложной и до конца еще нерешенной проблемой.

Под документированием информации в широком смысле слова можно понимать выделение единичной смысловой части информации (данных) по некоторой предметной области в об­щей ее массе, обособление этой части с приданием ему само­стоятельной роли (имя, статус, реквизиты и т.п.). Процесс до­кументирования превращает информациюв информационные ресурсы.

Нормативно-правовая трактовка информационных ресурсов определяет их как «отдельные документы и отдель­ные массивы документов, документы и массивы документов в информационных системах (библиотеках, архивах, фондах, банках данных, других видах информационных систем).

Таким образом, документирование информации подводит к одному из самых фундаментальных понятий в сфере инфор­мационного обеспечения – информационным системам. Так же как и для понятий информации и документа, понятие ин­формационной системы многогранно и имеет несколько опре­делений и подходов. В нормативно-правовом смыслеинформационная система определяется как «организационно упо­рядоченная совокупность документов (массивов документов) и информационных технологий, в том числе и с использованием средств вычислительной техники и связи, реализующих информационные процессы.

В технологическом плане аспект использования средств вычислительной техники (СВТ) в информационных системах и обеспечение на этой основе автоматизации решения каких-либо задач проявляется в близком термине автоматизированная система «система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая ин­формационную технологию выполнения установленных функ­ций».

Опыт, практика создания и использования автоматизиро­ванных информационных систем в различных сферах деятель­ности позволяет дать более широкое и универсальное опреде­ление, которое полнее отражает все аспекты их сущности.

Под информационной системой в дальнейшем понимается организованная совокупность программно-технических и дру­гих вспомогательных средств, технологических процессов и функционально-определенных групп работников, обеспечивающих сбор, представление и накопление информационных ресур­сов в определенной предметной области, поиск и выдачу сведении, необходимых для удовлетворения информационных по­требностей установленного контингента пользователей – абонентов системы.

Исторически первыми видами информационных систем яв­ляются архивы и библиотеки. Им присущи все атрибуты ин­формационной системы.Они обеспечивают в какой-либо пред­метной области сбор данных, их представление и хранение в определенной форме (книго-, архивохранилища, каталоги и г. д.), в них определяется порядок использования информаци­онных фондов (т. е. определены абоненты, режимы и способы выдачи информации – абонементы, читальные залы и т. п.).

Информационные системы, в которых представление, хранение и обработка информации осуществляются с помощью вычислительной техники называютсяавтоматизирован­ными, или сокращенноАИС. Автоматизированные информа­ционные системы в настоящее время являются неотъемлемой частью современного инструментария информационного обес­печения различных видов деятельности и наиболее бурно раз­вивающейся отраслью индустрии информационных техноло­гий.

Таким образом, информационные системы являются основным средством, инструментарием решения задач информаци­онного обеспечения, а соотношение понятий, связанных с ин­формационным обеспечением, можно отобразить в виде схе­мы (рис. 11).

 
 

 

 


Рис. 11. Схема понятий информационного обеспечения

Технологическое и организационно-штатное воплощение информационного обеспечения в большинстве случаев осуще­ствляется в трех формах:

• служба документационного обеспечения управления (СлДОУ);

• информационная служба;

• экспертно-аналитическая служба.

Традиционной организационно-штатной и технологичес­кой структурой являетсяСлДОУ, которая в обобщенном виде реализует следующиефункции:

- организация и обеспечение делопроизводства и доку­ментооборота;

- документационное обеспечение подготовки и осуществ­ления управленческих решений через организацию и контроль разработки и согласования организационно-распорядительных и информационно-справочных документов;

- внутренний мониторинг (контроль реализации управ­ленческих решений, оценка их результатов через контроль и отслеживание прохождения документов).

Информационная служба (отдел автоматизации, вычис­лительный центр и т. д.) в общем виде обеспечивает решение следующих задач:

- сбор недокументированной и документированной ин­формации из внешних источников, необходимой для поддерж­ки управленческих и технологических процессов;

– внешний мониторинг (выявление и анализ управленчес­ких проблем, возникающих по внешним причинам);

- информационное оповещение и удовлетворение инфор­мационных потребностей управленческих и технологических структур;

- внутренний мониторинг (статистика, отчетность, оцен­ка результатов деятельности).

Экспортно-аналитическая группа (группы советников, консультантов, так называемых аналитиков) привлекается для:

• анализа различных управленческих, производственных ситуаций;

• выработки альтернатив управленческих решений;

• прогнозирования последствий управленческих решений.

Структура информационного обеспечения определяется структурой (циклом) функционирования информационных си­стем. В общем плане можно выделить следующие элементы цикла функционирования информационных систем.

• сбор информации;

• комплектование информацией;

• поиск и выдача сведений для абонентов системы;

• поддержание целостности, актуальности и сохранности информации.

Сбор информации представляет собой специальным обра­зом организованный порядок и процесс получения и отбора ин­формации, имеющей отношение к предметной области сведе­ний информационной системы, и включает:

• получение информации;

• оценку относимости информации;

• организационные схемы, порядок отбора и фиксации информации.

Получение информации осуществляется через организацию и использование системы источников и каналов получения информации.

Оценка относимости информации к предметной области сведений информационной системы в некоторых случаях осу­ществляется автоматически (информация сдатчиков в автоматизированных системах управления технологическими процес­сами — АСУ ТП), а в других случаях (системы обеспечения аналитических исследований, мониторинга социально-экономических или экологических процессов и т. п.) представляет сложную, многокритериальную классификационную задачу, слабо поддающуюся автоматизации и выполняемую специаль­ной категорией работников.

Организационные схемы, порядок отбора и фиксации ин­формации определяют организационную основу подсистемы сбора информации и обусловливаются характером и другими параметрами источников и каналов получения информации.

Комплектование информационной базы в различных ее формах в общем плане включает предварительную обработку (рубрикацию, структуризацию) и занесение информации.

Характер предварительной обработки информации опре­деляется формой представления входных данных (структури­рованная, неструктурированная), особенностями представления данных в информационной системе и может включать класси­фикацию сведений по определенным рубрикам (делам), разде­лам и т. п. предметной области с целью накопления материалов определенного характера, или объединенных каким-либо при­знаком, фактором. Структуризация информации представляет процесс преобразования документированной информации (т.е. информации на естественном неформализованном языке – обычно это текст документа) в семантику АИС, т. е. в инфор­мационный язык представления данных, используемый в конк­ретной информационной системе.

Занесение данных в информационную систему заключает­ся в добавлении новых сведений и, при необходимости, их отож­дествлении, слиянии и установлении взаимосвязи новых дан­ных с ранее накопленными. Принципиальное значение при этом имеет вопрос идентификации новых данных с возможно уже имеющимися в системе.

Важным моментом при занесении новой информации яв­ляется также установление ее логической взаимосвязи с ранее введенными данными. В некоторых видах АИС (информаци­онно-поисковые) такая задача является одной из основных, так как позволяет искать и устанавливать не всегда очевидные связи между информационными объектами и категориями сведений информационной системы. Комплектование информацией в таких случаях неотделимо от обработки и выдачи информации.

В информационных службах, обеспечивающих создание и эксплуатацию информационных систем, сбор и комплектова­ние информации осуществляют работникигруппы отбора («отборщики», «индексаторы»), квалификация которых помимо ин­формационной должна включать также знание конкретной пред­метной области информационных систем.

Поиск и выдача данных включают установление специ­ального организационно-технологического порядка удовлетво­рения информационных потребностей абонентов информаци­онной системы в управленческой деятельности и технологических процессах.

Удовлетворение информационных потребностей осуществляется через периодический плановый поиск и выдачу сведений, оповещение и обработку запросов, выполняемую организационными структурами (СлДОУ, информационная служба), орга­низующими и эксплуатирующими информационную систему.

Периодический плановый поиск и выдача сведений осуще­ствляются в целях обеспечения процессов организации, пла­нирования и осуществления конкретного вида деятельности, т. е. в основном для информационного обеспечения организа­ционно-управленческой деятельности. Данного рода задачи

включаются в функции и обязанности информационных, ин­формационно-аналитических и других информационно – обес­печивающих служб и заключаются, как правило, в формирова­нии и выдаче статистических и сводных данных по периоди­чески повторяющимся ситуациям в управленческой и производственной сфере.

Оповещение и обработка запросов представляют собой формы информационного обслуживания управленческих и про­изводственно-технологических структур. Оповещение может осуществляться в форме инициативно-сигнального оповещения, объектового и планово-периодического оповещения.

Объектовое оповещение обычно осуществляется через выдачу абонентам информационной системы любых новых дан­ных по определенному объекту, тематике, событию и т. п., появляющихся в АИС из любых источников.

Планово-периодическое оповещение производится через выдачу абонентам всех новых данных, поступивших к опреде­ленному плановому сроку из всех источников в информационную систему по определенному объекту, тематике, событию, проблеме.

Обработка запросов и выдача по ним сведений является одной из основных функций информационных служб. Данная деятельность регламентируется по вопросам инициирования, санкционирования и формы подачи запросов, форм и способов выдачи информации по запросам, учета запросов и т. д.

Поддержание целостности и сохранности информации, пересмотр, ревизия и отсеивание утратившей актуальность информации являются неотъемлемой функцией информацион­ных подразделений, создающих и поддерживающих информа­ционные системы. Данные задачи решаются категорией работ­ников, называемыхадминистраторами АИС. Администрато­ры обеспечивают создание и поддержание банков данных АИС, организацию разграничения доступа к ним, защиту информа­ции от несанкционированного доступа (НСД), ее резервирова­ние и восстановление при разрушении или утрате ее целостно­сти вследствие преднамеренных и непреднамеренных воздей­ствий или ситуаций. Подобного рода задачи требуют высокой квалификации персонала и выполняются наиболее подготов­ленными информационными работниками.

Периодическая ревизия информации в банках данных АИС призвана проверить целостность (не нарушены ли внутренние взаимосвязи информационных объектов) и сохранность данных, а также удалить из АИС информацию, потерявшую свою акту­альность. Удаление информации из АИС, как и ее занесение в АИС, регламентируется специальными нормативно-инструктив­ными документами.