Понятие информационной базы и способы ее организации
Основной частью внутримашинного информационного обеспечения является информационная база.
Информационная база (ИБ) - это определенным способом организованная совокупность данных, хранимых в памяти вычислительной системы в виде файлов, с помощью которых удовлетворяются информационные потребности управленческих процессов и решаемых задач.
Файл - это некоторое множество записей однородной структуры, предназначенное для решения экономических задач.
Запись - это набор полей определенного формата, объединенных по общему ключевому полю.
Все файлы ЭИС можно классифицировать по следующим признакам:
· по этапам обработки (входные, базовые, результатные);
· по типу носителя (на промежуточных носителях - гибких магнитных дисках и магнитных лентах и на основных носителях - жестких магнитных дисках, магнитооптических дисках и др.);
· по составу информации (файлы с оперативной информацией и файлы с постоянной информацией);
· по назначению (по типу функциональных подсистем);
· по типу логической организации (файлы с линейной и иерархической структурой записи, реляционные, табличные);
· по способу физической организации (файлы с последовательным, индексным и прямым способом доступа).
Входные файлы создаются с первичных документов для ввода данных или обновления базовых файлов.
Файлы с результатной информацией предназначаются для вывода ее на печать или передачи по каналам связи и не подлежат долговременному хранению.
К числу базовых файлов, хранящихся в информационной базе, относят основные, рабочие, промежуточные, служебные и архивные файлы:
· Основные файлы должны иметь однородную структуру записей и могут содержать записи с оперативной и условно-постоянной информацией.
· Оперативные файлы могут создаваться на базе одного или нескольких входных файлов и отражать информацию одного или нескольких первичных документов.
· Файлы с условно-постоянной информацией могут содержать справочную, расценочную, табличную и другие виды информации, изменяющейся в течение года не более чем на 40%, а следовательно, имеющие коэффициент стабильности (Кст) не менее 0,6.
· Файлы со справочной информацией должны отражать все характеристики элементов материального производства (материалы, сырье, основные фонды, трудовые ресурсы и т.п.). Как правило, справочники содержат информацию классификаторов и дополнительные сведения об элементах материальной сферы, например о ценах.
· Нормативно-расценочные файлы должны содержать данные о нормах расхода и расценках на выполнение операций и услуг.
· Табличные файлы содержат сведения об экономических показателях, считающихся постоянными в течение длительного времени (например, процент удержаний, отчислений и пр.). Плановые файлы содержат плановые показатели, хранящиеся весь плановый период.
· Рабочие файлы создаются для решения конкретных задач на базе основных файлов путем выборки части информации из нескольких основных файлов с целью сокращения времени обработки данных.
· Промежуточные файлы отличаются от рабочих файлов тем, что они образуются в результате решения экономических задач, подвергаются хранению с целью дальнейшего использования для решения других задач. Эти файлы, так же как и рабочие файлы, при высокой частоте обращений могут быть также переведены в категорию основных файлов.
· Служебные файлы предназначаются для ускорения поиска информации в основных файлах и включают в себя справочники, индексные файлы и каталоги.
· Архивные файлы содержат ретроспективные данные из основных файлов, которые используются для решения аналитических, например прогнозных, задач. Архивные данные могут также использоваться для восстановления информационной базы при разрушениях.
Организация хранения файлов в информационной базе должна отвечать следующим требованиям:
· полнота хранимой информации для выполнения всех функций управления и решения экономических задач;
· целостность хранимой информации, т.е. обеспечение непротиворечивости данных при вводе информации в ИБ;
· своевременность и одновременность обновления данных во всех копиях данных;
· гибкость системы, т.е. адаптируемость ИБ к изменяющимся информационным потребностям;
· реализуемость системы, обеспечивающая требуемую степень сложности структуры ИБ;
· релевантность ИБ, под которой подразумевается способность системы осуществлять поиск и выдавать информацию, точно соответствующую запросам пользователей;
· удобство языкового интерфейса, позволяющее быстро формулировать запрос к ИБ;
· разграничение прав доступа, т.е. определение для каждого пользователя доступных типов записей, полей, файлов и видов операций над ними.
Существуют следующие способы организации ИБ: совокупность локальных файлов, поддерживаемых функциональными пакетами прикладных программ, и интегрированная база данных, основывающаяся на использовании универсальных программных средств загрузки, хранения, поиска и ведения данных, т.е. системы управления базами данных (СУБД).
Локальные файлы вследствие специализации структуры данных под задачи обеспечивают, как правило, более быстрое время обработки данных. Однако недостатки организации локальных файлов, связанные с большим дублированием данных в информационной системе и, как следствие, несогласованностью данных в разных приложениях, а также негибкостью доступа к информации, перекрывают указанные преимущества. Поэтому организация локальных файлов может применяться только в специализированных приложениях, требующих очень высокую скорость реакции, при импорте необходимых данных.
Интегрированная ИБ, т.е. база данных (БД), - это совокупность взаимосвязанных, хранящихся вместе данных при такой минимальной избыточности, которая допускает их использование оптимальным образом для множества приложений.
Централизация управления данными с помощью СУБД обеспечивает совместимость этих данных, уменьшение синтаксической и семантической избыточности, соответствие данных реальному состоянию объекта, разделение хранения данных между пользователями и возможность подключения новых пользователей. Но централизация управления и интеграция данных приводят к проблемам другого характера: необходимости усиления контроля вводимых данных, необходимости обеспечения соглашения между пользователями по поводу состава и структуры данных, разграничения доступа и секретности данных.
Основными способами организации БД являются создание централизованных и распределенных БД. Основным критерием выбора способа организации ИБ является достижение минимальных трудовых и стоимостных затрат на проектирование структуры ИБ, программного обеспечения системы ведения файлов, а также на перепроектирование ИБ при возникновении новых задач.
К организации БД предъявляются следующие основные требования:
· логическая и физическая независимость данных (программ от изменений структуры БД);
· контролируемая избыточность данных;
· стандартизация данных за счет использования классификаторов;
· наличие словаря данных;
· специализация интерфейса для администратора БД и пользователя системы;
· контроль целостности данных;
· защита данных от несанкционированного доступа;
· наличие вспомогательных программных средств (утилит) проектирования и эксплуатации БД.
Принципами построения централизованной БД являются:
· обеспечение логической организации данных с помощью построения глобальной модели данных;
· представление информационных потребностей для каждой задачи в виде подмоделей данных;
· выделение специального языка описания данных для получения схем и подсхем;
· описание процедур обработки данных с использованием языка манипулирования данными;
· разделение доступа к полям данных;
· защита данных через пароль;
· обеспечение доступности данных одновременно для нескольких пользователей.
Для распределенных БД существуют свои требования (подробнее см. гл. 12):
· учет территориального расположения подразделений ЭИС;
· обеспечение независимости данных от их территориального расположения;
· оптимальное размещение БД между абонентами и серверами;
· сокращение стоимости информационного обслуживания абонентов;
· обеспечение решения сложных межведомственных задач;
· надежность хранения обработки данных; использование СУБД, которые имеют язык описания данных, манипулирования данными и язык запросов, ориентированные на работу в сети;
· возможность параллельного обращения к данным из различных узлов обработки данных.