Методология использования баз данных
БД используются обычно не самостоятельно, а являются компонентой различных информационных систем: банков данных, информационно-поисковых и экспертных систем, систем автоматизированного проектирования, автоматизированных рабочих мест, автоматизированных систем управления.
В БД имеется три уровня представления данных (см. рис. 2.6): концептуальная, логическая и физическая базы данных. В процедуре использования чаще всего имеют дело с логической и значительно реже с концептуальной и физической моделями.
Словарь данных представляет собой как бы внутреннюю БД, содержащую централизованные сведения о всех типах данных, их имена, структуру, а также информацию об их использовании. Преимущество словаря данных – в эффективном накоплении и управлении информационными ресурсами предметной области. Его применение позволяет уменьшить избыточность и противоречивость данных при их вводе, осуществить простое и эффективное управление при их модификации, упростить процедуру проектирования БД за счет централизации управления данными, установить связи с другими пользователями. Таким образом, словарь данных содержит обобщенное представление всех трех уровней: концептуального, логического и физического.
В логическом представлении применяются следующие виды моделей данных: иерархические, сетевые, реляционные, объектно-ориентированные (объектно-реляционные).
Иерархическая модель служит разновидностью сетевой, являющейся совокупностью деревьев (лесом).
Сетевая модель допускает только бинарные связи "многие к одному" и использует для описания модель ориентированных графов.
Реляционная модель использует представление данных в виде таблиц (реляций, связей). В ее основе лежит математическое понятие теоретико-множественного отношения: она базируется на реляционной алгебре и теории отношений.
В объектно-ориентированной модели используются понятия класса, объекта, метода.
В процессе использования БД имеются операции обновления (запись, удаление, модификация данных) и запрос-ответ (чтение).
В общем случае процесс запроса состоит из ряда этапов (И1-ИЗ на рис. 2.5). Пользователь должен знать структуру БД или обратиться к АБД.
На этапе И1 пользователь должен выяснить, какие формы документов ему нужны. Это могут быть не только логические модели пользователя, но и различные их модификации при разных сочетаниях полей. Поскольку логические (а тем более модифицированные логические) модели могут отличаться от логической модели БД, следует определить, какие сочетания полей необходимы для выводимых машинных документов.
Эти сочетания образуются с помощью элементарных правил (этап И2), изучаемых реляционной алгеброй и реляционным исчислением. Далее правила следует трансформировать в соответствующие варианты обращения к СУБД через ее интерфейс. Это могут быть меню, экранные формы, язык программирования (например, SQL), запрос по примеру, режим просмотра таблиц БД. Результат может быть представлен в виде таблиц или отчетов.
При эксплуатации БД используют и две специфические операции: навигацию и спецификацию.
Для работы с БД используется специальный обобщенный инструментарий в виде СУБД, предназначенный для управления БД и обеспечения интерфейса пользователя. Существует два основных направления реализации СУБД: программное и аппаратное.
Программная реализация (в дальнейшем СУБД) представляет собой набор программных модулей, работает под управлением конкретной ОС и выполняет следующие функции: описание данных на концептуальном и логическом уровнях; загрузку данных; хранение данных; поиск и ответ на запрос (транзакцию); внесение изменений; обеспечение безопасности и целостности; предоставление пользователю языковых средств: языка описания данных (ЯОД), языка манипулирования данными (ЯМД), языка запросов.
Аппаратная реализация предусматривает использование и так называемых машин баз данных. Их появление вызвано возросшими объемами информации и требованиями к скорости доступа.
Таким образом, в соответствии с рис. 2.4, 2.5, теоретические вопросы можно скомпоновать в две группы (см. рис. 2.6).
1. Общая теория баз данных. Сюда относятся вопросы, не зависящие от моделей данных:
а) математический аппарат баз данных (см. гл. 3);
б) описание структуры БД, в том числе различных МД с их сравнительными характеристиками, выбор МД, структурные преобразования БД.
2. Теория реляционных БД (см. гл. 4). Для них наиболее продвинута прикладная математическая теория БД. Она включает три фактически автономные раздела (рис. 2.6):
а) организацию структур таблиц БД (прежде всего – нормирование), их заполнение и обеспечение составляющих целостности – при проектировании БД;
б) обеспечение целостности данных и их восстановление за счет соответствующих характеристик СУБД – в процессе работы СУБД;
в) организацию запросов и обновления данных – при эксплуатации БД.
В дальнейшем изложении материала будем руководствоваться рис. 2.6.