Этапы построения базы данных

База данных — совокупность связанных данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, независимая от прикладных программ.

Для понятия «база данных» существует несколько классификаций. По модели представления данных БД можно классифицировать следующим образом: картотеки, иерархические, сетевые, многомерные, объектно-ориентированные, дедуктивные и реляционные. Далее речь пойдет о реляционной модели. Эта модель баз данных не была хронологически первой, но первой получила математическое описание, и, будучи экономной по части базовых понятий (что сделало ее невероятно привлекательной для программистов и пользователей), в основном используется в web-приложениях.

Так что же такое «реляционная модель БД»? В реляционных базах данных вся информация заключена в таблицы. Столбцы в такой таблице имеют конкретный тип и размер; все содержимое ячеек столбца должно соответствовать их типу. Строки представляют собой набор неструктурированных данных и образуют математическое отношение. Таким образом, вся база данных – это множество таблиц-отношений, отсюда и название модели (от англ. relation – отношение).

Один из главных принципов организации данных – построение взаимосвязей между всеми элементами, что и отличает базу данных от простого набора таблиц. Т.е. информация в таблицах реляционной базы данных должна быть соответствующим образом организована. Еще один важнейший принцип — нормализация таблиц, которая сводится к устранению недостатков структуры базы данных, приводящих к различным аномалиям и нарушениям целостности данных. Недостатками структуры можно назвать, например, противоречивость данных, а аномалией – возникновение случайных ошибок в процессе эксплуатации БД. Проще говоря, нормализация – разбиение таблицы на две или более для исключения повторения (избыточности) информации.

Разработка базы данных – сложный длительный процесс, который можно разделить на 3 этапа:

· концептуальное проектирование — сбор, анализ и редактирование требований к данным;

· логическое проектирование — преобразование требований к данным в структуры данных;

· физическое проектирование — определение особенностей хранения данных, методов доступа и т. д.

На уровне физической модели электронная БД представляет собой файл или их набор в формате TXT, CSV, Excel, DBF, XML либо в специализированном формате конкретной СУБД (системы управления базами данных).

Основные функции СУБД.

СУБД обеспечивают надежное хранение больших объемов данных сложной структуры во внешней памяти компьютера и эффективный доступ к ним. Их появление сняло с разработчиков информационных систем необходимость создавать каждый раз весьма сложные компоненты управления данными. К основным функциям СУБД относятся:

o Непосредственное управление данными во внешней и оперативной памяти и обеспечение эффективного доступа к данным в процессе решения задач.

o Поддержание целостности данных и управление транзакциями.

o Ведение системного журнала изменений в базе данных, что обеспечивает восстановление базы данных после технического или программного сбоя.

o Реализация поддержки языка описания данных и языка запросов к данным.

o Обеспечение безопасности данных.

o Обеспечение параллельного доступа к данным нескольких пользователей.

27. Модели данных: иерархические, сетевые, реляционные

 

Информация в базе данных определенным образом структурирована, т.е. ее можно описать моделью представления данных (моделью данных), поддерживаемой СУБД. Классические модели представления данных: иерархическая, сетевая, реляционная.

При использовании иерархической модели представления данных связи между данными можно описать с помощью упорядоченного графа (или дерева). При программировании для описания структуры иерархической базы данных используется тип данных «дерево».

Основные достоинства иерархической модели данных:

1) эффективное использование памяти ЭВМ;

2) скорость выполнения основных операций над данными;

3) удобство работы с иерархически упорядоченной информацией.

Недостатки иерархической модели представления данных:

1) громоздкость данной модели для обработки информации с достаточно сложными логическими связями;

2) трудность в понимании ее функционирования обычным пользователем.

Достаточно небольшое количество СУБД построено на иерархической модели данных.

Сетевую модель представления данных можно рассматривать как развитие и обобщение иерархической модели данных, позволяющее отображать разнообразные взаимосвязи данных в виде произвольного графа.

Достоинства сетевой модели представления данных:

1) эффективность в использовании памяти ЭВМ;

2) высокая скорость выполнения основных операций надданными;

3) сетевая модель обладает большими возможностями в смысле возможности образования произвольных связей.

Недостатки сетевой модели представления данных:

1) высокая сложность и жесткость схемы БД, построенной на ее основе;

2) трудность для понимания и выполнения обработки информации в БД непрофессиональным пользователем.

СУБД, построенные на основе сетевой модели, также не получили широкого распространения на практике. Реляционную модель представления данных разработал сотрудник фирмы «IBM» Э. Кодд. В основе данной модели лежит понятие отношения (relation). Простейшим примером отношения является двумерная таблица. Достоинства реляционной модели представления данных заключаются в понятности, простоте и удобстве практической реализации реляционных БД на ЭВМ.

Недостатки реляционной модели представления данных:

1) отсутствие стандартных средств идентификации отдельных записей;

2) сложность описания иерархических и сетевых связей.

Большинство СУБД, используемых как профессиональными, так и непрофессиональными пользователями, построены на основе реляционной модели данных.

Реляционная модель данных

Реляционная СУБД (РСУБД; иначе Система управления реляционными базами данных, СУРБД) — СУБД, управляющая реляционными базами данных.

Понятие реляционный (англ. relation — отношение) связано с разработками известного английского специалиста в области систем баз данных Эдгара Кодда (Edgar Codd).

Эти модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.

Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:

  • каждый элемент таблицы — один элемент данных
  • все ячейки в столбце таблицы однородные, то есть все элементы в столбце имеют одинаковый тип (числовой, символьный и т. д.)
  • каждый столбец имеет уникальное имя
  • одинаковые строки в таблице отсутствуют
  • порядок следования строк и столбцов может быть произвольным

Базовыми понятиями реляционных СУБД являются: