Лекция 10. ПЕРСОНАЛЬНЫЕ БАЗЫ ДАННЫХ

В результате освоения материалов данной главы студенты должны:

знать

– теоретические основы и общие принципы построения реляционных баз данных;

– основные принципы проектирования БД;

– архитектуру и порядок функционирования системы управления БД MS Access;

– способы логической и физической организации данных в БД;

– методы и языковые средства манипулирования данными;

– типы данных, поддерживаемые MS Access;

– инструменты для разработки основных объектов MS Access;

– технологии создания основных объектов MS Access;

– встроенные функции MS Access и методы их применения для вычислений;

– структурированный язык запросов SQL;

уметь

– создавать логическую и физическую модели предметной области на основе анализа предметной области;

– создавать объекты MS Access;

– выбирать инструментальные средства для хранения экономических данных в соответствии с поставленной задачей, анализировать результаты использования баз данных;

владеть

– основными методами, способами и средствами хранения информации;

– информационной технологией работы в среде СУБД MS Access 2010;

– технологиями создания и модификации объектов MS Access;

– навыками формирования запросов к базам данных на основе языка SQL.

Основные понятия теории баз данных

Система баз данных представляет собой компьютеризированную систему хранения информации. Пользователям этой системы предоставляются различные средства для извлечения и модификации этой информации.

К информации может относиться все, что заслуживает внимания отдельного пользователя или организации, использующей систему, т.е. любое предприятие неизбежно должно хранить и обновлять большое количество данных, отражающих его деятельность. Это и есть "информация". Для иллюстрации этого понятия рассмотрим случай холдинг-центра. Предположим, что в холдинг-центре хранятся данные о всех товарах, реализуемых со складов фирм холдинг- центра; о складах, где хранятся товары; о фирмах, которые занимаются оптовыми продажами товаров со складов, и т.д. Все перечисленное представляет собой те основные объекты, данные о которых записаны в БД (рис. 10.1).

Рис. 10.1. Пример объектов и связей

Между этими объектами существуют связи, или отношения (эти связи представлены стрелками). Например, существует связь между Фирмами и Складами: каждая фирма имеет несколько складов, и каждый склад принадлежит конкретной фирме. Эти связи составляют такую же часть информации, как и объединяемые ими объекты. Поэтому они также должны быть представлены в БД.

Чтобы понять процесс электронной обработки данных, необходимо знать ряд терминов, которые применяются при описании и представлении данных.

Предметная область – часть реального мира, подлежащая изучению с целью автоматизации процесса управления в этой сфере (например, банк, академия, больница).

Объект – элемент информационной системы, сведения о котором хранятся в базе данных. Объектом может быть человек, предмет, событие, место или явление (например, в банковском деле примерами объектов могут служить клиенты, банковские счета, ссуды по закладным и т.п.).

Атрибут (или элемент данных) – информационное отображение свойств объекта. Каждый объект характеризуется некоторым набором атрибутов (например, клиент банка имеет такие атрибуты, как фамилия, адрес и, возможно, идентификационный номер).

Ключевой элемент данных. Некоторые элементы данных обладают интересным свойством. Зная значение, которое принимает такой элемент данных объекта, можно идентифицировать значения, которые принимают другие элементы данных этого же объекта (например, зная идентификационный номер клиента, можно узнать фамилию клиента, его адрес). Элементы данных, по которым можно определить другие элементы данных, называются ключевыми.

Совокупность значений связанных элементов данных образует запись данных.

Система управления базой данных (СУБД) – программа, которая управляет всем доступом к базе данных. Система управления базами данных основывается на использовании определенной модели данных. Модели данных описаны в параграфе 3.1 настоящего учебника. В данной главе речь пойдет о реляционной модели данных.

Данные в реляционной модели представляются в виде таблиц. В терминологии реляционной модели таблицы называются отношениями. Каждый столбец в таблице является атрибутом. Значения в столбце выделяются из домена (домен суть множество значений, которые может принимать некоторый атрибут). Строки таблицы называются кортежами. В соответствии с традиционной терминологией можно сказать, что столбцы таблицы представляют элементы данных, а строки – записи.

Введем понятие нормализации. Единственными отношениями, допустимыми в реляционной модели, являются те, которые удовлетворяют следующему условию: каждое значение в отношении, т.е. значение каждого атрибута в каждом кортеже, должно быть атомарным (неделимым). Другими словами, на пересечении любой строки и любого столбца в таблице должно быть точно одно значение, а не множество значений.

Отношение, удовлетворяющее приведенному условию, называется нормализованным (рис. 10.2).

Атрибут является первичным ключом отношения, если его значения однозначно идентифицируют кортежи (строки) данного отношения.

Не каждое отношение будет иметь первичный ключ в виде единственного атрибута. По каждое отношение будет иметь некоторую комбинацию атрибутов, которые, взятые

Рис. 10.2. Примеры ненормализованного и нормализованного отношений

вместе, будут однозначно идентифицировать кортеж в отношении. Тогда первичный ключ называется составным первичным ключом (существование такой комбинации гарантируется тем, что отношение является множеством).

Атрибут отношения R1 является внешним ключом, если этот атрибут – не первичный ключ отношения R1, но его значения являются значениями первичного ключа некоторого отношения R2.

Ключи первичный и внешний представляют собой средства выражения связей между кортежами.