Основные подходы к проектированию структур данных и проблемы определения структур данных

Существует 3 уровня описания элементов хранимых данных.

-внешний

-концептуальный

-внутренний.

Объединяет предметную область.

-Внешний определяется конкретным пользователем при разработке СУБД. Определяются только те сущности , связи и атрибуты, которые интересны пользователю. Создается инфологическая модель БД, те внешняя схема. Инфологическая модель хранится на бумаге.

-Концептуальный Обобщение модели БД, описываются данные и связи для хранения в БД, на этом уровне выделяются сущности, атрибуты и связи, ограничения, семантическая информация (смысловое содержание), приемы защиты информации. Демологическая модель.

-Внутренний уровень. Здесь производится физическое представление данных с описанием методов их хранения на ЭВМ, производится физическая реализация БД, достигается хорошая производительность и обеспечение экономичного использования дискового пространства. Осуществляется взаимодействие СУБД с методами доступа ОС для эффективной реализации данных, создание индекса и т.д. На внутреннем уровне -физическая модель БД именно эта модель осуществляет различные виды доступа. Вывод: Инфологический аспект потребляется для обеспечения смыслового содержания данных не зависимо от способов представления данных.

Проблемы проектирования возникают при избыточном дублировании: повторения, которые приводят к аномалиям. Дублирование бывает избыточным или неизбыточным.

С_Г_С
Студент Группа Специальность
Иванов И41 УИТС
Петров П031 ПО
Сидоров ПО31 -
Васильев ПО31 -
простое  

Простое допускается в БД, а избыточное приводит к проблеме обработки данных, т.е аномалиям.

 

С_Г
Студент Группа
Иванов И41
Петров П031
Сидоров ПО31
Васильев ПО31
простое

В первой таблице наблюдается простое или неизбыточное дублирование, тк очевидно, что каждый студент должен учиться в конкретной группе. Во 2й таблице избыточное дублирование, которое внесено атрибутом специальность, если группа ПО31, то все студенты группы ПО31 относятся к специальности ПО.

Простое вычеркивание избыточности неудачно, тк при программировании потребуется специальный механизм поиска информации., если ставить прочерки, то память для них выделяется все равно. По сути уничтожаем информацию. (Выходом является использование декомпозиции исходной таблицы, т.е разбиение ее на 2 таблицы.)

Избыточное дублирование создает проблемы при обработке данных. Выделяют три вида:

-Аномалия редактирования

-Аномалия удаления

-Аномалия добавления

11. Понятие зависимости между атрибутами отношений и основные виды зависимостей.

Зависимости могут быть: функциональные, транзитивные, многозначные.

Атрибут В функционально зависит от атрибута А, если каждому значению А соответствует в точности одно значение В (А-> B).Те во всех картежах с одинаковым значением атрибута А атрибут В будет иметь так же одно и то же значение. А и В могут быть составными. Если существует функциональная зависимость вида А->B B->A , то между А и В имеется взаимно однозначное соответствие, или функциональная взаимозависимость.(А<->B). Частичной зависимостью называется зависимость неключевого атрибута от части составного ключа. Если полная зависимость, то зависимость неключевого атрибута от всего составного ключа.

Атрибут С зависит от атрибута А транзитивно, если для атрибутов А, В, С выполняются условия А->B и В->C, но обратная зависимость отсутствует (ФИО ->должность->оклад). Атрибут В многозначно зависит от А, если каждому значению А соответствует множество значений В, не связанных с другими атрибутами из R. (1:М; М:1, М:М). Два или более атрибутов называются взаимно независимыми, если ни один из этих атрибутов не является функционально зависимым от других атрибутов.