Элементы дискретной математики в теории баз данных.

Множество -набор, совокупность или собрание элементов, обладающих неким характеристическим свойством. В качестве такого свойства может быть принадлежность элемента к этому множеству.

Подмножество –

Домен – скалярный типа данных.

Домен – что именно может быть в клетке таблицы, для заданного столбца.

NULL – нет данных.

Схема отношения (R) – конечное множество имен атрибутов.

Схема отношения - это тип отношения, в котором определен состав и тип данных полей.

Схема отношения – это сущность предметной области с определенным множеством атрибутов.

Шапка таблицы, со всеми столбиками и указанием, что в каком столбике можно записывать.

Отношение (r) – это переменная-таблица, содержащая много записей.

 

 

13.09.11

Классификация бд

1. Настольные субд – малое количество записей, малое колличество пользователей

2. Субд среднего звена – колво пользователей ограничено меньше либо не ограничены.

3. Промышленные субд – объем данных большой, эффективно работают с несколькими пользователями одновременно.

 

 

Архитектура субд

1) Файл серверная субд – используется файловый сервер и представляет доступ то одному компьютеру то другому. Проблема при многопользовательской работе, сложность при организации многопользоватльских процессов.

2) Клиент серверная – используется сервер баз данных, сама система распологается на сервере, с файлами бд общается на прямую

3) Много звенная архитектура - файлы выносятся на отдельный сервер.

Основные понятия и определения реляционных бд.

Рбд – бд , рснованнная на реляционной модели данных, для работы с рбд применяют реляционные субд.

Файл – информация хранимая на электронном носителе, после завершения отдельных заданий и рассматриваемая в процессе обработки как единое целое.

Домен совокупность значения поля

Поле стобец файлового документа таблици

Запись строка документа

Ключь поле с уникальными не повторяющимеся записями используемая для определения места расположения записи.

Ключи делятся на 2 типа первичные и вторичные (внешние). Ключ может состоять из совокупности полей или состаной ключ.

Выделенный ключ ключ явно перечисленный вместе с реляционной схемой

Атрибут это свойство сущности в предметной области

Сущность любой конкретнный и абстрактный объект рассматриваемый в предметной области.

Первичны ключ это одно или несколько полей (столбцов) комбинация значений которых однозначно определяет каждую запись в таблице.

Вторичный ключили внешний это одно или несколько полей ( столбцов в таблице содержащих ссылку на поле или поля первичного ключа в другой таблице.

 

 

08.09.2011

Базы данных

§ База данных — организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностейпользователей

§ База данных — совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных.

§ База данных — некоторый набор перманентных (постоянно хранимых) данных, используемых прикладными программными системами какого-либо предприятия.

§ База данных — совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации

  • БД хранится и обрабатывается в вычислительной системе.
    Таким образом, любые внекомпьютерные хранилища информации (архивы, библиотеки, картотеки и т. п.) базами данных не являются.
  • Данные в БД логически структурированы (систематизированы) с целью обеспечения возможности их эффективного поиска и обработки в вычислительной системе.
    Структурированность подразумевает явное выделение составных частей (элементов), связей между ними, а также типизацию элементов и связей, при которой с типом элемента (связи) соотносится определённая семантика и допустимые операции.
  • БД включает метаданные, описывающие логическую структуру БД в формальном виде (в соответствии с некоторой метамоделью).

Классификация БД по среде физического хранения:

§ БД во вторичной памяти (традиционные): средой постоянного хранения является периферийная энергонезависимая память (вторичная память) — как правило жёсткий диск. В оперативную память СУБД помещает лишь кеш и данные для текущей обработки.

§ БД в оперативной памяти (in-memory databases): все данные находятся в оперативной памяти.

§ БД в третичной памяти (tertiary databases): средой постоянного хранения является отсоединяемое от сервера устройство массового хранения (третичная память), как правило на основе магнитных лент или оптических дисков. Во вторичной памяти сервера хранится лишь каталог данных третичной памяти, файловый кеш и данные для текущей обработки; загрузка же самих данных требует специальной процедуры.

Классификация БД по степени распределённости:

§ централизованные (сосредоточенные);

§ распределённые.

 

 

База данных – структурированная совокупность взаимно-связанных данных в рамках некоторой предметной области предназначенная для длительного хранения во внешней памяти эвм и постоянного применения.

 

Система управления базы данных – программная система поддерживающая наполнение и манипулирование данными представляющими интерес для пользователей при решении прикладных задач.

Интерфейс строго специфицированные правила взаимодействия программных модулей различного уровня одного узла ВС

Задача это программа на стадии выполнения. Синоним слова процесс.

Спрашивать будет БД СУБД

Иерархическая бд данные в виде иерархии…

Сетевые бд в виде понятий….

Реляционные представлены в виде таблиц….

Нормализация таблиц базы данных - первый шаг на пути проектирования структуры реляционной базы данных. Строго говоря, конечно, не самый первый - сначала надо решить, что же мы вообще будем хранить в базе, то есть определиться со структурой полей, их типами и размерностью, смыслом хранимой в них информации. Но это, как говорится, подразумевается по умолчанию:).

Теория нормализации реляционных баз данных была разработана в конце 70-х годов 20 века. Согласно ей, выделяются шесть нормальных форм, пять из которых так и называются: первая, вторая, третья, четвертая, пятая нормальная форма, а также нормальная форма Бойса-Кодда, лежащая между третьей и четвертой.

База данных считается нормализованной, если ее таблицы (по крайней мере, большинство таблиц) представлены как минимум в третьей нормальной форме. Часто многие таблицы нормализуются до четвертой нормальной формы, иногда, наоборот, производится денормализация. Использования таблиц в пятой нормальной форме (вернее сказать, сознательного приведения их к пятой нормальной форме) в реальных базах данных я лично не встречал.

Главная цель нормализации базы данных - устранение избыточности и дублирования информации. В идеале при нормализации надо добиться, чтобы любое значение хранилось в базе в одном экземпляре, причем значение это не должно быть получено расчетным путем из других данных, хранящихся в базе.

Наверно, нет смысла подробно рассматривать примеры нормализации таблиц. Такой информации и в Интернете, и в книгах более чем достаточно. Напомню только, каким основным требованиям должна удовлетворять каждая из нормальных форм.

Первая нормальная форма

Первая нормальная форма:

  • запрещает повторяющиеся столбцы (содержащие одинаковую по смыслу информацию)
  • запрещает множественные столбцы (содержащие значения типа списка и т.п.)
  • требует определить первичный ключ для таблицы, то есть тот столбец или комбинацию столбцов, которые однозначно определяют каждую строку

Вторая нормальная форма

Вторая нормальная форма требует, чтобы неключевые столбцы таблиц зависили от первичного ключа в целом, но не от его части. Маленькая ремарочка: если таблица находится в первой нормальной форме и первичный ключ у нее состоит из одного столбца, то она автоматически находится и во второй нормальной форме.

Третья нормальная форма

Чтобы таблица находилась в третьей нормальной форме, необходимо, чтобы неключевые столбцы в ней не зависели от других неключевых столбцов, а зависели только от первичного ключа. Самая распространенная ситуация в данном контексте - это расчетные столбцы, значения которых можно получить путем каких-либо манипуляций с другими столбцами таблицы. Для приведения таблицы в третью нормальную форму такие столбцы из таблиц надо удалить.