Модели представления данных

Основные типы данных, основные определения.

Модели представления данных.

Данные

Данные- некоторые упорядоченные сведения о знаниях. В ИС знания хранятся на носителях в виде некоторой модели.

Информация, с которой имеет дело ЭВМ разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач. Декларативная информация в данных, с которыми эти программы работают. Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного числа разрядов – битов. Машинное слово для представления данных и команд могут иметь разное количество разрядов. С развитием структуры ЭВМ происходило развитие информационных структур для представления данных. Появились способы описания данных в виде векторов и матриц, списочные и иерархические структуры.

Типы данных делятся на три группы:

· Простые типы данных.

· Структурированные типы данных.

· Ссылочные типы данных.

Простые, или атомарные, типы данных не обладают внутренней структурой. Данные такого типа называют скалярами. К простым типам данных относятся следующие типы:

· Логический.

· Строковый.

· Численный.

Различные языки программирования могут расширять и уточнять этот список, добавляя такие типы как:

· Целый.

· Вещественный.

· Дата.

· Время.

· Денежный.

· Перечислимый.

· Интервальный.

· И т.д.…

Строковый тип данных можно рассматривать как одномерный массив символов, а целый тип данных - как набор битов. При переходе на такой низкий уровень теряется семантика (смысл) данных. Если строку, выражающую, например, фамилию сотрудника, разложить в массив символов, то при этом теряется смысл такой строки как единого целого.

Структурированные типы данных предназначены для задания сложных структур данных. Структурированные типы данных конструируются из составляющих элементов, называемых компонентами, которые, в свою очередь, могут обладать структурой. В качестве структурированных типов данных можно привести следующие типы данных:

· Массивы

· Записи (Структуры)

С математической точки зрения массив представляет собой функцию с конечной областью определения. Например, рассмотрим конечное множество натуральных чисел

называемое множеством индексов. Отображение

из множества во множество вещественных чисел задает одномерный вещественный массив. Значение этой функции для некоторого значения индекса называется элементом массива, соответствующим . Аналогично можно задавать многомерные массивы.

Запись (или структура) представляет собой кортеж из некоторого декартового произведения множеств. Действительно, запись представляет собой именованный упорядоченный набор элементов , каждый из которых принадлежит типу . Таким образом, запись есть элемент множества . Объявляя новые типы записей на основе уже имеющихся типов, пользователь может конструировать сколь угодно сложные типы данных.

Общим для структурированных типов данных является то, что они имеют внутреннюю структуру, используемую на том же уровне абстракции, что и сами типы данных.

Поясним это следующим образом. При работе с массивами или записями можно манипулировать массивом или записью и как с единым целым (создавать, удалять, копировать целые массивы или записи), так и поэлементно. Для структурированных типов данных есть специальные функции - конструкторы типов, позволяющие создавать массивы или записи из элементов более простых типов.

Работая же с простыми типами данных, например с числовыми, мы манипулируем ими как неделимыми целыми объектами. Чтобы "увидеть", что числовой тип данных на самом деле сложен (является набором битов), нужно перейти на более низкий уровень абстракции. На уровне программного кода это будет выглядеть как ассемблерные вставки в код на языке высокого уровня или использование специальных побитных операций.

Ссылочный тип данных (указатели) предназначен для обеспечения возможности указания на другие данные. Указатели характерны для языков процедурного типа, в которых есть понятие области памяти для хранения данных. Ссылочный тип данных предназначен для обработки сложных изменяющихся структур, например деревьев, графов, рекурсивных структур.

Образование структур, известных как базы данных явилось значительным событием в развитии информационных структур представления декларативной информации. Совокупность средств, обеспечивающих работу с данными, образует систему управления базой данных (СУБД).

Модели представления данных

Основные модели:

· Реляционные.

· Сетевые.

· Иерархические.

· Модели, на основе слияния данных и знаний.

2 компонента представления данных:

- интенсиональное;

- экстенсиональное.

Оба компонента хранятся в БД. Э. представление относится к данным (конкретные факты из предметной области – строки в таблицах БД ). А вот насчет И. существует спор (определенным образом знания о проблемной области: схемы связи между именами столбцов).

Элементами схемы базы данных являются схемы вида Q(A1,A2,…, An), где Q – некоторое отношение, {Ai} - множество элементов входящих в Q (множество атрибутов). В зависимости от того, какие отношения Q допускаются в БД, возникают различные представления данных.

 

Реляционные модели данных

 

Общая характеристика реляционной модели данных

Реляционная модель данных состоит из трех частей:

· Структурной части.

· Целостной части.

· Манипуляционной части.

Структурная часть описывает, какие объекты рассматриваются реляционной моделью. Постулируется, что единственной структурой данных, используемой в реляционной модели, являются нормализованные n-арные отношения.

Целостная часть описывает ограничения специального вида, которые должны выполняться для любых отношений в любых реляционных базах данных. Это целостность сущностей и целостность внешних ключей.

Манипуляционная часть описывает два эквивалентных способа манипулирования реляционными данными - реляционную алгебру и реляционное исчисление.