Способы организации данных

Возможны следующие способы организации данных:

1. Последовательный, т.е. доступ к данным в порядке их следования.

Различают последовательные данные со следующей длиной записи:

- фиксированной, т.е. все порции данных, считываемых или записываемых в файл, имеют одинаковую протяженность (поле, содержащее длину записи, может располагаться в управляющих структурах файла.);

- переменной, т.е. данные содержат поле с указанием длины текущей записи непосредственно перед самой записью(это несколько увеличивает протяженность файла: если длина дополнительного поля равна четырем байтам, то накладные расходы есть учетверенное число записей; требуется дополнительное время на считывание или генерацию поля длины записи);

- неопределенной, т.е. длина текущей записи задается в программе, в операторе или группе машинных команд, реализующих доступ к данным (данные не требуют пространственных накладных расходов).

2. Прямой способ обеспечивает произвольную последовательность доступа к записям файла. Это становится возможным в результате нумерации записей. Доступ к некоторой записи осуществляется по номеру.

Прямая организация предполагает одинаковую длину всех записей, поскольку иначе невозможно обеспечить пересчет номера записи в абсолютный адрес на внешнем устройстве. Чтобы поддерживать прямую запись в файл, приходится размечать требуемое пространство на диске при создании файла.

Файл, созданный как последовательный, в дальнейшем может рассматриваться как имеющий прямую организацию.

3. Индексно-последовательный способ пытается совместить достоинства последовательного и прямого доступов к данным:

- гибкость структуры записи, присущая последовательной организации;

- быстрый доступ к произвольной записи, как в прямой организации;

- возможна высокая скорость поиска информации, соответствующей заданному критерию (контекстный поиск);

- с каждой записью, помимо поля длины связывается поле индекса – числа или строки, однозначно идентифицирующего данные в записи.

Индекс может быть встроен в запись, т.е. быть ее частью, или располагаться отдельно от нее. Протяженность индекса есть управляемая величина, которая содержится в структурах описания файла. Индексы всех записей сводятся в отдельную таблицу, где упорядочиваются в соответствии с заданным критерием и связываются с абсолютными адресами хранения на диске. Одновременно хранятся адреса всех записей, связанные с их номерами.

Доступ к записи возможен в последовательном режиме, в индексно-последовательном, в прямом.

Для добавления новых записей требуется резервирование пространства под элементы индексной таблицы.

4. Библиотечный позволяет объединять в пределах одного файла несколько самостоятельных разделов, связанных друг с другом только областью применения.

В файле поддерживается каталог – таблица, в которой именам разделов ставятся в соответствие относительные адреса начала разделов и их протяженности. Для ускорения поиска имена разделов в каталоге упорядочиваются. Переменная длина раздела в библиотеке не позволяет реализовать модификацию непосредственно в файле и обычно требует перезаписи всего файла с внесением изменений в каталог.

Контрольные вопросы

1. Сформулируйте определение системы на основе категории «целостность».

2. Чем принципиально отличаются реляционные модели от сетевых и иерархических?

3. В чем различие процедурных и декларативных языков управления (манипулирования) данными?

4. Сформулируйте основные способы организации данных.

5. В чем суть нормализации отношений?

 

ТЕМА 5. ИНФОРМАЦИОННЫЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ