Понятие предметной области

Основным назначением информационных систем является оперативное обеспечение пользователя информацией о внешнем мире путем реализации вопросно-ответного отношения. Вопросно-ответные отношения, получая интерпретацию во внешнем мире (мире вне информационной системы), позволяют выделить для информационной системы определенный его фрагмент - предметную область, - который будет воплощен в автоматизированной информационной системе. Информация о внешнем мире представляется в информационной системе (ИС) в форме данных. Это ограничивает возможности смысловой интерпретации информации и конкретизирует семантику ее представления в ИС. Совокупность этих выделенных для ИС данных, связей между ними и операций над ними образует информационную и функциональную модели предметной области, описывающие ее состояние с определенной точностью.

Важно понимать, что информационная и функциональная модели предметной области создаются на этапе анализа требований к базе данных и не содержат предположений о технологии реализации базы данных. Они строятся независимо от выбираемой модели данных (сетевой, иерархической, реляционной, объектно-ориентированной, многомерной и т.д.), поддерживаемой СУБД, модели вычислений, программно-аппаратной платформы для базы данных. Информационная и функциональная модели предметной области являются входными данными для процесса проектирования базы данных. Поэтому проектировщик должен уметь правильно интерпретировать их в ходе решения своих проектных задач.

Понятие предметной области базы данных является одним из базовых понятий информатики и не имеет точного определения. Его использование в контексте ИС предполагает существование устойчивой во времени соотнесенности между именами, понятиями и определенными реалиями внешнего мира, не зависящей от самой ИС и ее круга пользователей. Таким образом, введение в рассмотрение понятия предметной области базы данных ограничивает и делает обозримым пространство информационного поиска в ИС и позволяет выполнять запросы за конечное время.

Совокупность реалий (объектов) внешнего мира - объектов, о которых можно задавать вопросы, - образует объектное ядро предметной области, которое имеет онтологический статус. Нельзя получить в ИС ответ на вопрос о том, что ей неизвестно. Термин объект является первичным, неопределяемым понятием. Синонимами термина "объект" являются "реалия, сущность, вещь". Однако термин сущность понимается нами несколько уже, как компонент модели предметной области, т.е. как уже выделенный на концептуальном уровне объект для базы данных. Таким образом, выделяемые в предметной области объекты превращаются аналитиками (а не проектировщиками базы данных) в сущности. Сущность предметной области является результатом абстрагирования реального объекта путем выделения и фиксации набора его свойств. Сущность является результатом абстрагирования реального объекта, т.е. в нашем контексте имеет гносеологический статус. Хотя далее в контексте сущность нередко отождествляется с объектом.

На рис. 2.1 представлен один из подходов к классификации объектов предметной области.


Рис. 2.1.Классификации объектов предметной области

Примерами сущностей (с точки зрения ИС) или объектов (с точки зрения внешнего мира) являются отдельный студент, группа студентов, аудитория, время занятий, слова, числа, символы. Обычно считается, что быть объектом - это значит быть дискретным и различимым. Примеры "не-объектов" - это мир, время, смысл, хотя и такие категории могут сохраняться в базе данных.

С объектами связано две проблемы: идентификация и адекватное описание. Для идентификации используют имя. При этом предполагается, что происходит отказ от его смысла, который присущ естественному языку. Используется только указательная функция имени. Имя - это прямой способ идентификации объекта. К косвенным способам идентификации объекта относят определение объекта через его свойства (характеристики или признаки).

Объекты взаимодействуют между собой через свои свойства, что порождает ситуации. Ситуации - это взаимосвязи, выражающие взаимоотношения между объектами. Ситуации в предметной области описываются посредством высказываний о предметной области с использованием исчисления высказываний и исчисления предикатов, т.е. формальной, математической логики. Например, высказывание "Программист и менеджер есть служащие компании" описывает отношение включения. Таким образом, вся информация об объектах и сущностях предметной области описывается с помощью утверждений на естественном языке.

Методы математической логики позволяют формализовать эти утверждения и представить их в виде, пригодном для анализа.

Пример. Рассмотрим высказывание: Студент Иванов А.А, родился в 1982 году. Оно выражает следующие свойства объекта "Иванов А.А.":

· в явном виде - год рождения;

· в неявном - принадлежность к студентам.

Первое свойство устанавливает связь между объектами "Иванов А.А." и "Год рождения", а второе - между объектами "Иванов А.А." и "Множество студентов". Формализация этого высказывания представляется как результат присваивания значений переменным, входящим в предикаты:

РОДИЛСЯ (Иванов А.А., 1982)

ЯВЛЯЕТСЯ СТУДЕНТОМ (Иванов А.А.)

Отметим, что в семантике естественных языков ситуация и взаимосвязь считаются почти синонимами. Ситуация содержит высказывание об объектах предметной области, которому можно приписать некоторую оценку истинности и представить в виде предиката после введения переменных. Таким образом, совокупность высказываний о предметной области можно трактовать как определение информационного пространства для базы данных.

На рис. 2.2 представлен один из подходов к классификации ситуаций в рамках предметной области.


Рис. 2.2.Классификация ситуаций предметной области

Различают статические и динамические ситуации. Примерами статических ситуаций являются такие ситуации, как иметь цвет, иметь возраст. Примерами динамических ситуаций являются такие ситуации, как создать утюг, выпечь хлеб.

Обратите внимание на то, что ситуация также может представлять собой объект (см. рис. 2.1) и обладать свойствами. С другой стороны, приведенная классификация рассматривает свойства как специальный случай ситуаций. Подобная коллизия порождает неоднозначность при моделировании предметной области базы данных. Поставим вопрос - что есть цвет автомобиля? Объект, свойство, ситуация? К обсуждению этого вопроса мы вернемся специально в следующей лекции.

Приведенная классификация вводит в предметную область два важных аспекта - пространство и время, причем время и как момент, и как интервал. Предметная область существует в пространстве и во времени, т.е. ей присущи, как и реальному миру, временные и пространственные отношения и связи. Следует отличать реальное время внешнего мира и его отражение в базе данных и в источниках информации. В базе данных взаимосвязи, зависящие от времени, фиксируются только после их регистрации в базе данных. Таким образом, предметная область в каждый конкретный момент времени представляет собой выделенную совокупность определенных объектов и ситуаций, называемую состоянием предметной области (или снимком).

Введем определение предметной области.

Определение. Предметная область - это целенаправленная первичная трансформация картины внешнего мира в некоторую умозрительную картину, определенная часть которой фиксируется в ИС в качестве алгоритмической модели фрагмента действительности.

Понятие предметной области было введено в начале 80-х годов прошлого века, когда учеными в области ИС была осознана необходимость использовать семантические модели для представления информации в компьютерных системах. Так же как требования к компьютерной системе формируются средствами естественного языка, так и информация в компьютерных системах представляется средствами особого языка с определенной семантикой.

 

Этапы проектирования базы данных  

 

Целью разработки любой базы данных является хранение и использование информации о какой-либо предметной области. Для одной и той же предметной области реляционные отношения можно спроектировать множеством различных способов. Например, можно спроектировать несколько отношений с большим количеством атрибутов, или наоборот, разнести все атрибуты по большому числу мелких отношений. При разработке базы данных обычно выделяется несколько уровней моделирования, при помощи которых происходит переход от предметной области к конкретной реализации базы данных средствами СУБД. Можно выделить следующие уровни (ЭТАПЫ): · Исследование предметной области · Модель предметной области · Логическая модель данных · Физическая модель данных Исследование предметной области Предметная область – это часть реального мира, данные о которой мы хотим отразить в базе данных. Например, выберем в качестве предметной области рекламное агентство. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Так, для нашей предметной области понятия «Название фирмы рекламодателя» и «ФИО менеджера» являются существенно важными понятиями, а то, что сотрудница, принимающая заказ от рекламодателя имеет двоих детей – это для учета заказов неважно. Таким образом, важность данных зависит от выбора предметной области. Исследование предметной области можно разбить на несколько этапов: · Формулируется наименование организации. Для нашего примера это может быть «Замысел». · Определение цели создания базы данных. Например, целью базы данных рекламного агентства может быть – автоматизация учета фирм- рекламодателей, видов разрабатываемой агентством рекламы и выполненных заказов. · Точка зрения. На этом этапе указывается должность того человека, чью точку зрения мы отражаем (того, кто будет иметь полные права на базу данных: поиск, манипулирование данными). Например, менеджер рекламного агентства. · Пользователи будут иметь право на поиск и просмотр данных в базе. Например, дизайнер рекламы, копирайтер, креативный директор и т.д. · Перечень бизнес- процессов. Бизнес-процессы - это связанный набор повторяемых действий (функций), которые преобразуют исходный материал и/или информацию в конечный продукт (услугу) в соответствии с предварительно установленными правилами. Различают основные и вспомогательные бизнес-процессы. Основные, процессы ¾ это те, которые добавляют качество, вспомогательные процессыформируют инфраструктуру организации. Примерами процессов могут быть процессы сбыта и снабжения, процесс разработки нового изделия и вывода его на рынок, процесс обслуживания клиентов. Например, для нашего примера: · Исследование рынка, позиций рекламодателя на рынке подобных товаров/ услуг. · Сегментирование потребителей. · Анализ свойств товара/ услуги. · Создание творческого брифа. · Составление медиаплана. · Разработка рекламного продукта. · Утверждение заказчиком разработанной рекламы. · Размещение рекламы. · Перечень бизнес- процессов, для поддержки которых создается база данных. Из перечисленных в предыдущем пункте бизнес- процессов выбираются только те, которые будут автоматизированы. · Ведение справочника услуг рекламного агентства · Хранение информации о сотрудниках и рекламодателях и ее выдача по запросам. · Учет выполненных заказов. Модель предметной области Модель предметной области – это наши знания о предметной области. Знания могут быть как в виде неформальных знаний, сформулированных в форме естественного языка, так, и выражены формально при помощи каких- либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. На этом этапе выделяются сущности и их атрибуты. Для нашей базы данных определим следующий набор сущностей и атрибутов: · Должность (код должности, название) · Сотрудник (код сотрудника, код должности, ФИО, адрес, телефон) · Рекламодатель (код фирмы, название фирмы- рекламодателя, ФИО контактного лица, телефон, адрес электронной почты) · вид рекламы (код вида, название вида, стоимость) · договор (номер договора, код фирмы, код сотрудника, код вида, дата оформления заказа, дата выполнения заказа, отметка о выполнении) Логическая модель данных Описывает взаимосвязь сущностей предметной области. Основным средством разработки логической модели данных в настоящий момент являются различные варианты ER-диаграмм (Entity Relationship) – диаграммы «сущность- связь». Постоим логическую модель предметной области «Рекламное агентство»:   Рис. 2.3. Логическая модель В нашей модели используются следующие обозначения: Рис. 2.4. Родительская сущность (независимая), есть только главный ключ, который указывается над горизонтальной линией (PK) Рис. 2.5. Дочерняя сущность (зависимая), есть и главный и внешние ключи, которые перечисляются над горизонтальной линией. Главный ключ (PK). Внешний ключ (FK) Сущности связаны с помощью линий, около которых указывают мощность связи. Основные типы связи: · Один к одному (1:1) - каждая запись одной таблицы соответствует одной записи в другой таблице. · Один ко многим (1:М) - каждой записи в одной таблице соответствует несколько записей в другой таблице. · Многие к одному (М:1) - нескольким записям в одной таблице соответствует одна запись в другой таблице. Отношение "многие к одному" аналогично отношению "один ко многим". Тип отношения зависит от вашей точки зрения. · Многие ко многим (М:М) - нескольким записям в одной таблице соответствуют несколько записей в другой таблице. Такой вид связи не поддерживается многими СУБД, поэтому при проектировании необходимо разбивать на две связи 1:М, используя дополнительную таблицу пересечения. Физическая модель данных Описывает данные средствами конкретной СУБД. Отношения, разработанные на стадии формирования логической модели данных, преобразуются в таблицы, атрибуты становятся столбцами таблиц, для ключевых атрибутов создаются уникальные индексы, домены преображаются в типы данных, принятые конкретной СУБД.

12 вопрос: