Понятие и компоненты банка данных

 

База данных – совокупность предназначенных для машинной обработки данных, которая служит для удовлетворения нужд большого количества пользователей (в рамках одной или нескольких организаций). Более формальное определение базы данных (БД) – поименованная, целостная, единая система данных, организованная по определенным правилам, которые предусматривают общие принципы описания, хранения и обработки данных.

Создание информационной инфраструктуры требует создания особенно больших баз данных, способных обслуживать одновременно тысячи пользователей. Данные в базе данных располагаются так, чтобы их можно было легко найти и обработать. Эти задачи выполняются системой управления базами данных. Система управления базами данных –специальный комплекс программ, осуществляющий централизованное управление базой данных. СУБД позволяет управлять данными в базе данных, вести базы данных, обеспечивает многопользовательский доступ к данным.

База знаний– это формализованная система сведений о некоторой предметной области, содержащая данные о свойствах объектов, закономерностях процессов и явлений и правила использования в задаваемых ситуациях этих данных для принятия новых решений. Другими словами, база знаний – это корпус информации, которую пользователь или программа использует для выполнения определенных действий.

В отличие от базы данных в базах знаний располагаются познаваемые сведения, содержащиеся в документах, книгах, статьях, отчетах. В базе знаний, в соответствии с принятой в ней методологией классификации, располагаются объекты познания, образующие совокупность знаний. В любом объекте представляется набор элементов знаний. Элементы знаний, благодаря концептуальным связям, предоставляемым гиперсредой1 , объединяются, образуя базу знаний. Такие связи бывают 4-х видов:

- общность – связь 2-х элементов по содержанию их характеристик;

- партитивность – подразумевает соотношение целого и его частей;

- противопоставление – встречается в элементах, которые имеют положительные и отрицательные характеристики;

- функциональная взаимосвязь – взаимная зависимость элементов.

Базы данных и базы знаний являются ядром автоматизированного банка данных. Автоматизированныйбанк данных –база данных, объединенная с системой управления базой данных.

Банк данных предназначен для хранения больших массивов информации, быстрого поиска нужных сведений и документов. Банк данных ограничен в своих возможностях, поэтому он собирает информацию в определенных областях науки, технологии, продукции. Персонал, работающий в банке данных, делится на три группы: сотрудники банка, администратор банка и пользователи. Задача сотрудников – сбор и запись в базу всей первичной информации, определяемой тематикой этой базы. Сотрудники должны также удалять устаревшую информацию. Наряду с этим обновление информации может быть разрешено и некоторым пользователям. Сотрудники и некоторые пользователи составляют программы, позволяющие из первичной информации получать необходимые вторичные сведения, составлять отчеты. Администратор обеспечивает руководство банком. Он решает вопросы, связанные с бесперебойной и надежной работой, хранением информации и безопасностью данных. Пользователи банка взаимодействуют с необходимыми им банками.

Для поиска информации в базах данных и базах знаний используется информационно-поисковая система. Информационно-поисковая система опирается на базу данных (знаний), в которой осуществляется поиск нужных документов по заявкам пользователей.

По характеру выдаваемой информации информационно-поисковые системы делятся на два типа. Документальная система по заданию пользователя выдает необходимые ему документы (книги, статьи, законы, патенты, отчеты и т.д.). В задании могут указываться сведения об искомых документах: автор, наименование, время издания, издательство и т.д. Более сложной является фактографическая информационно-поисковая система. Ее задача – поиск в документах интересующих пользователя сведений (фактов), например типы, характеристики и технология изготовления сталей. Поиск в информационно-поисковой системе документов и сведений (фактов) осуществляется на естественном языке (русском, английском и др.).

 

Классификация баз данных

 

Различаются централизованные и распределенные базы данных. Централизованная база данных хранится в памяти одной вычисли­тельной системы. Если эта вычислительная система является ком­понентом сети ЭВМ, возможен распределенный доступ к такой базе данных – доступ к ней пользователей различных ЭВМ данной сети. Такой способ использования баз данных часто применяют в локальных сетях персональных ЭВМ.

Появление сетей ЭВМ позволило наряду с централизованными создавать и распределенные базы данных. Распределенная база данных состоит из нескольких, возможно, пересекающихся или да­же дублирующих друг друга частей, хранимых в различных ЭВМ вычислительной сети. Однако пользователь распределенной базы данных не обязан знать, каким образом ее компоненты размещены в узлах сети, и представляет себе эту базу данных как единое це­лое. Работа с такой базой данных осуществляется с помощью сис­темы управления распределенной базой данных (СУРБД). Данные, содержащиеся в распределенной базе данных, их пред­ставление на всех уровнях архитектуры СУРБД и размещение в се­ти описываются в системном справочнике, который сам может быть декомпозирован и размещен в различных узлах сети.

Части распределенной базы данных, размещенные на отдельных ЭВМ сети, управляются собственными (локальными) СУБД и могут использоваться одновременно как самостоятельные локальные базы данных. Локальные СУБД не обязательно должны быть одинаковы­ми в разных узлах сети. Объединение неоднородных локальных баз данных в единую распределенную базу данных является сложной научно-технической проблемой. Ее решение потребовало проведе­ния большого комплекса научных исследований и эксперименталь­ных разработок.

Базы данных можно разделить на базы данных первого поколения: иерархические, сетевые; второго поколения:реляционные; третьего поколения:объектно-ориентированные, обектно-реляционные.