Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

Структура данных и системы управления базами данных.

Организация работы с данными и знаниями. Инженерия знаний.

Информационные системы создаются для достижения различных целей. Одной из главных целей является эффективная переработка данных в информацию или знания. Определим эти понятия.

Данные представляют собой элементарные описания предметов, событий, действий и транзакций, которые запомнены, классифицированы и сохранены, но не организованы для передачи какого – либо специального смысла. Элементы данных могут быть числовыми, алфавитно – числовыми, цифровыми, звуковыми или образными. База данных содержит хранящиеся элементы данных, организованные для доступа.

Информация – это данные, которые организованы так, что они имеют значение и ценность для получателя. Получатель (пользователь) интегрирует значения и выводит заключения и смыслы.

Знания состоят из данных или информации, которые организованы и обработаны с целью передачи понимания, накопленного опыта, результатов обучения и экспертизы таким образом, что они могут использоваться для решения текущих проблем или выполнения действий. Данные, которые обработаны для извлечения смыслов и для отражения прошлого опыта и экспертизы, обеспечивают пользователя организованным знанием, которое имеет очень высокую потенциальную ценность.

Эти три термина, особенно данные и информация, часто используются взаимозаменяемо. Данные, информация и знания могут быть для информационной системы входными или выходными.

Данные. Источники данных.

Данные в информационной системе поддержки решений могут включать документы, иллюстрации, карты, звуки и анимацию. Эти данные могут быть сохранены и организованы различными путями до и после их использования. Они также включают понятия, предметы и мнения (оценки). Данные могут быть предварительные, необработанные или обобщенные. Многие прикладные системы поддержки решений используют обобщенные или извлеченные данные, которые получают из трех основных источников: внутренних, внешних и персональных.

Внутренние данные хранятся в одном или более местах в корпорации .Это данные о людях, продукции, услугах и процессах. Информационная управляющая система может использовать как необработанные, так и обработанные данные (такие, как отчеты и сводки). Внутренние данные доступны через компьютерные сети организации.

Существует много источников внешних данных. Например, коммерческие базы данных, Интернет, спутниковая информация, фильмы, музыка, звуковая информация, иллюстрации, диаграммы, атласы, телевидение.

Постановления, нормативные акты и отчеты правительства являются главными источниками внешних данных.

Информация торгово – промышленных палат, локальных банков, исследовательских институтов, финансово – аналитических структур, биржевых сводок и другая, подобно наводнению обрушивается на пользователя информационной системы, вызывая у него информационные перегрузки.

Большинство внешних данных являются не относящимися к деятельности конкретной информационной системы. Поэтому осуществляется целенаправленный мониторинг данных с целью извлечения необходимой информации и минимизации возможности пропуска и недооценки важности информации.

Пользователи информационных систем или другие сотрудники корпорации или предприятия могут использовать свои собственные экспертные знания и информацию для создания персональных данных. Они включают субъективные оценки продаж, мнения о возможных действиях конкурентов, интерпретации рыночной или производственной информации, прогнозные оценки и т.д.

Необходимость выделения данных из многих внутренних и внешних источников усложняет задачу построения информационной системы поддержки решений.

Необработанные данные могут быть собраны вручную или при помощи инструментов и сенсоров.

Типичными методами сбора данных являются изучение во времени (посредством наблюдения), обследования (с использованием анкетирования), наблюдение (например, используя видеокамеры) и информация от экспертов (например, с использованием интервью).

Общеизвестна необходимость в достоверных и точных данных для любой системы поддержки решений. Однако в реальной жизни пользователи сталкиваются со слабоструктурированными задачами в зашумленных предметных областях с высоким уровнем неопределенности.

Данные должны быть доступны системе или система должна включать подсистему извлечения данных.

Как отмечалось, внешние данные стекаются в организацию из многих источников. Некоторые данные поступают на постоянной основе посредством межмашинного обмена по каналам связи между организациями, другие – посредством Интернет, который делает возможным доступ ко многим тысячам баз данных во всем мире.

Развитие Web – систем привело к использованию Web – браузеров для доступа к жизненно – важной информации для сотрудников и покупателей.

Другие Web – системы включают исполнительные информационные системы, системы поддержки, развернутые посредством Web - браузеров и системы управления базами данных (СУБД), которые обеспечивают данными непосредственно в формате, представляемом web – браузером с передачей посредством Интернет или интранет.

Большая тройка продавцов реляционных СУБД – компании Informix, Oracle и Sybase переработали свои основные продукты с целью приспособления клиент – серверных и Интернет интранет приложений, которые включали бы нетрадиционные или мультимедийные типы данных.

Структура данных и системы управления базами данных.

Сложность большинства корпоративных БД иногда делает стандартные операционные системы (ОС) компьютеров неадекватными эффективному интерфейсу между пользователем и БД. СУБД созданы для дополнения стандартных ОС возможностями более полной интеграции данных, сложных структур файлов, быстрого поиска и обмена, лучшей защиты данных. СУБД – это часть программного обеспечения для пополнения информации в БД и модернизации, удаления, манипулирования, хранения и поиска информации. СУБД в сочетании с языком моделирования является типичным инструментом развития системы, который используется при разработке информационной системы поддержки решений.

Отношения между многими индивидуальными записями, хранящимися в БД могут быть выражены несколькими логическими структурами.

СУБД для выполнения своих функций разрабатываются с использованием таких структур.

Тремя основными структурами являются реляционная, иерархическая и сетевая. Более новыми структурами являются объектно – ориентированные БД и мультимедийные БД.

Рассмотрим две последние структуры подробнее.

Информационные системы поддержки решений в таких сложных предметных областях как интегрированное производство, требуют возможности доступа к сложным данным, которые могут включать иллюстрации и сложные отношения.

Ни иерархическая, ни сетевая, на даже реляционная архитектура не может эффективно справляться с такими БД. Даже когда для создания и доступа в реляционной БД используется SQL, решения могут быть неэффективными.

Названные три типа БД являются алфавитно - числовыми. Но иногда для достижения лучших результатов требуется графическое представление.

Объектно – ориентированное управление данными базируется на принципах объектно – ориентированного программирования. Системы с объектно – ориентированными БД объединяют характеристики объектно – ориентированных языков, таких как Smalltalk или C++ с механизмом хранения данных и доступа к ним. Объектно – ориентированная СУБД позволяет анализировать данные на концептуальном уровне, который делает упор на естественные отношения между объектами.

Абстракция используется для установления наследственных иерархий, а описание и представление в сжатой форме позволяет проектировщику БД хранить обычные и процедурные коды внутри одних и тех же объектов.

Объектно – ориентированная СУБД определяет данные как объекты и представляет данные в сжатой форме в соответствии с их подходящей структурой и поведением.

Система использует иерархию классов и подклассов объектов. Структура (в терминах отношений) и поведение (в терминах методов и процедур) содержаться внутри объекта.

Объектно – ориентированные СУБД особенно полезны в распределенных информационных системах поддержки решений для очень сложных приложений и предметных областей.

Мультимедийные СУБД управляют данными в различных форматах (в дополнение к стандартному тексту или числовым полям). Эти форматы включают следующие образы: цифровые фотографии и формы компьютерной графики, такие как карты и .pic файлы; гипертекстовые образы; видеоклипы; звук и виртуальную реальность (многомерные образы).

Хранилище данных.

Современным организациям присуще использование как старых централизованных систем, так и новых распределенных систем. Широкое разнообразие технологий обеспечено также большим числом продавцов программных продуктов. Сталкиваясь с таким технологическим и коммерческим окружением, менеджеры должны использовать новые понятия в управляющих информационных технологиях. Одним из таких понятий является складирование данных (или хранение данных).

Определение понятия «хранилище данных» начинается с физического разделения оперативного окружения, поддерживающего решения. В сердцевине многих компаний используется хранилище оперативных данных, обычно извлекаемых из неавтономных систем обработки транзакций в режиме онлайн (OLTP – online transaction processing – оперативная обработка транзакций) и базирующихся на головных компьютерах (фейн – фрейм; mainframe).

OLTP – системы, например, для финансов, инвентаризации запасов или управления, также производят оперативные данные. В оперативном окружении доступ к данным, прикладные логические задачи и логика представления данных тесно взаимодействуют вместе, обычно в нереляционных БД. Эти нереляционные хранилища данных не очень способствуют эффективному поиску данных при поддержке решений.

Целью хранилища данных является установление такого репозитария данных, который делает оперативные данные доступными в форме, которая приемлема для приложений в информационных системах поддержки решений. Как часть этого нового уровня доступности, процесс должен преобразовать детализированные по уровням оперативные данные в реляционную форму, которая делает их более подходящими для обработки при поддержки решений.

Хранение данных (или хранение информации) – это понятие, предложенное и разработанное для обеспечения решения проблемы эффективного доступа к данным, описанным выше. Хранилище данных объединяет различные источники данных в простые источники для доступа конечного пользователя.

Существует несколько базовых структур для хранения данных. Основными являются двухрядные и трехрядные структуры. Вариант трехрядной архитектуры представлен на рис.3.1.

Перед размещением в хранилище данные, поступающие из внутренних (связанных) и внешних источников извлекаются, очищаются, фильтруются и суммируются посредством специального ПО. Далее данные снова обрабатываются и помещаются в дополнительную специальную многомерную БД (третий ряд в архитектуре), организованную для легкого многомерного представления. Пользователи информационной системы поддержки решений могут запрашивать сервер и осуществлять анализ.

 

Рис. 3.1. Трехрядная архитектура хранилища данных.

 

В двухрядной архитектуре отсутствует многомерная БД или сервер.

Подобное хранение данных наиболее подходит для организаций, где:

- данные хранятся в различных системах;

- используется информационно – аналитический подход к менеджменту;

- имеется большая и разнообразная покупательская и клиентская база;

- одни и те же данные представлены по – разному в различных системах;

- данные хранятся в высокотехнических, трудных для расшифровки форматах.