Системы управления базами знаний
Неструктурированные данные и информация в электронном виде сегодня растут
быстрее всего — их объем удваивается каждый год, и некоторые компании
буквально тонут в океане данных.
Информация - это отражение внешнего мира с помощью знаков или сигналов.
Информационная ценность сообщения заключается в новых сведениях, которые в нем
содержатся (в уменьшении незнания).
Управление информацией (УИ) стало одной из ключевых задач во всех отраслях,
и компании ищут способы сократить производственные расходы, позволяющие
эффективно управлять электронным содержимым хранилищ данных, среди них:
· Управление информацией предприятия
· Автоматическое архивирование
· Создание многоуровневых хранилищ данных
· Резервирование информации
Информация, с которой имеют дело ЭВМ, разделяется на процедурную и
декларативную. Процедурная информация овеществлена в программах,
которые выполняются в процессе решения задач, декларативная информация - в
данных, с которыми эти программы работают. Стандартной формой представления
информации в ЭВМ является машинное слово, состоящее из определенного
для данного типа ЭВМ числа двоичных разрядов - битов. Машинное слово
для представления данных и машинное слово для представления команд, образующих
программу, могут иметь одинаковое или разное число разрядов. В последнее время
для представления данных и команд используются одинаковые по числу разрядов
машинные слова. Однако в ряде случаев машинные слова разбиваются на группы по
восемь двоичных разрядов, которые называются байтами.
Одинаковое число разрядов в машинных словах для команд и данных позволяет
рассматривать их в ЭВМ в качестве одинаковых информационных единиц и выполнять
операции над командами, как над данными. Содержимое памяти образует
информационную базу.
В большинстве существующих ЭВМ возможно извлечение информации из любого
подмножества разрядов машинного слова вплоть до одного бита. Во многих ЭВМ
можно соединять два или более машинного слова в слово с большей длиной.
Однако машинное слово является основной характеристикой информационной базы,
т.к. его длина такова, что каждое машинное слово хранится в одной стандартной
ячейке памяти, снабженной индивидуальным именем - адресом ячейки. По этому
имени происходит извлечение информационных единиц из памяти ЭВМ и записи их в
нее.
Параллельно с развитием структуры ЭВМ происходило развитие информационных
структур для представления данных. Появились способы описания данных в виде
векторов и матриц, возникли списочные структуры, иерархические структуры. В
настоящее время в языках программирования высокого уровня используются
абстрактные типы данных, структура которых задается программистом. Появление
баз данных (БД) знаменовало собой еще один шаг на пути организации
работы с декларативной информацией. В базах данных могут одновременно храниться
большие объемы информации, а специальные средства, образующие систему
управления базами данных (СУБД), позволяют эффективно манипулировать с
данными, при необходимости извлекать их из базы данных и записывать их в нужном
порядке в базу.
База данных — это совокупность сведений (о реальных объектах,
процессах, событиях или явлениях), относящихся к определенной теме или задаче,
организованная таким образом, чтобы обеспечить удобное представление этой
совокупности как в целом, так и любой ее части. Реляционная база данных
представляет собой множество взаимосвязанных таблиц, каждая из которых содержит
информацию об объектах определенного типа. Каждая строка таблицы включает
данные об одном объекте (например, клиенте, автомобиле, документе), а столбцы
таблицы содержат различные характеристики этих объектов — атрибуты (например,
наименования и адреса клиентов, марки и цены автомобилей). Строки таблицы
называются записями; все записи имеют одинаковую структуру — они
состоят из полей, в которых хранятся атрибуты объекта. Каждое поле
записи содержит одну характеристику объекта и имеет строго определенный тип
данных (например, текстовая строка, число, дата). Все записи имеют одни и
те же поля, только в них содержатся разные значения атрибутов.
Система моделирования бизнес-процессов должна обладать искусственным
интеллектом (ИИ). Внедрение такой системы должно оставить за человеком только
творческие задачи, полностью автоматизировав рутинные операции по управлению
современным предприятием.
Такая система должна обладать знаниями и способностями, сопоставимыми с
бизнес-аналитиком среднего уровня. Это означает, что система управления базой
знаний (именно знаний, а не данных) должна обеспечить представление и
обработку модели бизнес-процесса, сопоставимой по своей сложности с моделью
бизнес-процесса, используемой сознанием человека.
В ЭВМ знания так же, как и данные, отображаются в
знаковой форме - в виде формул, текста, файлов, информационных массивов и т.п.
Поэтому можно сказать, что знания - это особым образом организованные данные.
Но это было бы слишком узкое понимание. А между тем, в системах ИИ знания
являются основным объектом формирования, обработки и исследования. База
знаний, наравне с базой данных, - необходимая составляющая программного
комплекса искусственного интеллекта.
База знаний - совокупность систематизированных основополагающих сведений,
относящихся к определённой области знания, хранящихся в памяти ЭВМ, объём
которых необходим и достаточен для решения заданного круга теоретических или
практических задач. В системе управления БЗ используются методы искусственного
интеллекта, специальные языки описания знаний, интеллектуальный интерфейс.
Машины, реализующие алгоритмы искусственного интеллекта, называются
машинами, основанными на знаниях, а подраздел теории искусственного
интеллекта, связанный с построением экспертных систем, - инженерией знаний
.
Знания о предметной области, ее объектах и закономерностях описываются на
некотором формальном языке, называемом языком представления знаний (ЯПЗ). При
этом, ЯПЗ должен обеспечивать не только возможность формальной записи знаний,
но и необходимую обработку элементов этой записи. Совокупность знаний,
хранящаяся во внешней памяти ЭВМ, называется системой знаний; над ней
производятся различные операции: поиск необходимой информации, ее
модификация, интерпретация знаний, вывод новых знаний на основе имеющихся и
т.д. Организация интеллектуальных компьютерных систем работы со знаниями в
той или иной прикладной области зависят не только от специфики самих систем,
но и в существенной мере от используемых ЯПЗ и метода хранения системы знаний
в ЭВМ. В современных ИИ-системах знания хранятся в специальных БД - базах
знаний (БЗ). Существует самая непосредственная аналогия между понятиями
модель данных, используемая в БД-технологии и понятием способ представления
знаний в БЗ-технологии. Грубо говоря, можно сказать, что если БД содержит
собственно данные о некоторой предметной области, то БЗ содержит как сами
данные, так и описание их свойств. Однако между БД и БЗ существуют
принципиальные различия, рассматриваемые ниже
Процесс построения БЗ на основе информации эксперта состоит из трех этапов:
описание предметной области, выбор способа и модели представления знаний и
приобретение знаний. Сам процесс построения БЗ достаточно сложен, как
правило, плохо структурирован и носит итеративный характер, заключающийся в
циклической модификации БЗ на основе результатов ее тестирования. На первом
шаге построения БЗ четко очерчивается предметная область, на решение задач из
которой ориентируется проектируемая ЭС, т.е. инженер знаний определяет
область применения будущей системы и класс решаемых ею задач. В перечень
работ данного шага входят: (1) определение характера решаемых ЭС задач и
основных понятий, объектов предметной области, а также отношений между ними;
(2) установление специфических особенностей предметной области и (3) выбор
модели представления знаний. После решения первых двух вопросов инженер
знаний формально описывает предметную область на языке представления знаний
(ЯПЗ), т.е. создает модель представления знаний. В настоящее время
универсальный способ представления знаний отсутствует, поэтому инженер знаний
должен максимально учитывать специфику исходной предметной области.
Полученная после формализации предметной области БЗ может быть уже конкретно
реализована программными средствами, например на ЯВУ таких, как
Pascal,C,Prolog,Fortran,Forth и др.
Модели представления знаний.
Во многих случаях для принятия решений в той или иной области человеческой
деятельности неизвестен алгоритм решения, т.е. отсутствует четкая
последовательность действий, заведомо приводящих к необходимому результату.
Совокупность знаний нужных для принятия решений, принято называть предметной
областью или знаниями о предметной области.
В любой предметной области есть свои понятия и связи между ними, своя
терминология, свои законы, связывающие между собой объекты данных предметной
области, свои процессы и события. Кроме того, каждая предметная область имеет
свои методы решения задач.
Решая задачи такого вида на ЭВМ используют ИС, ядром которых являются базы
знаний, содержащие основные характеристики предметных областей.
При построении баз знаний традиционные языки, основанные на численном
представлении данных являются неэффективными. Для этого используются
специальные языки представления знаний, основанные на символьном
представлении данных. Они делятся на типы по формальным моделям представления
знаний:
- продукционные модели
- логические модели
- сетевые модели
- фреймовые модели
Продукционные и логические модели:
Знания в таких моделях представляются в следующей форме: «Если А, то В».
Вместо А и В могут стоять некоторые утверждения, факты, приказы и т.д.
Например: «Если диагонали четырехугольника пересекаются под прямым углом, то
этот четырехугольник ромб».
Из примера видно что правило состоит из двух частей: посылки (условия) и
следствия (заключения). Если А (посылка) имеет место, то В (следствие) также
реализуется или может быть реализовано. Посылка может состоять и из
нескольких частей т.е: «Если А1,А2,..,АN то В».
Запись правила означает, что «Если все посылки от А1 до АN истинны, то
следствие В также истинно». Посылки А1..АN есть простые посылки они соединяются
с помощью союзов: и, или и могут содержать отрицание не. При
реализации правил такого вида из одной или нескольких посылок (знаний) могут
быть получены новые знания, поэтому они называются продукционными.
В основе сетевых моделей представления знаний лежит идея о том, что любые
знания можно представить в виде совокупности объектов (понятий) и связей
(отношений) между ними. В отличие от продукционных эти модели более наглядны,
поскольку любой пример можно представить в виде ориентированного
(направленного) графа.
В зависимости от типов связей, используемых в модели, различают
классифицирующие сети, функциональные сети и сценарии.
Система управления базами знаний – это объектная БД с возможностями
интеллектуального поиска и автоматического переупорядочивания структуры в
зависимости от действий пользователей - по сути обучение, возможно и иное с web
interface-ом и хорошо бы с интегрированным средством планирования/управления.
Характерные черты:
· Иерархическая организация знаний
· Специализированные средства для обработки конструкторских данных и
знаний
· Специализированный инструментарий для работы с деревьями составов
· Средства реорганизации и адаптации баз знаний к специфике задач
· Расширяемая библиотека функций и команд для разработки приложений
Система управления базой знаний (СУБЗ) объектно-ориентированной обладает
следующими возможностями:
Сохранять текущее состояние графа объектов или нейронной сети в СООБЗ между
сеансами работы с пользователем. В том числе сохраняется текущая топология
сети объектов. При повторном запуске приложения не понадобится создавать сеть
объектов заново.
При большем количестве экземпляров объектов ограничить объем памяти,
используемый графом объектов или нейронной сетью. Наиболее часто используемые
объекты остаются в оперативной памяти, остальные вытесняются в файловое
хранилище и загружаются в оперативную память по мере необходимости. При
загрузке экземпляра в оперативную память он вытесняет другие, редко
используемые объекты.
Ограничение объема памяти позволяет избавиться от использования файла
подкачки операционной системы, что значительно повышает производительность
моделирования сетей с большим количеством экземпляров объектов (при суммарном
размере всех экземпляров большем, чем размер текущей свободной памяти в
системе)
В случае, если объем сети объектов меньше чем размер текущей свободной памяти
в системе, вся сеть находится в оперативной памяти и потерь
производительности, связанных с сериализацией - десериализацией не возникает.
Применение СООБЗ не накладывает никаких ограничений на используемую бизнес
логику или математическую модель нейрона, которую можно реализовать как
методы объектов, находящихся в СООБЗ. Единственное требование - организовать
связи между объектами в сети не с помощью указателей, а с помощью ID
объектов. При этом будет необходимо получать указатель на объект используя
API СООБЗ.
Для работы с данными используются системы управления базами данных
(СУБД). Основные функции СУБД — это определение данных (описание
структуры баз данных), обработка данных и управление данными.
Система управления базами данных (СУБД) данных представляет собой
программное обеспечение, которое управляет доступом к базе данных. Это
происходит следующим образом:
1. Пользователь выдает запрос на доступ к БД, применяя определенный
подъязык данных (например, SQL).
2. СУБД перехватывает этот запрос и анализирует его.
3. СУБД просматривает внешнюю схему для этого пользователя,
соответствующее отображение внешний – концептуальный, концептуальную схему,
отображение концептуальный – внутренний и определение структуры хранения
данных.
4. СУБД выполняет необходимые операции над хранимой базой данных.
Система управления баз данных.
С многоуровневым разграничением доступа. Известно, что в MLS/DBMS не ко всем
данным, содержащимся в базе данных, доступ осуществляется одинаково. Однако
современные СУБД, как правило, не имеют адекватных средств диагностики и
механизма определения того, что пользователь имеет возможность доступа только
к тем данным, которые являются релевантными. Таким образом, MLS/DBMS
отличается от соответствующих DBMS, по крайней мере, следующими двумя
особенностями: каждый элемент данных в базе данных связан с уровнем
доступа; доступ пользователя к данным должен контролироваться релевантностью
для данного пользователя.
Разработка сервиса MLS/DBMS в современных компьютерных системах представляет
много проблем. До настоящего времени внедрение многоуровневого разграничения
доступа в операционную систему представляет собой значительные трудности.
Решение этой проблемы в виде аббревиатуры обозначается ТСВ. Хотя в разрешении
вопросов ТСВ для удаленных пользователей в MLS/DBMS вводятся компромиссы,
остается много проблем, которые требуется разрешать. Наиболее очевидная
проблема состоит в том, что вопросы классификации в СУБД значительно
сложнее, чем в файловых системах и могут быть сложнее реализованы. Другая
проблема состоит в том, что для классификации данных, содержащих
контекстные представления, временные параметры, их композицию, необходимы
унифицированные базы данных.
Любая СУБД позволяет выполнять четыре простейшие операции с данными:
- добавлять в таблицу одну или несколько записей;
- удалять из таблицы одну или несколько записей;
- обновлять значения некоторых полей в одной или нескольких записях;
- находить одну или несколько записей, удовлетворяющих заданному
- условию.
Для выполнения этих операций используется механизм запросов. Результатом
выполнения запросов является либо отобранное по определенным критериям
множество записей, либо изменения в таблицах. Запросы к базе формируются на
специально созданном для этого языке, который так и называется язык
структурированных запросов (SQL — Structured Query Language).
И последняя функция СУБД — это управление данными. Под управлением данными
обычно понимают защиту данных от несанкционированного доступа, поддержку
многопользовательского режима работы с данными и обеспечение целостности и
согласованности данных.
Защита от несанкционированного доступа обычно позволяет каждому пользователю
видеть и изменять только те данные, которые ему разрешено видеть или менять.
Средства, обеспечивающие многопользовательскую работу, не позволяют
нескольким пользователям одновременно изменять одни и те же данные. Средства
обеспечения целостности и согласованности данных не дают выполнять такие
изменения, после которых данные могут оказаться несогласованными. Например,
когда две таблицы связаны отношением "один-ко-многим", нельзя внести запись в
таблицу на стороне "многие" (ее обычно называют подчиненной), если в таблице
89 Понятие базы знаний и банка данных.
Определение банка данных. Банк данных (БнД) является современной формой организации хранения и доступа к информации. Существует множество определений банка данных. В «Общеотраслевых руководящих материалах по созданию банков данных» (М.: ГКНТ, 1982) дано следующее определение: «Банк данных - это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных».
В данном определении подчеркивается, что банк данных является сложной системой, включающей в себя все обеспечивающие подсистемы, необходимые для функционирования любой системы автоматизированной обработки данных.
В этом определении обозначены и основные отличительные особенности банков данных. Прежде всего, это то, что базы данных (БД) создаются обычно не для решения какой-либо одной задачи для одного пользователя, а для многоцелевого использования. БД отражают определенную часть реального мира. Эта информация должна по возможности фиксироваться в базе данных однократно, и все пользователи, которым эта информация нужна, должны иметь возможность работать с ней.
Другой отличительной особенностью банков данных является наличие специальных языковых и программных средств, облегчающих для пользователей выполнение всех операций, связанных с организацией хранения данных, их корректировки и доступа к ним. Такая совокупность языковых и программных средств называется системой управления базой данных (СУБД).
Нельзя сказать, что термин «банк данных» является общепризнанным. В некоторой англоязычной литературе в последнее время используется термин «система баз данных» (database system), который по своему содержанию близок введенному понятию банка данных (система баз данных включает базу данных, систему управления базами данных, соответствующее оборудование и персонал) [17]. Согласно семантике русского языка понятие «система баз данных» воспринимается уже, чем оно обозначает в действительности. Поэтому слово «банк» является в этом смысле лучше, так как «банк» привычно обозначает не только то, что хранится в нем, но и всю инфраструктуру. Однако очевидно, что нельзя отождествлять понятия «база данных» и «банк данных», как это иногда происходит в некоторых литературных источниках
Преимущества БнД. Особенности «банковской» организации данных определяют их основные преимущества перед «небанковской» организацией
Наличие единого целостного отображения определенной части реального мира позволяет обеспечить непротиворечивость и целостность информации, возможность обращаться к ней не только при решении заранее предопределенных задач, но и с нерегламентированными запросами. Интегрированное хранение сокращает избыточность хранимых данных, что приводит к сокращению затрат не только на создание и хранение данных, но и на поддержание их в актуальном состоянии. Использование БнД при правильной его организации должно существенно изменить деятельность организации, где он внедряется, привести к сокращению документооборота, форм документов, перераспределению функций между сотрудниками
Централизованное управление данными также дает целый ряд преимуществ. Освобождение от этих функций всех пользователей, кроме администраторов БД, не только приводит к сокращению трудоемкости создания системы и снижению требований к остальным участникам функционирования БнД, но и повышает качество разработок, так как вопросами организации данных занимается небольшое число профессионалов в этой области. Большинство СУБД обеспечивает высокое качество выполнения функций по управлению данными.
Преимуществом банков данных является также то, что они обеспечивают возможность более полной реализации принципа независимости прикладных программ от данных, чем это возможно при организации локальных файлов.
Наличие в составе СУБД средств, ориентированных на разные категории пользователей, делает возможной работу с базой данных не только профессионалов в области обработки данных, но и практически любого, причем это использование может быть как для их профессиональных целей, так и для удовлетворения потребности в информации в быту и т.п.
Предпосылки широкого использования БнД. Очевидные преимущества БнД и объективные предпосылки их создания привели к широкому их использованию. К числу предпосылок применения относятся следующие:
объекты реального мира находятся в сложной взаимосвязи между собой. Это приводит к необходимости, чтобы их информационное отражение также представляло единое взаимоувязанное целое;
информационные потребности различных пользователей существенно пересекаются, что делает целесообразным использование единых баз данных и обеспечение доступа к ним разных пользователей;
функции создания и. ведения информационного фонда и предоставления нужных данных являются универсальными, общими при решении разнообразных задач. Создание специализированных программных средств для управления данными приводит к повышению уровня выполнения этих функций и сокращению трудоемкости создания информационных систем;
современный уровень развития технического и программного обеспечения, а также теории и практики построения информационных систем позволяют создавать эффективные БнД.
Требования к БнД. Особенности «банковской» организации данных позволяют сформулировать основные требования, предъявляемые к БнД:
адекватность отображения предметной области (полнота, целостность и непротиворечивость данных, актуальность информации, т.е. ее соответствие состоянию объекта на данный момент времени);
возможность взаимодействия пользователей разных категорий и в разных режимах, обеспечение высокой эффективности доступа для разных приложений;
дружелюбность интерфейсов и малое время на освоение системы, особенно для конечных пользователей;
обеспечение секретности и конфиденциальности для некоторой части данных; определение групп пользователей и их полномочий;
обеспечение взаимной независимости программ и данных;
обеспечение надежности функционирования БнД; защита данных от случайного и преднамеренного разрушения; возможность быстрого и полного восстановления данных в случае их разрушения; технологичность обработки данных, приемлемые характеристики функционирования БнД (стоимость обработки, время реакции системы на запросы, требуемые машинные ресурсы и др.).
КОМПОНЕНТЫ БАНКА ДАННЫХ
Состав банка данных. Банк данных является сложной человеко-машинной системой, включающей в свой состав различные взаимосвязанные и взаимозависимые компоненты (рис. 1.1).
Информационная компонента. Ядром БнД является база данных. База данных - это поименованная совокупность взаимосвязанных данных, находящихся под управлением СУБД.
Существует множество определений базы данных. Некоторые из них имеют право на существование. Другие устарели и не соответствуют современным представлениям о БнД. Так, в ранних определениях базы данных указывалось на их неизбыточность, отсутствие дублирования данных в них. На самом деле это не так. В базах данных может наблюдаться избыточность информации. Она может быть вызвана спецификой используемой модели данных, не позволяющей полностью устранить дублирование, или технологическими причинами (обеспечение большей надежности, сокращение времени реакции системы и др.). Но это должна быть управляемая избыточность, причины и цели возникновения которой известны администратору базы данных и управляются, как им, так и СУБД.
В настоящее время действует Закон «О правовой охране программ для электронных вычислительных машин и баз данных» № 3523-1 от 23.09.92. В этом законе (ст. 1) дается следующее определение базы данных: «База данных - это объективная форма представления и организации совокупности данных (например, статей, расчетов), систематизированных таким образом, чтобы эти данные могли быть найдены и обработаны с помощью ЭВМ». Учитывая назначение этого закона, вполне естественно, что сделан иной акцент, и это определение является более широким, чем приведенное нами выше определение. Так как нас больше интересуют проблемы проектирования БД, мы в качестве рабочего определения будем пользоваться данным нами выше определением, и не всякие файлы будем считать базами данных.
В технической документации некоторых СУБД, а также в некоторых литературных источниках в состав БД включаются не только собственно хранимые данные о предметной области, но и описания БД. Более правильно описания баз данных считать самостоятельными компонентами БнД, даже если они и хранятся вместе с самими данными.
Описания баз данных относятся к метаинформации, т.е. информации об информации. Описание баз данных часто называют схемой. Кроме того, в БнД могут присутствовать описания отдельных частей баз данных с точки зрения отдельных пользователей - подсхемы.
Кроме описания баз данных в состав метаинформации, хранимой в БнД, может включаться информация о предметной области, необходимая для проектирования системы, о пользователях БнД, о проектных решениях и некоторая другая информация.
Централизованное хранилище метаинформации называется словарем данных. В литературе используются также термины словарь-справочник, энциклопедия, репозиторий. В некоторых источниках выявляются различия между ними, в других они используются как синонимы. Для данного уровня рассмотрения для нас эти различия несущественны.
Роль словарной системы особенно возрастает при использовании средств автоматизированного проектирования информационных систем. Для большинства из них репозиторий является ядром всей системы.
К банкам данных не относятся немашинные документы, служащие источниками информации, вводимой в БД, файлы входной и выходной информации, архивные файлы, выходные документы. Однако, многие СУБД включают в свой состав языковые средства для описания этих компонентов. В этом случае сами описания, используемые в процессе функционирования БнД, будут входить в его состав.
Программные средства БнД. Программные средства БнД представляют собой сложный комплекс, обеспечивающий взаимодействие всех частей информационной системы при ее функционировании (рис. 1.2).
Основу программных средств БнД представляет СУБД. В ней можно выделить ядро СУБД, обеспечивающее организацию ввода, обработки и хранения данных, а также другие компоненты, обеспечивающие настройку системы, средства тестирования, утилиты, обеспечивающие выполнение вспомогательных функций, таких, как восстановление баз данных, сбор статистики о функционировании БнД и др. Важной компонентой СУБД являются трансляторы или компиляторы для используемых ею языковых средств.
Подавляющее большинство СУБД работает в среде универсальных операционных систем и взаимодействует с ОС при обработке обращений к БнД. Поэтому можно считать, что ОС также входит в состав БнД.
Для обработки запросов к БД пишутся соответствующие программы, которые представляют прикладное программное обеспечение БнД.
Языковые средства БнД. Языковые средства СУБД являются важнейшей компонентой банков данных, так как в конечном счете они обеспечивают интерфейс пользователей разных категорий с банком данных. Языковые средства большинства СУБД относятся к языкам четвертого поколения (к первому поколению языков относят машинные языки, ко второму - символические языки ассемблера, к третьему - алгоритмические языки типа PL, COBOL и т.п., которые в 60-е годы назывались языками высокого уровня, но уровень которых гораздо ниже, чем у языков четвертого поколения).
Языки четвертого поколения создавались по принципу «люди стоят дороже, чем машины». При их проектировании используются следующие принципы.
Принцип минимума работы: язык должен обеспечить минимум усилий, чтобы «заставить» машину работать.
Принцип минимума мастерства: работа должна быть так проста, как только это возможно; она не должна быть уделом избранных и быть понятной лишь посвященным.
Принцип естественности языка, упразднения «инородного» синтаксиса и мнемоники. Язык не должен требовать от пользователей значительных усилий в изучении синтаксиса или содержать много мнемонических или иных обозначений, которые быстро забываются.
Принцип минимума времени. Язык должен позволять без существенной задержки реализовывать возникающие потребности в доступе к информации и ее обработке.
Принцип минимума ошибок. Технология должна быть спроектирована таким образом, чтобы минимизировать ошибки человека, а уж если они возникли, то по возможности «выловить» их автоматически.
Принцип минимума поддержки. Механизм языков четвертого поколения должен позволить легко вносить изменения в имеющиеся приложения.
Принцип максимума результата. Языки четвертого поколения предоставляют пользователям мощный инструмент для решения разнообразных задач.
Спектр языковых средств, применяемых в СУБД, широк. Можно выделить две концепции развития языковых средств: концепцию разделения и концепцию интеграции. При использовании концепции разделеия различают языки описания данных (ЯОД), языки манипулирования данными (ЯМД), языки запросов и другие языковые средства.
В сосаве языков описания данных в зависимости от особенностей СУБД поддерживаются все или некоторые из следующих языков: язык описания схем, язык описания подсхем, язык описания хранимых данных, языки описания внешних данных (входных, выходных).
Языки манипулирования данными разделяются на две большие группы: процедурные и непроцедурные. При пользовании процедурными языками надо указать, какие действия и над какими объектами необходимо выполнить, чтобы получить результат. В непроцедурных языках указывается, что надо получить в ответе, а не как этого достичь.
Процедурные языки могут различаться по основным информационным единицам, которыми они манипулируют. Это могут быть языки, ориентированные на позаписную обработку данных, и языки, ориентированные на операции над множеством записей. Так, операции реляционной алгебры оперируют целиком отношением, а не каждой его записью.
Примерами непроцедурных языков являются языки, основанные на реляционном исчислении. Представителем языков, основанных на реляционном исчислении кортежей, является широко используемый язык запросов SQL.
Языковые средства предназначаются для пользователей разных категорий: конечных пользователей, системных аналитиков, профессиональных программистов. Повышение уровня языковых средств, их дружелюбности приводит к тому, что все большее число функций выполняется пользователями-непрограммистами самостоятельно, без посредников.
По своим функциональным возможностям выделяют следующие категории языков.
Языки, обеспечивающие только возможности запросов. Они обеспечивают вывод требуемых данных на экран или печать в нужном формате. В настоящее время используются редко.
Комплексные языки запросов-обновлений. Более развитые языки, которые позволяют формулировать сложные запросы, относящиеся к нескольким взаимосвязанным записям, а также обновлять данные так же легко, как и формулировать запросы. Используя их, пользователи могут создавать свои собственные файлы.
Генераторы отчетов. Они позволяют выбирать нужные данные из файлов или баз данных и форматировать их в виде требуемых форм документов.
Графические языки. Использование графических средств в настоящее время постоянно расширяется. Они позволяют выводить данные в виде различных графиков и диаграмм, а также использовать другие изобразительные возможности. Так же как генераторы отчетов, графические языки позволяют осуществлять отбор информации из файлов или баз данных по различным критериям, а также выполнять арифметические и логические манипуляции с данными.
Инструментальные средства поддержки решений. Языки этого типа предназначены для создания систем принятия решений. Это могут быть системы типа «что-если», системы, выполняющие временной или трендовый анализ, и др. Возможно использование как универсальных, так и проблемно-ориентированных средств
Генераторы приложений. Языковые средства, предназначенные для генерации приложений, обеспечивают возможность описания непроцедурным путем требуемой обработки информации и дальнейшей автоматической генерации программ.
Машино-ориентированные языки спецификаций. Фактически являются генераторами приложений, дальнейшим их развитием. В отличие от генераторов приложений языки спецификаций более универсальны и позволяют специфицировать приложения разных типов.
Языки очень высокого уровня. В большинстве случаев приложения строятся при помощи непроцедурных языков. Но некоторые языки являются процедурными (например, NOMAD), но программирование на них значительно короче, чем, например, на COBOLe.
Параметризированные пакеты прикладных программ. Эта категория программных средств известна давно, и «четвертое поколение» относится к таким ППП, которые допускают легкую модификацию самого пакета, позволяют пользователям генерировать собственные отчеты, запросы к базе данных и т. д.
Языки приложений. Многие языки четвертого поколения являются универсальными языками. Другие спроектированы для специфических приложений. Примерами таких языков являются языки для управления финансами, управления работой станков с программным управлением и т. д.
По форме представления различают аналитические, табличные и графические языковые средства. Классификация языковых средств по форме представления относится как к языкам описания данных, так и к языкам манипулирования данными.
Бывает, что в рамках одной СУБД для одних и тех же целей могут использоваться языки разных типов. Например, в СУБД dBase IV для манипулирования данными могут использоваться:
язык программирования dBase, который является процедурным языком, часть операторов которого реализует операции реляционной алгебры, а другая часть, более значительная по количеству операторов и функций, представляет собойнереляционные операции, обеспечивающие позаписную обработку файлов, организацию циклической и условной обработки, ввод-вывод данных, корректировку, возможность работы с переменными памяти и другие возможности;
табличный язык запросов типа QBE (панель Queries управляющего центра);
язык SQL, относящийся к классу языков исчисления кортежей.
91 Компьютерные информационные технологии в управлении экономическим объектом. Классификация систем управления.
Информационные технологии (ИТ) - совокупность методов и программно-технических средств, объединенных в технологическую цепочку, обеспечивающую сбор, обработку, хранение, распределение и отображение информации с целью снижения трудоемкости процессов использования информационных ресурсов, а так же повышения их надежности и оперативности.
Информационные технологии в сфере экономики управления - это комплекс методов переработки разрозненных исходных данных в надежную и оперативную информацию механизма принятия решений с помощью аппаратных и программных средств с целью достижения оптимальных рыночных параметров объекта управления.
По сути, под информационной технологией на практике понимается технологическое применение компьютеров и других технических средств обработки и передачи информации. Как и всякая технология, информационная технология включает в свой состав определенные комплексы материальных средств (носители информации, технические средства ее измерения, передачи, обработки и т.п.), способы их взаимодействия, а так же определенные методы организации работы с информацией.
Информационная система (ИС) - упорядоченная совокупность документированной информации и информационных технологий. Проектирование и эксплуатация информационных систем обеспечиваются
следующими средствами: программными (программы для компьютеров, различного назначения); техническими (аппаратные средства, вычислительной техники и связи, обеспечивающие размещение и обработку информационных ресурсов на персональных компьютерах, в локальной сети, в региональной сети, в сети международного информационного обмена); лингвистическими (словари, классификаторы, тезаурусы); правовыми (положения, уставы, должностные инструкции); организационными (инструкции, методики, схемы, описания и другая эксплуатационная документация); кадровыми (квалифицированными специалистами отдела информационных технологий, привлекаемые специалисты).
Все виды информационных систем и сетей, технологии и средств их обеспечения составляют специальную отрасль экономической деятельности, развитие которой определяется государственной научно-технической и промышленной политикой информатизации. Жизненный цикл автоматизированной информационной системы можно сформулировать из 4 этапов: разработка (техническое задание, технический проект, рабочая документация), ввода в эксплуатацию (предэксплуатационное накопление данных, испытание информационных технологий, сертификация, установка на объекте), эксплуатации (эксплуатационное накопление данных и ситуационное изменение данных, использование на объекте, услуги заказчикам), списания.
В качестве основного классификационного признака автоматизированных информационных систем (АИС) целесообразно рассматривать особенности автоматизируемой профессиональной деятельности - процесса переработки входной информации для получения требуемой выходной информации, в котором АИС выступает в качестве инструмента должностного лица или группы должностных лиц, участвующих в управлении организационной системы.
В соответствии с предложенным классификационным признаком можно выделить следующие АИС:
автоматизированные системы управления (АСУ);
системы поддержки принятия решений (СППР);
автоматизированные информационно-вычислительные системы (АИВС);
автоматизированные системы обучения (АСО);
автоматизированные информационно справочные системы (АИСС).
Автоматизированная система управления представляет собой автоматизированную систему, предназначенную для автоматизации всех или большинства задач управления, решаемых коллективным органом управления (министерством, дирекцией, правлением, службой, группой управления и т.д.). В зависимости от объекта управления различают АСУ персоналом (АСУП) и АСУ техническими средствами (АСУТС).
Системы поддержки принятия решений - это интерактивные компьютерные ИС, в которых используются различные модели принятия решений и специализированные базы данных, обеспечивающие деятельность ответственных за принятия решений сотрудников. Программное обеспечение таких систем позволяет пользователям определенным образом ставить ряд вопросов типа "что, если", получая в интерактивном режиме соответствующие рассматриваемой ситуации варианты действий.
Искусственный интеллект (ИИ) - это информационная технология, конечная цель которой состоит в создании компьютера, умеющего думать, видеть, слушать и чувствовать подобно человеческому существу. Наибольшее организационное воздействие ИИ оказывает в области экспертных систем. Экспертная система (ЭС) пытается копировать мыслительные процессы, свойственные в ходе процесса принятия решений профессионалам и менеджерам. ЭС разрабатывается посредством кодирования знаний специалиста из области правил принятия решений, которые записываются в компьютерную программу, моделирующую определенную стратегию решения задач. ЭС имеют значительное сходство с системами поддержки принятии решений. По существу, обе они
обеспечивают высокий уровень, поддержки занятых решением рабочих задач пользователям. Однако ЭС применяются, как правило, для работы с повторяющимися проблемами в узких сферах деятельности и предлагают рекомендации, тогда как системы поддержки решений используются в решении уникальных, имеющих сложную природу проблем.
Классификацию систем управления можно осуществлять по таким признакам как: степень автоматизации функций управления, степень сложности системы, степень определенности, тип объекта управления и др. В зависимости от степени автоматизации функции управления различают: ручное, автоматизированное и автоматическое управление. Соответственно принято различать, как было сказано выше, автоматизированные и автоматические системы управления.
По степени сложности системы делят на простые и сложные. Сложные системы характеризуются следующими особенностями: число параметров, которыми описывается система, весьма велико, многие из этих параметров не могут быть количественно описаны и измерены; цели управления не поддаются формальному описанию без существенных упрощений; невозможно дать строгое формальное описание системы управления.
По степени определенности системы разделяются на детерминированные и вероятностные (стохастические). В детерминированной системе по ее предыдущему состоянию и некоторой дополнительной информации можно вполне определенно предсказать ее последующее состояние. В вероятностной системе на основе такой же информации, можно предсказать лишь множество будущих состояний и определить вероятность каждого из них.
92 Понятие информационной системы. Классификация информационных систем. Виды обеспечения информационных систем.
Понятие «информационная система»
Понятие «информационная система»[1] широко используется в современной компьютерной литературе. В различных источниках дается несколько отличающихся друг от друга определений этому понятию.
«Автоматизированная информационная система (АИС) — совокупность программно-аппаратных средств, предназначенных для автоматизации деятельности, связанной с хранением, передачей и обработкой информации».
Пожалуй, наиболее ясным и простым является определений, взятой с сайта http://ru.wikipedia.org. В нем, однако, в состав информационной системы вводится аппаратные средства, а наличие хранилища данных предполагается не явно. Очевидно, авторы предполагают наличие ИС, не оперирующих непосредственно с хранилищами данных, являющихся, так сказать только посредниками.
Мы предлагаем следующее определение ИС.
Определение
Совокупность программного обеспечения и электронного информационного хранилища, разрабатываемая как единая система и предназначенная для автоматизации определенного рода деятельности будет называться информационной системой.
Рассмотрим смысл данного определения. Прежде всего, отметим, что объединение программного обеспечения (возможно несколько программ) и информационного хранилища есть результат реализации некоторого проекта, что и подчеркивается словами «разрабатываемая как единая система». Отсюда кстати и вытекает, что поскольку программное обеспечение и информационное хранилище находятся в одной системе, следовательно, они как-то должны взаимодействовать друг с другом. С другой стороны, здесь не говорится, что все программы и хранилище, которые включены в систему разрабатываются в рамках конкретного проекта, а поэтому какие-то программы и части информационного хранилища могут быть включены в проект в уже готовом виде. В определении говорится «разрабатываемая», т.е. ИС может находиться в разработке, и дополняться новыми программами и т.п. Отметим также, что под «информационным хранилищем» в данном определении мы понимаем все данные, хранящиеся во внешней памяти, управление которыми осуществляет программное обеспечение данной информационной системы.
Наконец в определении сказано, что система предназначена для автоматизации какой-либо деятельности, а, следовательно, во-первых, ИС предназначена для использования в некоторой профессиональной области, а во-вторых, информационное хранилище спроектировано для хранения данных имеющих вполне определенную область применения, т.е. отражающее вполне конкретную предметную область.
Определение
Под предметной областью в данной книге будем понимать часть области знаний, предназначенную для автоматизации с помощью информационной системы и схематически представленную в информационном хранилище.
Замечание
часто информационные системы называют «автоматизированными системами» или «автоматизированными информационными системами», желая подчеркнуть использование, при их построении электронно-вычислительной техники. Нам нет нужды использовать такое дополнение, так как использование вычислительной техники в функционировании ИС вытекает из нашего определения.
Классификации информационных систем
Самой простой и очевидной классификацией является классификация по областям применения. В этой связи можно говорить об информационных системах в экономике (АСЭ – автоматизированные системы в экономике), в образовании (АСО), в научных исследованиях (АСНИ) и т.д.
Еще одним классификационным признаком может выступать характер информации, которой оперирует ИС. С этой точки зрения все информационные системы принято делить на фактографические и документальные. Под фактографическим типом данных принято понимать данные представляющие собой описание некоторых фактов предметной области. Например, фактом являются данные на конкретного человека (ФИО, адрес, паспортные данные и т.п.), книгу (автор, название, год издания и т.п.), машину (марка, год выпуска, производитель и т.п.) и т.д. Другими словами, факт в информационной системе предстает в виде набора некоторых свойств (атрибутов), количественное значение которых, как правило, выражается простым типом данных. Характерным представителем фактографических информационных систем является широко известная в бухгалтерских кругах «1С бухгалтерия».
Документ, в отличие от факта, не может быть выражен простой структурой.
Определение
Под документом будем понимать хранящийся в информационной базе, объект произвольной структуры, содержащий информацию произвольного характера, доступ, к которому можно получить по его реквизитам.
Под реквизитами документа будем понимать совокупность свойств этого документа, позволяющих однозначно его идентифицировать. Примерами реквизитов могут служить название документа, его номер, дата создания, имена создателей, электронная подпись и т.д. В качестве примеров документов можно привести статьи, тексты приказов и распоряжений, бухгалтерские документы, карты местности, звуковые записи и т.д. Важно еще раз подчеркнуть, что структура объекта, который мы назвали документом, может носить самый произвольный характер: форматы для текстовых документов (обычный текстовый формат, формат Word, формат PDF, формат DJVu, формат HTML и т.д.), таблицы, графические файлы и т.п.
Типичным примером документальных информационных систем являются справочные юридические системы типа Гарант, Консультант+ и т.п. Поисковые интернет системы также являются представителями документальных систем. Реальные информационные системы часто оперируют некоторой смесью фактографической и документальной информации, тем более что современные СУБД[2], на основе которых, как правило, и строятся современные ИС, предоставляют мощные инструментальные средства для манипулирования информацией того и другого типа.
Наконец, информационные системы можно классифицировать и по той роли, которую они играют в профессиональной деятельности. Таким образом, можно выделить
Системы управления. ИС данного типа предназначены для решения задач автоматизации процессов управления. Выделяют также классы систем управления персоналом и систем управления технологическими процессами.
Вычислительные информационные системы. Данные системы предназначены для проведения оперативных расчетов и обмена информацией между рабочими местами в рамках одной организации. В данном классе выделяются также системы автоматического проектирования (САПР).
Поисково-справочные информационные системы. Данные системы предназначены для сбора, хранения и поиска информации справочного характера. Такие системы не заменимы в конкретных областях знаний: медицине, юриспруденции, программированию и др.
Системы принятия решения. Системы этого класса предназначены для автоматизации поиска решения руководящего состава. Особенностью задач принятия решений являются: недостаточность имеющейся информации, ее противоречивость и не четкость, слабая формализация и наличие качественных оценок. В качестве ИС для принятия решений используются системы, построенные на основе алгоритмов искусственного интеллекта и баз знаний. Часто такие системы поддерживают естественно-языковой интерфейс.
Информационные обучающие системы. К информационным обучающим системам относят: системы программного обучения, системы для деловых игр и тренажерные комплексы.
1 уровень – техническое обеспечение. Это совокупность взаимосвязанных и взаимодействующих технических средств.
2 уровень – информационное обеспечение – совокупность сведений, необходимых для выполнения автоматизированного проектирования. Основная его часть – автоматизированные банки данных, состоящие из БД, БЗ, САПР и СУ.
3 уровень – программное обеспечение – совокупность машинных программ, необходимых для выполнения автоматизированного проектирования.
4 уровень – организационно-методическое – совокупность документов, устанавливающих состав проектной организации и ее подразделений, связи между ними и их функции, совокупность документов, устанавливающих состав и правила отбора и эксплуатации средств обеспечения автоматизированного проектирования.
5 уровень – лингвистическое– совокупность языков проектирования, включая термины и определения, правила формализации естественного языка и методы сжатия и развертывания текстов.
6 уровень – математическое обеспечение – совокупность математических методов, математических моделей и алгоритмов проектирования.
7 уровень – концептуальное– совокупность универсальных мировоззренческих концепций, отражающих цели развития системы.
93 Корпоративные информационные системы. Принципы-организации корпоративных информационных систем. Гомогенные (однородные) и гетерогенные (неоднородные) информационные системы. Корпоративные информационные технологии. Технологии "клиент/сервер". Управление распределенными вычислениями.
Корпоративная информационная система (КИС) — это управленческая идеология, объединяющая бизнес-стратегию предприятия (с выстроенной для ее реализации структурой) и передовые информационные технологии. Основную роль при этом играет отработанная структура управления, автоматизация исполняет второстепенную, инструментальную роль.
Обобщенная структура управления бизнесом включает в себя четыре основных блока: сам объект управления, блок управления, ресурсы и математическую модель (которая распадается на три, а иногда и больше разновидности — модель текущего состояния, переходного состояния и конечного состояния). Все остальное — это правила взаимодействия между ними.
«Корпоративность» в терминах КИС означает соответствие системы нуждам крупной фирмы, имеющей сложную территориальную структуру.
Информационная система отдельных составляющих фирму подразделений (финансовых, экономических, маркетинговых и др.) не может претендовать на корпоративность. Только полнофункциональная система может по праву быть охарактеризована как КИС.
Как свидетельствует мировой опыт, экономический рост государства существенно связан с развитием и использованием в экономике современных средств и технологий автоматизации. Успешное ведение бизнеса сегодня практически невозможно без использования современных информационных систем. В наиболее развитых странах именно сектор высоких технологий обеспечивает их процветание и богатство.
Современные корпоративные информационные системы играют в наше время такую же роль, какую сыграло появление машин в ХIХ веке. Фактически, они стали основной движущей силой научно-технической революции и развития современной мировой экономики. Умело выбранная и внедренная КИС существенно улучшает управляемость предприятия и повышает эффективность его работы.
Именно поэтому тема контрольной работы «Корпоративные информационные системы.» является очень важной.
В первой части контрольной работы будет рассказано о том, что такое корпоративные информационные системы, в чем их важность для предприятия, какие существуют причины для их внедрения, будут описаны основные моменты эволюции КИС.
Во второй части контрольной работы будет дан анализ основных проблем, связанных с внедрением корпоративных информационных систем на предприятии. Ведь не секрет, что почти половина попыток внедрения подобных систем заканчивается провалом. Чтобы не потратить зря деньги и время, следует подробно изучить, почему это происходит, какие могут быть причины отсутствия ожидаемого эффекта от внедрения КИС.
В третьей части будут даны рекомендации выбора корпоративных информационных систем. Выбор конкретной КИС для внедрения является сложным и многокритериальным процессом из-за следующих причин:
· высокой стоимости приобретаемого продукта (доходящей до нескольких миллионов долларов);
· большого разнообразия предлагаемых на мировом рынке КИС (свыше 500 систем класса MRP II — ERP);
· значительной длительности подготовки специалистов по внедряемому продукту (от полугода до года);
· значительной длительности предпродажного цикла (от нескольких месяцев до нескольких лет) и самого цикла внедрения (цикл внедрения КИС даже на одной производственной площадке может длиться до нескольких лет);
а также ряда других причин. Именно поэтому данную проблему – проблему правильного выбора информационной системы для предприятия – нельзя было обойти стороной.
Невозможно дать общее определение корпоративной информационной системе как набору функциональных признаков исходя из каких-либо общих требований, стандартов. Дать такое определение корпоративной информационной системе можно только применительно к конкретной компании, которая использует или собирается строить корпоративную информационную систему. В общем виде, можно дать только некоторые основные признаки корпоративной информационной системы:
§ Соответствие потребностям компании, бизнесу компании, согласованность с организацинно-финансовой структурой компании, культурой компании.
§ Интегрированность.
§ Открытость и масштабируемость.
1. В первом признаке и скрыты все функциональные признаки конкретной корпоративной информационной системы конкретной компании, они строго индивидуальны для каждой компании. Например, для одной компании корпоративная информационная система должна иметь класс не ниже ERP, а для другой –система такого класса совершенно не оптимальна, и только увеличит издержки. А если копнуть глубже, то и в понятие ERP (а уж тем более ERPII) разные компании, исходя из своих потребностей, могут вкладывать разный смысл, разные функции, разные реализации. Общими для всех компаний могут быть только функции бухгалтерского учета и заработной платы, регламентируемые внешним законодательством, все остальные –строго индивидуальны. Второй и третий признаки общие, но совершенно конкретные.
2. Корпоративная информационная система это не совокупность программ автоматизации бизнес-процессов компании (управления производством, ресурсами и компанией), это сквозная интегрированная автоматизированная система, в которой каждому отдельному модулю системы (отвечающему за свой бизнес-процесс) в реальном времени (или близком к реальному) доступна вся необходимая информация, вырабатываемая другими модулями (без дополнительного и, уж тем более, двойного ввода информации).
3. Корпоративная информационная система должна быть открытой для включения дополнительных модулей и расширения системы как по масштабам и функциям, так и по охватываемым территориям. Исходя из сказанного, корпоративной информационной системе можно дать только следующее определение: