Классификация и кодирование информации

Информационные системы.

Определения. Классификация. Структура

 

Автоматизированная информационная система (АИС) – взаимосвязанная совокупность средств, методов операций и персонала, используемых для сбора, обработки, хранения и выдачи информации в интересах достижения поставленной цели.

 

Информационно-поисковая система – совокупность методов и средств, предназначенных для поиска и выдачи (предоставления) документов, фактов и иных данных.

 

Фактографическая ИС – В БД системы регистрируются конкретные значения данных об объектах, процессах и явлениях реального мира.

 

Документальная ИС – в БД системы содержится совокупность неструктурированных текстовых документов и графических объектов, снабженная формализованным аппаратом поиска.

 

Структура ИС – совокупность отдельных ее частей, выделенных по какому-либо признаку (подсистем).

 

Функциональная часть ИС – совокупность подсистем, выделенных по функциональному признаку, определяющему назначение подсистемы и ее основные цели, задачи, функции.

 

Обеспечивающая часть ИС – пять основных видов обеспечения:

информационное обеспечение – совокупность всех проектных решений и документов (система классификации и кодирования информации; унифицированная система документации; схема информационных потоков; методология и методика построения баз данных и т.п.) по объемам, размещению и формам существования информации, применяемой в ИС.

лингвистическое обеспечение – совокупность языковых средств(ИПЯ) и правил для общения пользователей ИС с программным техническим и информационным обеспечением;

техническое обеспечение – комплекс технических средств, предназначенных для работы ИС, и документация на эти средства и технологические процессы;

математическое и программное обеспечение – совокупность математических методов, моделей, алгоритмов и программ для реализации целей и задач ИС;

организационное обеспечение – совокупность методов и средств, регламентирующих взаимодействие персонала с техническими средствами и между собой в процессе разработки и эксплуатации ИС;

правовое обеспечение – совокупность правовых норм, определяющая создание, юридический статус и эксплуатацию ИС. Регламентация и порядок получения, преобразования и использования информации.

 

Требования к ИС– параметры, которым должна соответствовать создаваемая ИС.

Жизненный цикл ИС (ЖЦ ИС)– период времени с момента принятия решения о создании ИС до ее полного изъятия из эксплуатации.

 

Модель ЖЦ ИС– структура, определяющая последовательность выполнения и взаимосвязи процессов , действий и задач на протяжении ЖЦ (каскадная и спиральная модели).

 

Стадии ЖЦ ИС – 1.Формирование требований к ИС.

2.Проектирование.

3.Реализация.

4.Тестирование.

5.Ввод в действие.

6.Эксплуатация и сопровождение.

 

Классификация и кодирование информации

Классификация– система распределения (группировки) объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

 

Классификационный признак (значение классификационного признака) – позволяет установить сходство или различие объектов.

 

Иерархическая система классификации – исходное множество элементов делится в зависимости от классификационного признака на классы, каждый класс в соответствии со своим признаком на подклассы и т.д.

 

Фасетная (facet (фр.) – рамка) система классификации – каждый фасет содержит совокупность однородных значений данного классификационного признака.

 

Дескрипторная система классификации (словарь дескрипторов) – совокупность ключевых слов или словосочетаний, отобранных в результате процедуры нормализации (выбор наиболее употребительных синонимов, установление синонимических, родо-видовых и ассоциативных связей между дескрипторами).

 

Кодирование информации – совокупность правил кодового обозначения объектов.

 

Код – совокупность букв, цифр и иных символов, характеризующаяся заданной структурой и длиной.

 

Классификатор (кодификатор, справочник, словарь) – совокупность кодовых обозначений объектов.

 

Предпроектное обследование объекта автоматизации(Пр.Об.)

Методы и результаты

Предпроектное обследование – детальные системные исследования предметной области как объекта автоматизации, для определения целей и назначения ИС, ее функциональной структуры, эффективности, этапов разработки и внедрения.

 

Предметная область (Пр.Об.) – сегмент реального мира , выделенный и описанный в соответствии с поставленными целями и задачами АИС.

 

Методы обследования (Пр.Об.) – общенаучные и специальные исследовательские методы по сбору материалов (беседы, консультации, интервью; фото- и видеосъемка; отбор и анализ предоставленного материала и т.п.); системный анализ предметной области.

 

Системный анализ - совокупность методов и средств исследования сложных, многоуровневых и многокомпонентных систем, объектов, процессов, опирающихся на комплексный подход, учет взаимосвязей и взаимодействий между элементами системы.

 

Системный анализ предметной области (Пр.Об.) - совокупность методов и средств детального исследования Пр.Об. для определения всех параметров проектируемой информационной системы (объектно-ориентированный и функционально-ориентированный анализ; моделирование и т.д.)

 

 

Описание объекта автоматизации – совокупность сведений обо всех явлениях, процессах и о фактах, выделенных с позиции автоматизации изучаемой предметной области; описание классов объектов и отношений между выделенными объектами; описание всех возможных воздействий на объекты и отношения в результате осуществления деятельности; объектная и функциональная модели предметной области; функциональная структура ИС.

 

Функция ИС – совокупность действий, направленных на достижение цели системы.

 

Функциональная структура ИС – совокупность функциональных подсистем, реализующих задачи системы.

 

Задача ИС – проблема, требующая разрешения, средствами ИС.

 

Функциональная задача – функция или часть функции. ИС, представлющая собой формализованную совокупность автоматических действий, выполнение которых приводит к результату заданного вида.

 

Постановка задачи – точная формулировка решения задачи на компьютере с описанием входной и выходной информации.

 

База данных (БД)

Данные– зафиксированная на каком-либо носителе информация.

 

База данных – совокупность данных о конкретных объектах реального мира в какой-либо предметной области или разделе предметной области.

 

Структурирование информации – введение соглашений о способах представления и организации данных.

 

Электронная база данных – поименованная совокупность структурированных данных, относящихся к определенной предметной области.

Операция – обработка и преобразование данных (сбор, формализация, фильтрация, сортировка, архивация, транспортировка, защита и т.д.)

Метод – реализация операции над объектами данного класса.

Структурные элементы БД:

поле (столбец) – структурный элемент записи (строки) - соответствует единице информации – реквизиту и использует характеристики: имя, длина; тип (текстовый, Мемо, числовой, дата/время, денежный, счетчик, логический, OLE, гиперссылка и др.);

запись (строка) – набор полей.

Файл – объединение нескольких записей с общими структурными элементами.

 

Формат – структура, содержание и кодирование информации в записи.

 

Требования к БД:

минимальная избыточность – устранение вредной (неконтролируемой) и сведение к минимуму полезной (контролируемой) избыточности;

целостность данных – поддержка правильности данных;

безопасность и секретность – защита данных от сбоев и несанкционированного доступа;

независимость данных – возможность изменения структуры БД без изменения прикладных программ пользователя;

производительность – время ответа ИС, использующей данную БД, на запросы пользователей;

гибкость и способность к расширению – способность БД к наращиванию данных, приложений и функций.

 

Централизованная БД – данные хранятся в памяти одной вычислительной системы. Архитектуры систем централизованных БД с сетевым доступом: файл-сервер, клиент-сервер.

 

Распределенная БД – состоит из нескольких частей, хранимых в различных ЭВМ вычислительной сети.

 

Система управления базами данных (СУБД) – комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.

 

Проектирование БД

Проектирование БД – процесс разработки структуры БД в соответствии с требованиями пользователей.

Объект (сущность) – нечто существующее и различимое, для которого существуют название и способ отличить подобный объект от другого.

 

Набор объектов – совокупность (группа) однородных объектов. Конкретный объект в группе объектов – экземпляр объекта.

 

Информационный объект – описание некоторой сущности (реального объекта, явления, процесса, события) в виде совокупности логически связанных реквизитов.

 

Концептуальный уровень проектирования БД – процесс исследования предметной области и анализа поставленной задачи. Результат – концептуальная модель данных, составленная в терминах объектов.

 

Логический уровень проектирования БД – построение информационно-логической (инфологической) модели предметной области в виде совокупности информационных объектов и их структурных связей. Результат – словарь данных и схема данных в графической форме.

 

Физический уровень проектирования БД – процесс реализации БД программными и языковыми средствами.

 

Атрибут (реквизит*, атрибутивное свойство*, домен атрибута*, данное*, элемент данных*, столбец**, поле**) – показатель, характеризующий объект и принимающий для конкретного объекта текстовое, числовое или иное значение.

 

Модель данных – совокупность структур данных и операций их обработки.

 

Иерархическая модель данных – структура данных, в которой каждый порожденный элемент имеет один порождающий элемент.

 

Сетевая модель данных – структура данных, в которой каждый порожденный элемент имеет более одного порождающего элемента.

 

Реляционная (relation (фр.) – отношение) модель данных – организация данных в виде простых двумерных массивов (таблиц), связанных отношениями типа один к одному (1 : 1); один ко многим (1 : М); многие ко многим (М : М); многие к одному (М : !).

 

Первичный ключ (ключевое поле) – значение поля (или совокупности полей) однозначно определяет соответствующую запись.

Вторичный ключ – значение поля может быть неуникальным.

Простой ключ – значение одного поля.

Составной ключ – значение нескольких полей.

Повторяющиеся группы – совокупность однотипных данных, характеризующих экземпляр объекта.

Нормализация отношений – аппарат ограничений на формирование таблиц, который позволяет устранить дублирование, обеспечивает непротиворечивость данных и уменьшает трудозатраты на ведение (ввод, корректировка) БД.

Первая нормальная форма – отношения нормализованы или приведены к первой нормальной форме, если все его атрибуты (поля) простые и неделимые.

Вторая нормальная форма – отношение находится в первой нормальной форме и каждый неключевой атрибут (поле) функционально полно зависит от первичного ключа и от каждого из значений, входящих в него, если ключ составной.

Третья нормальная форма – отношение находится во второй нормальной форме и значения каждого их неключевых атрибутов (полей) функционально полно зависит от первичного ключа и не зависит от значения других неключевых полей.

 


 

 

 

* Терминология баз данных

 

** Терминология современных СУБД