Системы классификации

Глава 11. Классификация и кодирование технико-экономической информации ЭИС

Содержание

11.1. Основные функции СКК

11.2. Системы классификации

11.3. Системы кодирования

11.3.1. Кодирование

11.3.2. Классификационные коды

11.3.3. Идентификационные коды

11.3.4. Смешанные коды

11.4. Сфера действия СКК ТЭИ

В главе использована "Тема 5. Классификация и кодирование технико-экономической информации ЭИС" из материалов неизвестного автора "Теория экономических информационных систем", собранных в архивный файл 1kr_teis.rar.

Основные функции СКК

Система классификации и кодирования (СКК) технико-экономической информации ЭИС включает:

l классификаторы технико-экономической и социальной информации;

l нормативные и методические документы, регламентирующие разработку, ведение и применение классификаторов.

Объектами классификации и кодирования в ЕССК являются технико-экономические и социальные объекты и их свойства, используемые в различных видах экономической деятельности и при межотраслевом обмене информацией. При разработке проектов правовых актов, создании и эксплуатации информационных систем и ресурсов обязательно применение классификаторов в целях создания условий сопоставимости экономико-статистических данных и совместимости информационных систем и ресурсов.

Классификация — разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами классификации. Объект классификации — элемент классифицируемого множества. Кодирование — процесс и результат присвоения условных обозначений.

Основными функциями СКК являются:

l создание условий для формирования единого информационного пространства;

l систематизация информации по единым классификационным правилам и их использование при прогнозировании социально-экономического развития, ведении учета и отчетности;

l обеспечение совместимости информационных ресурсов и систем;

l обеспечение обмена информационными ресурсами и согласованного информационного взаимодействия ИС.

Системы классификации

Признак классификации — свойство или характеристика объекта классификации, по которому проводится классификация.

Метод классификации — совокупность правил и результат распределения заданного множества объектов на подмножества — классификационные группировки в соответствии с признаками сходства или различия. В качестве объектов классификации выступают различные номенклатуры — материалы, товары, подразделения и т.п. Эти номенклатуры требуют описания как их свойств, так и идентификации отдельных представителей.

Различают два метода классификации:

l иерархический метод;

l фасетный метод.

Иерархический метод устанавливает отношение подчинения между различными группировками. Последовательно детализируются качественные свойства объектов множеств: класс, подкласс, группа, подгруппа, вид и т.д. Ступень классификации — этап классификации, результатом которого является совокупность классификационных группировок.

Классифицируемое множество объектов по некоторому основанию деления — отдельному признаку классификации или их совокупности делится на подмножества.

Рисунок 11.1. Иерархический метод

 

На основании признака классификации (s1) исходное множество М разбито на подмножества: {1}, {2}, … {N}. Для подмножества {1} может быть выбран другой классификационный признак — (s2). В результате подмножество {1} разбивается на совокупность подмножеств {11}, {1m}. Для подмножества {2} выбран классификационный признак — (s3), подмножество {2}разбивается на совокупность подмножеств {21}, {22}, … {2k}и т.д.

При этом выполняются следующие условия:

l объединение подмножеств классификационных группировок одного уровня иерархии дает исходное множество объектов;

l пересечение классификационных группировок одного уровня иерархии дает нулевое подмножество, то есть:

Рисунок 11.2. Условия иерархического метода

 

Классификационные признаки для иерархического метода применяются последовательно в каждой иерархической ветви, при этом они могут отличаться друг от друга. Структура иерархической системы классификации жесткая и не подлежит изменению.

Основные достоинства иерархической системы классификации:

l традиционность и естественность;

l большая информационная емкость. Если число уровней иерархии — N, на каждом уровне отдельный признак классификации принимает Kn значений, то максимально возможное число классификационных группировок на последнем уровне составляет величину — H:

Рисунок 11.3. Число классификационных группировок

 

Например, число уровней иерархии — 3, для каждого уровня максимальное количество значений признаков классификации — 10, тогда, общее число классификационных группировок — 1000 (103).

l возможность использования различных наборов классификационных признаков для каждой иерархической ветви классификации.

Недостатками иерархической системы классификации являются:

1. Невозможность внесения изменений в классификатор (добавление или удаление классификационных признаков, изменение последовательности их применения) после его создания.

2. Трудоемкий поиск информации по произвольному сочетанию признаков классификации.

Фасетный метод классификации предполагает, что исходное множество объектов разбивается на подмножества группировок по независимым между собой признакам классификации — фасетам).

Фасет — набор значений отдельного признака классификации, все фасеты взаимно независимы.

Каждый объект одновременно имеет классификационные признаки из различных фасетов, а классификационные группировки создаются динамически путем задания фасетной формулы — последовательности фасет и значений классификационных признаков выбранных фасетов.

Рисунок 11.4. Фасетная формула

 

 

Например, группировка 1 создана на основании значений фасета Ф1, группировка 2 — на основании значений фасетов Ф3 и Фn и т.д.

Если общее число фасетов N и для фасета имеется Kn значений признаков, то общая емкость фасетной системы классификации соответствует величине H:

Рисунок 11.5. Емкость фасетной системы

 

 

Таким образом, имеет место информационная избыточность группировок, в ряде случаев не возможных по смыслу. Этот метод классификации наиболее эффективен для машинной обработки данных, при использовании технологии БД и языков запросов высокого уровня.