Система классификации информации
Процесс классифицирования представляет собой процесс распределения объектов классификации в соответствии с выбранной системой классификации.
Классификация – упорядочение некоторого множества объектов (материалов, изделий, балансовых счетов, видов операций и т.д.) в соответствии с установленными признаками их сходства и различия. Признак, позволяющий распределять множество объектов на подмножества, называют основанием классификации. Процесс классифицирования представляет собой процесс распределения объектов классификации в соответствии с выбранной системой классификации.
Необходимость классификации связана:
С выявлением общих свойств информационного объекта;
- Разработкой правил и процедур обработки информации:
- Сокращением объема и времени поиска необходимой информации:
- Упрощением обработки информации.
Система классификации – совокупность правил распределения объектов множества на основании классификационных признаков и зависимости внутри признаков.
При проектировании ОИ к системам классификации объектов предъявляется ряд требований:
Полнота охвата объектов рассматриваемой области;
- Однозначность реквизитов;
- Возможность включения новых объектов.
Каждая система классификации имеет такие основные характеристики, как гибкость, емкость, глубина и заполненность
Классификация – совокупность распределения заданного множества объектов на подмножества в соответствии с установленными признаками их сходства/различия.
Классификация определяется и характеризуется ХХХХХХХ методом классификации, признаками классификации, их последовательностью, глубиной, емкостью.
Признак классификации – свойство/характеристика объекта, по которой производится классификация.
Глубина классификации – число ступеней делений.
Емкость классификации – число группировок, выделяемых при классификации.
Иерархический метод классификации – метод, при котором заданное множество делится последовательно на подчиненные подмножества.
Совокупность таких подмножеств (группировок) образует иерархичную, древовидную структуру в виде ветвящегося графа, узлами которого являются группировки.
Рис.1. Схема деления множества с помощью иерархического метода классификации.
Фасетный метод классификации (от слова фасета) – метод, при котором заданное множество объектов делится на подмножества независимо по различным признакам классификации.
Фасет представляет собой набор признаков, значения которых соответствуют конкретным характеристикам этих признаков.
Последовательность расположения фасетов называется фасетной формулой, а емкость классификации зависит от числа фактов и от количества признаков в фасете.
F1 | F2 | Fn |
Г1 = (F1, F2, …, Fn)
Г2 = (F1, F2)
ß фасета
Рис. 2. Схема классификации с использованием фасетного метода.
Одежда | |||
сезонность | Страна-произв. | Вид ткани | предназначение |
Зимняя Летняя демисезонная | Россия Китай Англия, Голландия | Шерсть Хлопок Лён | м/ж детская подростковая |
Г1 = (F1)
Г2 = Ф2, Ф3, Ф4
Системы классификации должны удовлетворять следующим требованиям:
- Иметь достаточную емкость и полноту, которые охватывают объекты ПО;
- Иметь достаточную глубину классификации;
- Должны обеспечить решение различных задач;
- Должны обеспечить возможность сопряжения с другими классификациями однородных объектов.
Кодирование – присвоение кодов классиф. группировке или объекту классификации.
Кодирование предназначено для формализованного описания наименований объектов, характеристик, группировок.
Система кодирования – совокупность методов и правил обозначения объектов заданного множества.
Системы кодирования характеризуются емкостью алфавитного кода и правилами образования кодовых группировок.
Под емкостью понимается число различающихся между собой кодовых обозначений.
Кодовой обозначение представляет собой знак (символ) или набор знаков (символов), принятых для обозначения группировок или для объекта классификации.
Алфавит – это набор различных знаков (символов), принятых для написания кодов.
Обычно при кодировании решают 2 основных задачи – это однозначно обозначение() объектов заданного множества.