Метод класифікації це сукупність правил створення системи класифікаційних угруповань і їх взаємозв'язки

 

Розрізняють два основні методи класифікації: ієрархічний і фасетний.

 

Ієрархічний метод класифікації. Цей метод характеризується тим, що початкова множина об'єктів інформації послідовно поділяється на угруповання (класи) першого рівня поділу, далі - на угруповання наступного рівня, і т.д. Між створеними групами встановлюється певна ієрархія (рис. 3). При цьому кожна підгрупа належить лише одній групі (вищій за ієрархією).

 

 

 

Рис. 3 Ієрархічна схема класифікації

 

Ієрархічний метод класифікації відрізняється кількістю рівнів (ступенів) класифікації, глибиною, ємністю і гнучкістю. Кількість рівнів визначає глибину класифікації, яка залежить від необхідності конкретизації угруповань і кількості


ознак, які беруть участь у класифікації. Від глибини класифікації та кількості створених на кожному рівні угруповань залежить ємність.

 

В ієрархічній системі класифікації на будь-якому рівні підмножини елементів не повинні перетинатися. Сума елементів підмножин кожного рівня дорівнює кількості елементів усієї множини, що беруть участь у класифікації.

 

Позитивні сторони застосування ієрархічного методу класифікації:

 

· пристосованістю до обробки;

· звичність;

· велика інформативність кодів, які мають змістове навантаження. Недоліки:

· жорсткість структури, яка зумовлена фіксованістю ознак і їхньою послідовністю. Через це зміна хоча б однієї ознаки приводить до перерозподілу класифікаційних угруповань. Тому в класифікаторах, побудованих за ієрархічним методом, мають передбачатися значні резервні ємності.

· не дає змоги агрегувати об'єкти за будь-яким раніше не передбаченим довільним поєднанням ознак.

 

Приклад ієрархічної системи класифікації студентів:

 

· код вузу (001: Європейський університет, 002: університет ім. І. Франка, 003: НУ "Львівська політехніка",...);

· код кафедри (01: економічна, 02: математична, 03: юридична,...);

· код спеціальності (01: інформаційні управляючі системи та технології, 02: економіка підприємства, 03: прикладна математика, 04: юриспруденція,...);

· код курсу (1: перший, 2: другий, 3: третій,...);

· код групи (1: перша, 2: друга, 3: третя,...);

· код студента (відповідно до порядкового номера у групі).

 

Наприклад, повний код студента Антоненка А.А. має вигляд 001.02.01.01.01.01, побудований за наступною схемою:

 

Рис.4. Схема формування коду студента

 

Фасетний метод класифікації. За цим методом початкова множина об'єктів може поділятися на незалежні класифікаційні угруповання з використанням однієї з обраних ознак. Система класифікації може бути подана переліком незалежних фасетів (списків), які містять значення ознак класифікації.

 

Кожна ознака фасетної класифікації відповідає фасеті, що являє собою список значень найменованої ознаки класифікації. Наприклад, ознака "колір" містить такий список значень: червоний, білий, чорний, блакитний ... зелений; ознака - "професія" містить такий список значень: апаратник, автослюсар, столяр, токар та ін.

 

 

Рис. 5. Фасетна класифікації

 

Приклад фасетної класифікації студентів: прізвище та ініціали, форма навчання (стаціонар, заочне, ПДО), спеціальність (економіка підприємства, фінанси, облік і аудит, математика, правознавство), початкова освіта (середня, середня спеціальна, вища).

 

За фасетним методом класифікації код студента Петренка М. П., що навчається на стаціонарі за спеціальністю "фінанси" з початковою середньою освітою матиме наступний вигляд: Петренко М. П., стаціонар, фінанси, середня.

 

Переваги фасетного методу класифікації:

 

· гнучкість структури;

· можливість включення нових фасет і виключення старих. Недоліки:

· нетрадиційність;

· складність у випадку обробки даних.

 

Для фасетної класифікації сума елементів підмножин може бути більшою за кількість елементів усієї множини, що беруть участь у класифікації. Для даної класифікації важливим є неповторюваність ознак.

 

Змішаний метод класифікації передбачає використання обох попередніх.