Методи класифікації економічної інформації

Самостійна робота № 5

Методи класифікації економічної інформації

 

Тема для ознайомлення.

Класифікація економічних даних

Класифікація і кодування — це дві невіддільні частини од­ного процесу — перекладу різноманітної економічної інформації і природної мови на формалізовану мову ЕОМ. Наведемо основні терміни й поняття, використовувані в цій галузі.

Класифікація— це поділ множини об'єктів на частини за їх подібністю або відмінністю згідно з прийнятими методами.

Під час класифікації використовуються такі поняття.

Система класифікації — сукупність методів і правил класи­фікації та їхній результат.

Об'єкт класифікації— елемент класифікованої множини.

Ознака класифікації— властивість або характеристика об'єк­та, за якою виконується класифікація.

Значення ознаки— якісне або кількісне вираження ознаки класифікації.

Класифікаційне угруповання— частина об'єктів, яка виді­лена під час класифікації. Найпоширенішими є такі назви класифікаційних угруповань: клас, підклас, група, підгрупа, вид, підвид, тип.

Рівень класифікації— етап класифікації при ієрархічному методі, внаслідок якого формується сукупність класифікацій­них угруповань (або результат чергового поділу об'єктів одного класифікаційного угруповання).

Глибина класифікації— кількість ступенів класифікації. Засобом вираження результатів класифікації є кодування.

Кодування— це створення і присвоєння коду класифікацій­ному угрупованню та об'єктові класифікації.

Код— знак або сукупність знаків, узятих для позначення класифікаційного угруповання та об'єкта класифікації.

Алфавіт коду— система знаків, узятих для створення коду.

Основа коду— кількість знаків у алфавіті коду. Розряд коду— позиція знака в коді.

Довжина коду— кількість знаків у коді без урахування пропусків.

Структура коду— умовне позначення складу та послідов­ності розміщення знаків у коді.

Контрольне число— розрахункове число, яке використо­вується для перевірки вірогідності запису коду.

Перекодування— присвоєння закодованому об'єктові ново­го коду.

Перекодовувальні таблиці— таблиці взаємної відповідності кодів одних і тих самих класифікаційних угруповань або об'єктів класифікації зрізних класифікаторів.

Матеріальним втіленням класифікації і кодування є класи­фікатор.

Класифікатор— це офіційний документ, який являє собою систематизований перелік назв і кодів класифікаційних угру­повань або об'єктів класифікації.

Класифікатори можна створювати системним або локальним способом. За системного способу інформація класифікується з урахуванням вимог різних рівнів управління (підприємство, міністерство, відомство тощо), за локального — у межах одного підприємства, організації або установи.

Класифікація і кодування — невіддільний елемент створен­ня і функціонування комп'ютерних ІС. Метою класифікації та кодування є упорядкування і взаємоузгодження різних пред­метів, понять, властивостей чи інших елементів інформації. Використанням кодів можна значно скоротити обсяги інфор­мації та трудомісткість її обробки на всіх етапах технологічно­го процесу автоматизованої обробки даних.

 

Тема для опрацювання

Методи класифікації економічної інформації

Метод класифікації— це сукупність правил утворення системи класифікаційних угруповань і їх зв'язки між собою.

Розрізняють два основні методи класифікації:

1) ієрархічний;

2) фасетний.

Ієрархічний методкласифікації характеризується тим, що початкова множина об'єктів техніко-економічної інформації послідовно поділяється на угруповання (класи) першого рівня поділу, далі — на угруповання наступного рівня тощо.

Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, яку часто зображають у вигляді розгалуженого графа; вузлами цього графа є угруповання. Кожному об’єктові в цьому випадку на кожному рівні відводиться місце лише в одному класифікаційному угрупованні, тобто такі угруповання не повторюються і кожне з них поділяється лише за однією і тією ж основою класифікації.

Недоліки ієрархічного методу класифікації:

жорсткість структури, яка зумовлена фіксованістю ознак і їхньою послідовністю;

не дає змоги агрегувати об'єкти за будь-яким раніше не передбаченим довільним поєднанням ознак;

ускладнює автоматизовану обробку, оскільки утворюєть­ся нестандартний розподіл послідовності ознак.

Перераховані недоліки ієрархічного методу класифікації компенсуються фасетним (багатоаспектним) методом, за яким початкову множину об'єктів можна незалежно поділяти на класифікаційні угруповання щоразу з використанням однієї з обраних ознак.

Кожна ознака фасетної класифікації відповідає фасеті, що являє собою список значень найменованої ознаки класифікації. Наприклад, ознака "колір" містить такий список значень: "чер­воний", "білий", "чорний", ..., "зелений" тощо.

Отже, систему класифікації можна подати у вигляді пере­ліку незалежних фасетів (списків), які містять значення ознак класифікації.

Вибір певного методу класифікації залежить від мети досліджень економічних даних і повинен виконуватись з ураху­ванням задоволення вимог усього комплексу задач управління.