Методи класифікації економічної інформації
Самостійна робота № 5
Методи класифікації економічної інформації
Тема для ознайомлення.
Класифікація економічних даних
Класифікація і кодування — це дві невіддільні частини одного процесу — перекладу різноманітної економічної інформації і природної мови на формалізовану мову ЕОМ. Наведемо основні терміни й поняття, використовувані в цій галузі.
Класифікація— це поділ множини об'єктів на частини за їх подібністю або відмінністю згідно з прийнятими методами.
Під час класифікації використовуються такі поняття.
Система класифікації — сукупність методів і правил класифікації та їхній результат.
Об'єкт класифікації— елемент класифікованої множини.
Ознака класифікації— властивість або характеристика об'єкта, за якою виконується класифікація.
Значення ознаки— якісне або кількісне вираження ознаки класифікації.
Класифікаційне угруповання— частина об'єктів, яка виділена під час класифікації. Найпоширенішими є такі назви класифікаційних угруповань: клас, підклас, група, підгрупа, вид, підвид, тип.
Рівень класифікації— етап класифікації при ієрархічному методі, внаслідок якого формується сукупність класифікаційних угруповань (або результат чергового поділу об'єктів одного класифікаційного угруповання).
Глибина класифікації— кількість ступенів класифікації. Засобом вираження результатів класифікації є кодування.
Кодування— це створення і присвоєння коду класифікаційному угрупованню та об'єктові класифікації.
Код— знак або сукупність знаків, узятих для позначення класифікаційного угруповання та об'єкта класифікації.
Алфавіт коду— система знаків, узятих для створення коду.
Основа коду— кількість знаків у алфавіті коду. Розряд коду— позиція знака в коді.
Довжина коду— кількість знаків у коді без урахування пропусків.
Структура коду— умовне позначення складу та послідовності розміщення знаків у коді.
Контрольне число— розрахункове число, яке використовується для перевірки вірогідності запису коду.
Перекодування— присвоєння закодованому об'єктові нового коду.
Перекодовувальні таблиці— таблиці взаємної відповідності кодів одних і тих самих класифікаційних угруповань або об'єктів класифікації зрізних класифікаторів.
Матеріальним втіленням класифікації і кодування є класифікатор.
Класифікатор— це офіційний документ, який являє собою систематизований перелік назв і кодів класифікаційних угруповань або об'єктів класифікації.
Класифікатори можна створювати системним або локальним способом. За системного способу інформація класифікується з урахуванням вимог різних рівнів управління (підприємство, міністерство, відомство тощо), за локального — у межах одного підприємства, організації або установи.
Класифікація і кодування — невіддільний елемент створення і функціонування комп'ютерних ІС. Метою класифікації та кодування є упорядкування і взаємоузгодження різних предметів, понять, властивостей чи інших елементів інформації. Використанням кодів можна значно скоротити обсяги інформації та трудомісткість її обробки на всіх етапах технологічного процесу автоматизованої обробки даних.
Тема для опрацювання
Методи класифікації економічної інформації
Метод класифікації— це сукупність правил утворення системи класифікаційних угруповань і їх зв'язки між собою.
Розрізняють два основні методи класифікації:
1) ієрархічний;
2) фасетний.
Ієрархічний методкласифікації характеризується тим, що початкова множина об'єктів техніко-економічної інформації послідовно поділяється на угруповання (класи) першого рівня поділу, далі — на угруповання наступного рівня тощо.
Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, яку часто зображають у вигляді розгалуженого графа; вузлами цього графа є угруповання. Кожному об’єктові в цьому випадку на кожному рівні відводиться місце лише в одному класифікаційному угрупованні, тобто такі угруповання не повторюються і кожне з них поділяється лише за однією і тією ж основою класифікації.
Недоліки ієрархічного методу класифікації:
жорсткість структури, яка зумовлена фіксованістю ознак і їхньою послідовністю;
не дає змоги агрегувати об'єкти за будь-яким раніше не передбаченим довільним поєднанням ознак;
ускладнює автоматизовану обробку, оскільки утворюється нестандартний розподіл послідовності ознак.
Перераховані недоліки ієрархічного методу класифікації компенсуються фасетним (багатоаспектним) методом, за яким початкову множину об'єктів можна незалежно поділяти на класифікаційні угруповання щоразу з використанням однієї з обраних ознак.
Кожна ознака фасетної класифікації відповідає фасеті, що являє собою список значень найменованої ознаки класифікації. Наприклад, ознака "колір" містить такий список значень: "червоний", "білий", "чорний", ..., "зелений" тощо.
Отже, систему класифікації можна подати у вигляді переліку незалежних фасетів (списків), які містять значення ознак класифікації.
Вибір певного методу класифікації залежить від мети досліджень економічних даних і повинен виконуватись з урахуванням задоволення вимог усього комплексу задач управління.