Єдина система класифікації та кодування. Категорії класифікаторів

 

Після присвоєння кодів створюється класифікатор.

Класифікатор — це систематизоване зібрання однорідних найменувань та їх кодових позначень.

Єдина система класифікації та кодування — це комплекс взаємопов’язаних класифікаторів техніко-економічної інформації, пристосованих до оброблення засобами обчислювальної техніки з автоматизованою системою ведення цих класифікаторів.

Результатом робіт із класифікації та кодування є розроблення класифікаторів за типом об’єктів і категоріями.

Держстандартом допускається використання класифікаторів таких видів:

загальнодержавні (державні) класифікатори;

міжгалузеві класифікатори;

галузеві класифікатори;

класифікатори підприємств (локальні).

Наведемо перелік основних загальнодержавних та галузевих класифікаторів:

СПАТО — система позначень автономій, територій, областей;

УКФВ — український класифікатор форм власності;

КОПФГ — класифікатор організаційно-правових форм господарювання;

ЄДРПОУ — єдиний державний реєстр підприємств, організацій України;

ЗКГНГ — загальний класифікатор галузей народного господарства;

СПОДУ — система позначень органів державного управління;

УКВ — український класифікатор валют;

УКП — український класифікатор продукції;

КОВ — класифікатор одиниць виміру;

УСГК — українська стандартна галузева класифікація ;

УБК — українська бюджетна класифікація;

КВПП — класифікатор видів платників податків;

КБУ — класифікатор банківських установ;

УКОЗ — український класифікатор основних засобів;

Наведемо приклад кодових позначень:

УКУД — український класифікатор управлінських документів.

Код уніфікованої форми документа складається з 7 цифрових десяткових знаків і контрольного числа. Структура коду форми документа за УКУД:

ХХ — клас форм;

ХХ — підклас форм;

ХХХ — реєстраційний номер;

Х — контрольне число.

УКВЕД — український класифікатор видів економічної діяль­ності.

Загальне кодове позначення об’єктів КВЕД виглядає так:

ХХ — розділ;

ХХ. Х — група;

ХХ. ХХ — клас;

ХХ. ХХ. ХХ — підклас.

Кодування інформації

 

Як уже зазначалося, класифікація інформації є основою її кодування.

Кодування - це утворення і надання кодового позначення об'єктам класифікації та класифікаційним угрупованням. Умовне позначення об'єктів за допомогою знака або сукупності знаків називають кодом. Система кодування - це сукупність правил утворення коду.

Система кодування використовується для заміни назви об'єкта на умовні позначення (коди) з метою забезпечення зручної і більш ефективної обробки інформації. Для кожного коду встановлюється: алфавіт коду - система знаків, що прийнята для утворення коду (цифровий, літерний, літерно-цифровий); основа коду - кількість знаків в алфавіті коду; розряд коду - позиція знака в коді; довжина коду - кількість знаків у коді. Процедура надання об'єктові кодового позначення називається кодуванням. Залежно від того, чи передує кодуванню класифікування об'єктів, усі відомі системи кодування поділяють на реєстраційні і класифікаційні системи, кожна з цих систем використовує певні методи кодування.

Класифікаційні системи кодування призначені для надання кодів об'єктам, що попередньо систематизовані за певними класифікаційними ознаками. Розрізняють послідовне і паралельне кодування.

За алфавіт кодування прийнято латинський, довжина коду - чотири розряди. Структура коду, починаючи зі старшого розряду, така: 1-й старший розряд виділений для класифікаційної ознаки "держава" - U (Україна); 2-й - "територія" (область); 3 і 4 - "хост".

Кодування розрахункових палат у системі електронних платежів здійснюється за аналогічним принципом, з тією відмінністю, що перший (старший) розряд (буква U) заміняється на букву регіону (логічна прив'язка учасника платіжної системи до палати), третій та четвертий символи відмінні від НО і відповідають HP (розрахункова палата). Наприклад, код електронної адреси Львівської розрахункової палати - NNHP, Тернопільської - ТТНР, Чернівецької - ZZHP тощо. Кодування банківських установ, як учасників електронних платежів, здійснюється за таким принципом: першим розрядом є літера території, яка обслуговує банківську установу; другий - літера території, де розташована банківська установа; третій та четвертий знаки є унікальним ідентифікатором банківської установи в межах території розташування. Наприклад, код електронної адреси Львівської філії Трансбанку - NNKA.

Така побудова кодів регіональних палат і банків дає можливість кодувати банки, які розташовані на території одного регіону, а обслуговує їх розрахункова палата іншого регіону. Наприклад, код філії львівського банку, що розміщена в Донецькій області і обслуговується Львівською регіональною розрахунковою палатою, буде мати код NDIA.

Паралельне кодування використовується для фасетної системи класифікації. Суть методу полягає в такому: всі фасети кодуються незалежно одна від одної; для значень кожної фасети виділяється певна кількість розрядів коду (у цьому разі для всіх фасет виділено один розряд, тому що кількість значень у фасетах не перевищує числа десять). Паралельній системі кодування притаманні ті ж переваги і недоліки, що її фасетній системі класифікації.

Проведемо кодування інформації, класифікованої за домогою фасетної схеми (див. табл. 1.1). Кількість кодових угруповань визначено кількістю фасет і становить п'ять. Виберемо десяткову систему числення як алфавіт кодування, для значень фасет - один розряд, що дозволить мати довжину коду, рівну чотирьом. На відміну від послідовного кодування для ієрархічної системи класифікації в цьому методі не має значення порядок кодування фасет. У загальному вигляді код можна записати як ХХХХХ, де X - значення коду фасети. Розглянемо структуру коду, починаючи зі старшого розряду:

1-й (старший) розряд виділений для фасети "Призначення швейного виробу" і має такі значення: 1 - побутові; 2 - спортивні; 3 - відомчі; 4 - спеціальні; 2-й розряд виділений для фасети "Вид" і має такі значення: 1 - пальта; 2 - напівпальта; 3 - плащі; 4 - куртки; 5 - костюми; 6 - сорочки тощо;

3-й розряд виділений для фасети "Матеріал" і має значення: 1 - тканина; 2 - трикотаж; 3 - натуральна шкіра; 4 - штучна шкіра; 5 - натуральне хутро; 6 - штучне хутро тощо;

4-й розряд виділений для фасети "Сезон" і має значення: 1 - зимові; 2 - літні;

4-й розряд виділений для фасети "Стать" і має значення: 1 - чоловічі; 2 - жіночі; 3 - дитячі.

Прийнята система кодування дає змогу легко розшифрувати будь-який код угруповання, наприклад: 13123 - дитячі літні із тканини плащі побутові; 21211 - чоловічі зимові з трикотажу пальта спортивні. Процедура кодування полягає в наданні кожному об'єктові відповідних значень із фасет. При цьому можуть бути використані не всі фасети. Для кожного об'єкта задається конкретне групування фасет структурною формулою, в якій відображається їх порядок розташування: Ks = (Ф1, Ф2,..., Фі.,. .., Фn ). Так, для структурної формули К = [Вид (Ф2), Матеріал (Ф3), Сезон (Ф4)] отримаємо код 351 - плащі зі штучної шкіри зимові.

 

 

Способи кодування

 

На сьогоднішній день існує 2 способи кодування інформації про товар - лінійний і двовимірний.

 

Лінійний спосіб

Лінійними називаються штрих-коди, що читаються в одному напрямку (по горизонталі). У подібному коді символ представлений послідовністю знаків, збудованих в одну лінію. Лінійні символіки дозволяють кодувати невеликий об'єм інформації (до 20-30 символів, зазвичай цифр). Кількість інформації в лінійному штрих коді ніяк не впливає на висоту штрих коду (і навпаки). При одній і тій же ширині лінійного штрих коду, його висота може бути різною. Однак, чим вище штрих код, тим більша ймовірність зчитування його з першого разу.

Лінійні штрих коди бувають різних типів:

EAN - 13 EAN - 8 UPC GS1-128
Сodabar Code - 39 та ін.

Штриховий код EAN

Найбільше поширення в міжнародній практиці отримав код EAN - European Article Numbering.

У залежності від області застосування виділяють 3 групи товарних кодів EAN:

.) міжнародні, використовувані як всередині, так і за межами країни;

.) національні, використовувані в межах однієї країни, переважно для роздрібної торгівлі разновесних товарами;

.) локальні коди, використовувані тільки в системах управління конкретного підприємства.

Штриховий код EAN є загальним для всіх країн мовою raquo ;, за допомогою якого можна однозначно ідентифікувати товар на будь-якому етапі його руху від виробника до покупця. Код EAN відповідає наступним вимогам:

має міжнародну значимість;

не залежить від вимог окремих користувачів;

ідентифікує будь-яку товарну одиницю на світовому рівні за допомогою однозначного коду;

зручний за структурою для зчитування ЕОМ;

придатний для збору та обміну інформацією про товари, як у межах країни, так і в міжнародній торгівлі; зручний для споживачів при розрахунку за придбані товари.

Всі версії коду EAN мають такі загальні характеристики:

символи мають загальну прямокутну форму, утворену послідовністю темних паралельних штрихів і світлих проміжків між ними, перпендикулярних уявної лінії підстави або опорної прямої і мають світле поле з усіх боків;

світлі проміжки і темні штрихи складаються зі світлих і темних модулів однакової довжини (далі в тексті при описі символів EAN темний модуль буде представлений як 1 raquo ;, а світлий як 0 );

знаки в штрихове коді, що представляють числові розряди утворюються сім'ю модулями або світлішими. У цих знаках модулі згруповані в штрихи і кожен розряд представлений 2 темними штрихами і 2 світлими проміжками;

темний штрих або світлий проміжок можуть містити від 1 до 4 модулів;

крім знаків, що відображають цифри, є допоміжні знаки, що містять меншу кількість модулів, і використовувані як крайові і центральний знаки для позначення початку, кінця і поділу;

символ структурований таким чином, щоб він міг зчитуватися стаціонарним сканирующим пристроєм многонаправлено або ручним прочитуючим пристроєм в обох напрямках;

розмір символу може змінюватися в певних межах збільшення з урахуванням різних процесів друку;

габарити визначаються тільки для одного конкретного символу, відомого як номінальний розмір raquo ;. Межі збільшення складають від 0.8 до 2.0 номінального розміру.

Штриховий код ЕАN - 13.

Номер товару EAN/UCC - 13 має наступну структуру:

· 3 цифри - це код (префікс) Національної організації-члена EAN International;

· 6 цифр - це реєстраційний номер підприємства, присвоєний Національною організацією;

· 3 цифри - це порядковий номер продукції всередині підприємства;

· остання тринадцятий цифра - контрольне число. Воно обчислюється з попередніх дванадцяти.

б) Штриховий код ЕАN - 8

На рис. 5 показаний загальний вигляд і геометричні ідеальні розміри штрихового восьмирозрядного коду EAN - 8. Він використовується у виняткових випадках, коли, наприклад, розмір упаковки товару не дозволяє розмістити символ EAN - 13.

ЕАN - 8 складається з 8 цифр і пропусків:

Перші 1-2 - прапор країни

- 5 - Скорочення номера підприємства

- 7 - номер товару в межах асортименту

- контрольне число.

У таблиці 1 [Додаток А] представлені префікси товарних нумерацій різних країн

 

Штриховий код UPC

Штриховий код UPC - 12 (А)

UPC-A - 12-значний штрих-код фіксованої довжини для кодування числових даних. Використовується в американських роздрібних магазинах для ідентифікації товарів. Унікальні штрихові коди UPC-A розроблені UC-радою. Якщо Ви збираєтеся продавати свої товари в американських роздрібних магазинах, то швидше за все вам доведеться подбати про наявність штрих-коду UPC-A на вашої продукції.

Штриховий код UPC - 6 (Е)

UPC-E - 6-значний штрих-код фіксованої довжини для кодування числових даних. UPC-E - скорочений варіант штрих-коду UPC-A. Даний стандарт використовується для ідентифікації дрібних роздрібних товарів, розміри яких не дозволяють розмістити на них повний штрих-код UPC-A.

Двовимірний спосіб

QR-код (англ. quick response - швидкий відгук) - матричний код (двомірний штрихкод), розроблений і представлений японською компанією Denso-Wave в 1994 році.

Основна перевага QR-коду - легке розпізнавання скануючим обладнанням (в тому числі і фотокамерою мобільного телефону), що дає можливість використання в торгівлі, виробництві, логістиці. QR-коди найбільше поширені в Японії, країні, де штрих-коди користувалися такою великою популярністю, що обсяг інформації, зашифрованою в коді, незабаром перестав влаштовувати індустрію. Японці почали експериментувати з новими способами кодування невеликих обсягів інформації в графічній картинці. Вже на початку 2000 року QR-коди отримали широке поширення в Японії, їх можна було зустріти на великій кількості плакатів, упаковок і товарів.

Максимальна кількість символів, які містяться в один QR-код:

цифри - 7089;

цифри і букви (включаючи кирилицю) - 4296;

двійковий код - 2953 байт;

ієрогліфи - 1817.

В даний час QR-код широко поширений в країнах Азії (особливо в Японії), поступово розвивається в Європі та Північній Америці. Найбільше визнання він отримав серед користувачів мобільного зв'язку - встановивши програму-распознаватель, абонент може моментально заносити в свій телефон текстову інформацію, додавати контакти в адресну книгу, переходити по web-посиланнях, відправляти SMS-повідомлення і т.д.

У Японії подібні коди наносяться практично на всі товари, що продаються в магазинах, їх розміщують в рекламних буклетах і довідниках. За допомогою QR-коду навіть організовують різні конкурси та рольові ігри.

Провідні японські оператори мобільного зв'язку спільно випускають під своїм брендом мобільні телефони з вбудованою підтримкою розпізнавання QR-коду.

У Японії також QR-коди використовуються на кладовищах і містять інформацію про усопшем.коди активно використовуються музеями, а також і в туризмі. Наприклад, у Львові (Україна), об'єднання бізнесменів Туристичний рух Львова розмістило QR-коди більш ніж на 80 туристичних об'єктах. Це дозволяє індивідуальним туристу легко орієнтуватися в місті, навіть не знаючи української мови, так як QR-коди встановлені на декількох мовах.

AZTEC

В даний час найбільш поширений вид двомірного штрихкоду Aztec. У кожному символі можна виділити область мішені і область даних. Мішень являє собою набір концентричних квадратів і служить для визначення геометричного центру символу в процесі його декодування. Символ складається з двох і більше суміжних по вертикалі рядків-знаків символу штрихового коду. У двовимірних кодах можна закодувати істотно більший обсяг

Розмір коду може варіюватися від квадрата 15x15 до квадрата 151x151. Найменший може містити в собі до 13 цифр або 12 букв англійського алфавіту, а наибольший - 3 832 цифр або 3 067 букв англійського алфавіту або 1 914 байт даних. При цьому не потрібно порожнього простору навколо малюнка коду.