Єдина система класифікації та кодування. Категорії класифікаторів
Після присвоєння кодів створюється класифікатор.
Класифікатор — це систематизоване зібрання однорідних найменувань та їх кодових позначень.
Єдина система класифікації та кодування — це комплекс взаємопов’язаних класифікаторів техніко-економічної інформації, пристосованих до оброблення засобами обчислювальної техніки з автоматизованою системою ведення цих класифікаторів.
Результатом робіт із класифікації та кодування є розроблення класифікаторів за типом об’єктів і категоріями.
Держстандартом допускається використання класифікаторів таких видів:
загальнодержавні (державні) класифікатори;
міжгалузеві класифікатори;
галузеві класифікатори;
класифікатори підприємств (локальні).
Наведемо перелік основних загальнодержавних та галузевих класифікаторів:
СПАТО — система позначень автономій, територій, областей;
УКФВ — український класифікатор форм власності;
КОПФГ — класифікатор організаційно-правових форм господарювання;
ЄДРПОУ — єдиний державний реєстр підприємств, організацій України;
ЗКГНГ — загальний класифікатор галузей народного господарства;
СПОДУ — система позначень органів державного управління;
УКВ — український класифікатор валют;
УКП — український класифікатор продукції;
КОВ — класифікатор одиниць виміру;
УСГК — українська стандартна галузева класифікація ;
УБК — українська бюджетна класифікація;
КВПП — класифікатор видів платників податків;
КБУ — класифікатор банківських установ;
УКОЗ — український класифікатор основних засобів;
Наведемо приклад кодових позначень:
УКУД — український класифікатор управлінських документів.
Код уніфікованої форми документа складається з 7 цифрових десяткових знаків і контрольного числа. Структура коду форми документа за УКУД:
ХХ — клас форм;
ХХ — підклас форм;
ХХХ — реєстраційний номер;
Х — контрольне число.
УКВЕД — український класифікатор видів економічної діяльності.
Загальне кодове позначення об’єктів КВЕД виглядає так:
ХХ — розділ;
ХХ. Х — група;
ХХ. ХХ — клас;
ХХ. ХХ. ХХ — підклас.
Кодування інформації
Як уже зазначалося, класифікація інформації є основою її кодування.
Кодування - це утворення і надання кодового позначення об'єктам класифікації та класифікаційним угрупованням. Умовне позначення об'єктів за допомогою знака або сукупності знаків називають кодом. Система кодування - це сукупність правил утворення коду.
Система кодування використовується для заміни назви об'єкта на умовні позначення (коди) з метою забезпечення зручної і більш ефективної обробки інформації. Для кожного коду встановлюється: алфавіт коду - система знаків, що прийнята для утворення коду (цифровий, літерний, літерно-цифровий); основа коду - кількість знаків в алфавіті коду; розряд коду - позиція знака в коді; довжина коду - кількість знаків у коді. Процедура надання об'єктові кодового позначення називається кодуванням. Залежно від того, чи передує кодуванню класифікування об'єктів, усі відомі системи кодування поділяють на реєстраційні і класифікаційні системи, кожна з цих систем використовує певні методи кодування.
Класифікаційні системи кодування призначені для надання кодів об'єктам, що попередньо систематизовані за певними класифікаційними ознаками. Розрізняють послідовне і паралельне кодування.
За алфавіт кодування прийнято латинський, довжина коду - чотири розряди. Структура коду, починаючи зі старшого розряду, така: 1-й старший розряд виділений для класифікаційної ознаки "держава" - U (Україна); 2-й - "територія" (область); 3 і 4 - "хост".
Кодування розрахункових палат у системі електронних платежів здійснюється за аналогічним принципом, з тією відмінністю, що перший (старший) розряд (буква U) заміняється на букву регіону (логічна прив'язка учасника платіжної системи до палати), третій та четвертий символи відмінні від НО і відповідають HP (розрахункова палата). Наприклад, код електронної адреси Львівської розрахункової палати - NNHP, Тернопільської - ТТНР, Чернівецької - ZZHP тощо. Кодування банківських установ, як учасників електронних платежів, здійснюється за таким принципом: першим розрядом є літера території, яка обслуговує банківську установу; другий - літера території, де розташована банківська установа; третій та четвертий знаки є унікальним ідентифікатором банківської установи в межах території розташування. Наприклад, код електронної адреси Львівської філії Трансбанку - NNKA.
Така побудова кодів регіональних палат і банків дає можливість кодувати банки, які розташовані на території одного регіону, а обслуговує їх розрахункова палата іншого регіону. Наприклад, код філії львівського банку, що розміщена в Донецькій області і обслуговується Львівською регіональною розрахунковою палатою, буде мати код NDIA.
Паралельне кодування використовується для фасетної системи класифікації. Суть методу полягає в такому: всі фасети кодуються незалежно одна від одної; для значень кожної фасети виділяється певна кількість розрядів коду (у цьому разі для всіх фасет виділено один розряд, тому що кількість значень у фасетах не перевищує числа десять). Паралельній системі кодування притаманні ті ж переваги і недоліки, що її фасетній системі класифікації.
Проведемо кодування інформації, класифікованої за домогою фасетної схеми (див. табл. 1.1). Кількість кодових угруповань визначено кількістю фасет і становить п'ять. Виберемо десяткову систему числення як алфавіт кодування, для значень фасет - один розряд, що дозволить мати довжину коду, рівну чотирьом. На відміну від послідовного кодування для ієрархічної системи класифікації в цьому методі не має значення порядок кодування фасет. У загальному вигляді код можна записати як ХХХХХ, де X - значення коду фасети. Розглянемо структуру коду, починаючи зі старшого розряду:
1-й (старший) розряд виділений для фасети "Призначення швейного виробу" і має такі значення: 1 - побутові; 2 - спортивні; 3 - відомчі; 4 - спеціальні; 2-й розряд виділений для фасети "Вид" і має такі значення: 1 - пальта; 2 - напівпальта; 3 - плащі; 4 - куртки; 5 - костюми; 6 - сорочки тощо;
3-й розряд виділений для фасети "Матеріал" і має значення: 1 - тканина; 2 - трикотаж; 3 - натуральна шкіра; 4 - штучна шкіра; 5 - натуральне хутро; 6 - штучне хутро тощо;
4-й розряд виділений для фасети "Сезон" і має значення: 1 - зимові; 2 - літні;
4-й розряд виділений для фасети "Стать" і має значення: 1 - чоловічі; 2 - жіночі; 3 - дитячі.
Прийнята система кодування дає змогу легко розшифрувати будь-який код угруповання, наприклад: 13123 - дитячі літні із тканини плащі побутові; 21211 - чоловічі зимові з трикотажу пальта спортивні. Процедура кодування полягає в наданні кожному об'єктові відповідних значень із фасет. При цьому можуть бути використані не всі фасети. Для кожного об'єкта задається конкретне групування фасет структурною формулою, в якій відображається їх порядок розташування: Ks = (Ф1, Ф2,..., Фі.,. .., Фn ). Так, для структурної формули К = [Вид (Ф2), Матеріал (Ф3), Сезон (Ф4)] отримаємо код 351 - плащі зі штучної шкіри зимові.
Способи кодування
На сьогоднішній день існує 2 способи кодування інформації про товар - лінійний і двовимірний.
Лінійний спосіб
Лінійними називаються штрих-коди, що читаються в одному напрямку (по горизонталі). У подібному коді символ представлений послідовністю знаків, збудованих в одну лінію. Лінійні символіки дозволяють кодувати невеликий об'єм інформації (до 20-30 символів, зазвичай цифр). Кількість інформації в лінійному штрих коді ніяк не впливає на висоту штрих коду (і навпаки). При одній і тій же ширині лінійного штрих коду, його висота може бути різною. Однак, чим вище штрих код, тим більша ймовірність зчитування його з першого разу.
Лінійні штрих коди бувають різних типів:
EAN - 13 EAN - 8 UPC GS1-128
Сodabar Code - 39 та ін.
Штриховий код EAN
Найбільше поширення в міжнародній практиці отримав код EAN - European Article Numbering.
У залежності від області застосування виділяють 3 групи товарних кодів EAN:
.) міжнародні, використовувані як всередині, так і за межами країни;
.) національні, використовувані в межах однієї країни, переважно для роздрібної торгівлі разновесних товарами;
.) локальні коди, використовувані тільки в системах управління конкретного підприємства.
Штриховий код EAN є загальним для всіх країн мовою raquo ;, за допомогою якого можна однозначно ідентифікувати товар на будь-якому етапі його руху від виробника до покупця. Код EAN відповідає наступним вимогам:
має міжнародну значимість;
не залежить від вимог окремих користувачів;
ідентифікує будь-яку товарну одиницю на світовому рівні за допомогою однозначного коду;
зручний за структурою для зчитування ЕОМ;
придатний для збору та обміну інформацією про товари, як у межах країни, так і в міжнародній торгівлі; зручний для споживачів при розрахунку за придбані товари.
Всі версії коду EAN мають такі загальні характеристики:
символи мають загальну прямокутну форму, утворену послідовністю темних паралельних штрихів і світлих проміжків між ними, перпендикулярних уявної лінії підстави або опорної прямої і мають світле поле з усіх боків;
світлі проміжки і темні штрихи складаються зі світлих і темних модулів однакової довжини (далі в тексті при описі символів EAN темний модуль буде представлений як 1 raquo ;, а світлий як 0 );
знаки в штрихове коді, що представляють числові розряди утворюються сім'ю модулями або світлішими. У цих знаках модулі згруповані в штрихи і кожен розряд представлений 2 темними штрихами і 2 світлими проміжками;
темний штрих або світлий проміжок можуть містити від 1 до 4 модулів;
крім знаків, що відображають цифри, є допоміжні знаки, що містять меншу кількість модулів, і використовувані як крайові і центральний знаки для позначення початку, кінця і поділу;
символ структурований таким чином, щоб він міг зчитуватися стаціонарним сканирующим пристроєм многонаправлено або ручним прочитуючим пристроєм в обох напрямках;
розмір символу може змінюватися в певних межах збільшення з урахуванням різних процесів друку;
габарити визначаються тільки для одного конкретного символу, відомого як номінальний розмір raquo ;. Межі збільшення складають від 0.8 до 2.0 номінального розміру.
Штриховий код ЕАN - 13.
Номер товару EAN/UCC - 13 має наступну структуру:
· 3 цифри - це код (префікс) Національної організації-члена EAN International;
· 6 цифр - це реєстраційний номер підприємства, присвоєний Національною організацією;
· 3 цифри - це порядковий номер продукції всередині підприємства;
· остання тринадцятий цифра - контрольне число. Воно обчислюється з попередніх дванадцяти.
б) Штриховий код ЕАN - 8
На рис. 5 показаний загальний вигляд і геометричні ідеальні розміри штрихового восьмирозрядного коду EAN - 8. Він використовується у виняткових випадках, коли, наприклад, розмір упаковки товару не дозволяє розмістити символ EAN - 13.
ЕАN - 8 складається з 8 цифр і пропусків:
Перші 1-2 - прапор країни
- 5 - Скорочення номера підприємства
- 7 - номер товару в межах асортименту
- контрольне число.
У таблиці 1 [Додаток А] представлені префікси товарних нумерацій різних країн
Штриховий код UPC
Штриховий код UPC - 12 (А)
UPC-A - 12-значний штрих-код фіксованої довжини для кодування числових даних. Використовується в американських роздрібних магазинах для ідентифікації товарів. Унікальні штрихові коди UPC-A розроблені UC-радою. Якщо Ви збираєтеся продавати свої товари в американських роздрібних магазинах, то швидше за все вам доведеться подбати про наявність штрих-коду UPC-A на вашої продукції.
Штриховий код UPC - 6 (Е)
UPC-E - 6-значний штрих-код фіксованої довжини для кодування числових даних. UPC-E - скорочений варіант штрих-коду UPC-A. Даний стандарт використовується для ідентифікації дрібних роздрібних товарів, розміри яких не дозволяють розмістити на них повний штрих-код UPC-A.
Двовимірний спосіб
QR-код (англ. quick response - швидкий відгук) - матричний код (двомірний штрихкод), розроблений і представлений японською компанією Denso-Wave в 1994 році.
Основна перевага QR-коду - легке розпізнавання скануючим обладнанням (в тому числі і фотокамерою мобільного телефону), що дає можливість використання в торгівлі, виробництві, логістиці. QR-коди найбільше поширені в Японії, країні, де штрих-коди користувалися такою великою популярністю, що обсяг інформації, зашифрованою в коді, незабаром перестав влаштовувати індустрію. Японці почали експериментувати з новими способами кодування невеликих обсягів інформації в графічній картинці. Вже на початку 2000 року QR-коди отримали широке поширення в Японії, їх можна було зустріти на великій кількості плакатів, упаковок і товарів.
Максимальна кількість символів, які містяться в один QR-код:
цифри - 7089;
цифри і букви (включаючи кирилицю) - 4296;
двійковий код - 2953 байт;
ієрогліфи - 1817.
В даний час QR-код широко поширений в країнах Азії (особливо в Японії), поступово розвивається в Європі та Північній Америці. Найбільше визнання він отримав серед користувачів мобільного зв'язку - встановивши програму-распознаватель, абонент може моментально заносити в свій телефон текстову інформацію, додавати контакти в адресну книгу, переходити по web-посиланнях, відправляти SMS-повідомлення і т.д.
У Японії подібні коди наносяться практично на всі товари, що продаються в магазинах, їх розміщують в рекламних буклетах і довідниках. За допомогою QR-коду навіть організовують різні конкурси та рольові ігри.
Провідні японські оператори мобільного зв'язку спільно випускають під своїм брендом мобільні телефони з вбудованою підтримкою розпізнавання QR-коду.
У Японії також QR-коди використовуються на кладовищах і містять інформацію про усопшем.коди активно використовуються музеями, а також і в туризмі. Наприклад, у Львові (Україна), об'єднання бізнесменів Туристичний рух Львова розмістило QR-коди більш ніж на 80 туристичних об'єктах. Це дозволяє індивідуальним туристу легко орієнтуватися в місті, навіть не знаючи української мови, так як QR-коди встановлені на декількох мовах.
AZTEC
В даний час найбільш поширений вид двомірного штрихкоду Aztec. У кожному символі можна виділити область мішені і область даних. Мішень являє собою набір концентричних квадратів і служить для визначення геометричного центру символу в процесі його декодування. Символ складається з двох і більше суміжних по вертикалі рядків-знаків символу штрихового коду. У двовимірних кодах можна закодувати істотно більший обсяг
Розмір коду може варіюватися від квадрата 15x15 до квадрата 151x151. Найменший може містити в собі до 13 цифр або 12 букв англійського алфавіту, а наибольший - 3 832 цифр або 3 067 букв англійського алфавіту або 1 914 байт даних. При цьому не потрібно порожнього простору навколо малюнка коду.