Короткі теоретичнi відомості.

Інструкція до лабораторної роботи №2

з дисципліни «Комп'ютерні системи»

Тема."Кодування текстової та графічної інформації "

Для студентів базового напряму 6.0915 „Комп’ютерна інженерія”

Затверджено

на засіданні кафедри ЗЕС

Протокол № 1 від ___.___.2012 р.

Львів – 2012

Мета роботи.

1.1. Вивчення та практичне застосування методів кодування текстових та графічних даних.

1.2. Засвоєння різних методик кодування тексту та графіки.

Короткі теоретичнi відомості.

2.1. Кодування тексту

Текстова інформація складається з символів: літер, цифр, розділових знаків та ін.

Традиційно для того, щоб закодувати один символ використовують кількість інформації І рівну 1 байту, тобто I = 1 байт = 8 біт. За допомогою формули, яка зв'язує між собою кількість можливих подій К і кількість інформації I, можна обчислити скільки різних символів можна закодувати (вважаючи, що символи – це можливі події):

К = 2^І = 2⁸ = 256,

тобто для представлення текстової інформації можна використовувати алфавіт потужністю 256 символів.

Суть кодування полягає в тому, що кожному символу ставлять у відповідність двійковий код від 00000000 до 11111111 або відповідний йому десятковий код від 0 до 255.

Необхідно пам'ятати, що в даний час для кодування кирилічних літер використовують п'ять різних кодових таблиць (ASCII, СР1251, СР866, Мас, ISO), причому тексти, закодовані за допомогою однієї таблиці не відображатимуться правильно в іншому кодуванні. Наочно це можна представити у вигляді фрагмента об'єднаної таблиці кодування символів.

Одному і тому ж двійковому коду ставиться у відповідність різні символи.

Двійковий код	Десятковий код	ASCII	СР1251	СР866	Мас	ISO
			В	-	-	Т

Втім, в більшості випадків про перекодування текстових документів піклується на користувач, а спеціальні програми – конвертори, які вбудовані в додатки.

Починаючи з 1997 р. останні версії Microsoft Windows&Office підтримують нове кодування Unicode, яке на кожен символ відводить по 2 байти, а, тому, можна закодувати не 256 символів, а 65536 різних символів.

Щоб визначити числовий код символу можна або скористатися кодовою таблицею, або, працюючи в текстовому редакторові Word. Для цього в меню потрібно вибрати пункт "Вставка" – "Символ".

2.2. Кодування графічної інформації.

Графічну інформацію можна представляти в двох формах: аналоговій або дискретній. Живописне полотно, колір якого змінюється безперервно – це приклад аналогового представлення, а зображення, що надруковане за допомогою струменевого принтера і складається з окремих точок різного кольору, – це дискретне представлення. Шляхом розбиття графічного зображення (дискретизації) відбувається перетворення графічної інформації з аналогової форми в дискретну. При цьому проводиться кодування – привласнення кожному елементу конкретного значення у формі коду. При кодуванні зображення відбувається його просторова дискретизація. Її можна порівняти з побудовою зображення з великої кількості маленьких кольорових фрагментів (метод мозаїки). Все зображення розбивається на окремі точки, кожному елементу ставиться у відповідність код її кольору. При цьому якість кодування залежатиме від наступних параметрів: розміру точки і кількості використовуваних кольорів. Малий розмір точки, означає, що зображення складається з більшої кількості точок, тим вище якість кодування. Чим більша кількість кольорів використовується (тобто точка зображення може приймати більше можливих станів), тим більше інформації несе кожна точка, тим вища якість кодування. Створення і зберігання графічних об'єктів можливе в декількох видах – у вигляді векторного, фрактального або растрового зображення. За окремий спосіб вважається 3D (тривимірна) графіка, в якій поєднуються векторний і растровий способи формування зображень. Вона вивчає методи і прийоми побудови об'ємних моделей об'єктів у віртуальному просторі. Для кожного виду використовується свій спосіб кодування графічної інформації.

Растрове зображення.

Чорно-біле графічне зображення, наприклад з газети, складається з найдрібніших точок, які утворюють певний узор – растр. Цей метод відвіку застосовується в поліграфії для кодування графічної інформації. Точність передачі малюнка залежить від кількості точок і їх розміру. Після розбиття малюнка на точки, рухаючись по рядках зліва направо, можна кодувати колір кожної точки. Одну така точка називається пікселем (Picture element). Об'єм растрового зображення визначається множенням кількості пікселів на інформаційний об'єм однієї точки, який залежить від кількості можливих кольорів. Якість зображення визначається роздільною здатністю монітора. Чим вона вища, тобто чим більше кількість рядків растру і точок в рядку, тим вище якість зображення. У сучасних ПК використовують наступні роздільні здатності екрану: 640 на 480, 800 на 600, 1024 на 768, 1280 на 1024, ... , 2048 на 1536 точок. Оскільки яскравість кожної точки і її лінійні координати можна виразити за допомогою цілих чисел, то можна сказати, що цей метод кодування дозволяє використовувати двійковий код для того, щоб обробляти графічні дані.

Якщо говорити про чорно-білі ілюстрації, то, якщо не використовувати напівтона, піксель прийматиме один з двох станів: світиться (білий) і не світиться (чорний). А оскільки інформація про колір пікселя називається кодом пікселя, то для його кодування достатньо одного біта пам'яті: 0 - чорний, 1 - білий. Якщо ж розглядаються ілюстрації у вигляді комбінації точок з 256 градаціями сірого кольору (а саме такі в даний час загальноприйняті), то достатньо восьмирозрядного двійкового числа для того, щоб закодувати яскравість будь-якої точки.

У комп'ютерній графіці надзвичайно важливим є колір. Він виступає як засіб посилення зорового сприйняття і підвищення інформаційної насиченості зображення. Як формується відчуття кольору людським мозком? Це відбувається в результаті аналізу світлового потоку, що потрапляє на сітківку ока від відбиваючих або випромінюючих об'єктів. Прийнято вважати, що колірні рецептори людини, які ще називають колбочками, підрозділяються на три групи, причому кожна може сприймати всього один колір – або червоний, або зелений, або синій.

Колірні моделі.

Якщо говорити про кодування кольорових графічних зображень, то потрібно розглянути принцип декомпозиції довільного кольору на основні складові. Застосовують декілька систем кодування: HSB, RGB і CMYK.

Перша колірна модель проста і інтуїтивно зрозуміла, тобто зручна для людини, друга найбільш зручна для комп'ютера, а остання модель CMYK – для поліграфії. Використання цих колірних моделей пов'язане з тим, що світловий потік може формуватися випромінюваннями, що є комбінацією "чистих" спектральних квітів: червоного, зеленого, синього або їх похідних. Розрізняють аддитивне відтворення кольору (характерне для випромінюючих об'єктів) і субтрактівноє відтворення кольору (характерне для відбиваючих об'єктів). Як приклад об'єкту першого типу можна привести екран монітора, другого типу – поліграфічний відбиток.

1) Модель HSB (HSL) характеризується трьома компонентами: відтінок кольору (Hue), насиченість кольору (Saturation) і яскравість кольору (Brightness, Luminance). Можна отримати велику кількість довільних кольорів, регулюючи ці компоненти. Цю колірну модель краще застосовувати в тих графічних редакторах, в яких зображення створюють власноруч, а не обробляють вже готові. Потім створене зображення можна перетворити в колірну модель RGB, якщо її планується використовувати як екранну ілюстрацію, або CMYK, якщо як поліграфічний відбиток. Значення кольору вибирається як вектор, що виходить з центру кола. Напрям вектора задається в кутових градусах і визначає колірний відтінок. Насиченість кольору визначається довжиною вектора, а яскравість кольору задається на окремій осі, нульова точка якої має чорний колір. Крапка в центрі відповідає білому (нейтральному) кольору, а крапки по периметру – чистим кольорам.

2) Принцип методу RGBполягає в наступному: відомо, що будь-який колір можна представити у вигляді комбінації трьох кольорів: червоного (Red), зеленого (Green), синього (Blue). Інші кольори і їх відтінки виходять за рахунок наявності або відсутності цих складових. Дана колірна модель є аддитивною, тобто будь-який колір можна отримати поєднанням основних кольорів в різних пропорціях. При накладенні одного компоненту основного кольору на іншій яскравість сумарного випромінювання збільшується. Якщо сумістити все три компоненти, то отримаємо ахроматичний сірий колір, при збільшенні яскравості якого відбувається наближення до білого кольору.

При 256 градаціях тону (кожна точка кодується 3-ма байтами) мінімальні значення RGB (0,0,0) відповідають чорному кольору, а білому – максимальні з координатами (255, 255, 255). Чим більше значення байта з колірною складовою, тим цей колір яскравіший. Наприклад, темно-синій кодується трьома байтами (0, 0, 128), а яскраво-синій (0, 0, 255).

3) Колірна модель CMYKвикористовується при підготовці публікацій до друку. Кожному з основних кольорів ставиться у відповідність додатковий колір (доповнюючий основний до білого). Отримують додатковий колір за рахунок підсумовування пари решти основних кольорів. Значить, додатковими кольорами для червоного є блакитний (Cyan, C) = зелений + синій = білий - червоний, для зеленого – пурпурний (Magenta, M) = червоний + синій = білий - зелений, для синього – жовтий (Yellow, Y) = червоний + зелений = білий - синій. Причому принцип декомпозиції довільного кольору на складові можна застосовувати як для основних, так і для додаткових, тобто будь-який колір можна представити або у вигляді суми червоної, зеленої, синьої складової або ж у вигляді суми блакитної, пурупурної, жовтої складової. В основному такий метод прийнятий в поліграфії. Але там ще використовують чорний колір (Blacк, оскільки літера В вже зайнята синім кольором, то позначають літерою K). Це пов'язано з тим, що накладення один на одного додаткових кольорів не дає чистого чорного кольору.

Розрізняють кілька режимів представлення кольорової графіки:

а) повноколірний (True Color);

б) High Color;

в) індексний.

При режимі True Colorдля кодування яскравості кожної з складових використовують по 256 значень (вісім двійкових розрядів), тобто на кодування кольору одного пікселя (у системі RGB) треба витратити 8*3=24 розряди. Це дозволяє однозначно визначати 16,5 млн кольорів. Це доволі близько до чутливості людського ока. При кодуванні за допомогою системи CMYK для представлення кольорової графіки треба мати 8*4=32 двійкові розряди.

Режим High Color– це кодування за допомогою 16-розрядних двійкових чисел, тобто зменшується кількість двійкових розрядів при кодуванні кожної точки. Але при цьому значно зменшується діапазон кодованих кольорів.

При індексномукодуванні кольору можна передати всього лише 256 колірних відтінків. Кожен колір кодується за допомогою восьми біт даних. Але оскільки 256 значень не передають усього діапазону кольорів, доступних людському оку, то мається на увазі, що до графічних даних додається палітра (довідкова таблиця), без якої відтворення буде неадекватним: море може вийти червоним, а листя – синіми. Сам код точки растру в даному випадку означає не сам по собі колір, а тільки його номер (індекс) в палітрі. Звідси і назва режиму – індексний.

Відповідність між кількістю кольорів (К), що відображаються, і кількістю біт для їх кодування (а) знаходитися по формулі:

К = 2^а.

а	К	Достатньо для…
	2⁸ = 256	Мальованих зображень типу тих, що бачимо в мультфільмах, але недостатньо для зображень живої природи
16 (High Color)	2¹⁶ = 65536	Зображень, які публікуються на картинках в журналах і на фотографіях
24 (True Color)	2²⁴ = 16 777 216	Обробки і передачі зображень, що не поступаються якістю тим, які спостерігаються в живій природі

Двійковий код зображення, що виводиться на екран, зберігається у відеопам'яті. Відеопам'ять – це електронний енергозалежний запам'ятовуючий пристрій. Розмір відеопам'яті залежить від роздільної здатності дисплея і кількості кольорів. Але її мінімальний об'єм визначається так, щоб помістився один кадр (одна сторінка) зображення, тобто як добуток роздільної здатності і розміру коду пікселя.

V_min = M * N * а,

где М – кількість пікселів по рядку;

N – кількість пікселів по кадру;

а – кількість бит, що використовуються для кодування пікселя.

Векторні і фрактальні зображення.

Векторне зображення – це графічний об'єкт, що складається з елементарних відрізків і дуг. Базовим елементом зображення є лінія. Як і будь-який об'єкт, вона володіє властивостями: формою (пряма, крива), товщиною, кольором, зображенням (пунктирна, суцільна). Замкнуті лінії мають властивість заповнення (або іншими об'єктами, або вибраним кольором). Всі інші об'єкти векторної графіки складаються з ліній. Оскільки лінія описується математично як єдиний об'єкт, то і об'єм даних для відображення об'єкту засобами векторної графіки значно менший, ніж в растровій графіці. Інформація про векторне зображення кодується як звичайна буквено-цифрова і обробляється спеціальними програмами.

До програмних засобів створення і обробки векторної графіки відносяться наступні графічні редактори: Coreldraw, Adobe Illustrator, а також векторізатори (трасувальники) – спеціалізовані пакети перетворення растрових зображень у векторні.

Фрактальна графіка грунтується на математичних обчисленнях, як і векторна. Але на відміну від векторної, її базовим елементом є сама математична формула. Це приводить до того, що в пам'яті комп'ютера не зберігається жодних об'єктів і зображення будується тільки по рівняннях. За допомогою цього способу можна будувати прості регулярні структури, а також складні ілюстрації, які імітують ландшафти.

3. Домашня підготовка до роботи:

3.1. Ознайомитись з принципом кодуваняя тексту та графіки.

Порядок виконання роботи

4.1. Вибрати індивідульне завдання згідно таблиці варіантів завдань (Дод. 1).

4.2. Закодувати запропонований текст кодами ASCI та Unicode, використовуючи таблиці кодів WORD Þ Вставка Þ Символ Þ.

4.3. Розкодувати текст, закодований ASCI.

4.4. Розкодувати текст, закодований Unicode.

4.5. Створити таблицю:

4.6. Залити комірки таблиці кольорами, що відповідають кодам (у запропонованій колірній моделі), наведеним у таблиці варіантів завдань (Дод. 1). Продемонструвати результат викладачу.

Зміст звіту

5.1. Коди текстів.

5.2. Розкодовані тексти.

5.2. Таблиця з кольорами.

6. Контрольні питання.

1) Методи кодування тексту.

2) Призначення та характеристики ASCII.

3) Призначення та характеристики Unicode.

4) Методи кодування зображень.

5) Призначення та характеристики моделі HSB (HSL).

6) Призначення та характеристики RGB.

7) Призначення та характеристики CMYK.

8) Особливості формування веторних зображень