Цифрове представлення звукових сигналів та відеосигналів

Поняття звуку. Звук як фізичне явище – це хвильові коливання густини пружного середовища, переважно повітря. Коли звукова хвиля сягає мембрани барабанної перетинки, остання починає коливатися з тїєю ж частотою; потім вібрація передається через середнє вухо і у нервових волокнах генерує імпульси, сприйняття яких ми інтерпретуємо як звук. Якщо сила звуку (амплітуда коливань) замала, то волокно основної мембрани при своїх коливаннях не дістає до найближчої нервової клітини і людина не сприйме звук. При збільшенні амплітуди коливань волокна, воно торкається найближчої нервової клітини, подразнює нервові закінчення, які відразу ж починають посилати електричні імпульси в слуховий центр мозку і звук буде почутий.

Слух людини є вибірковим – на різних частотах людина здатна сприйняти коливання різної інтенсивності. Для того, щоб в повній тиші звук з частотою 1000 Гц був почутий, амплітуда тиску поблизу людського вуха повинна досягати всього лише 2,84·10-5 Н/м2, що становить лише 2·10-10 атмосферного тиску. Інтенсивність відповідної плоскої хвилі в повітрі при цьому складе 10-12 Вт/м2.

Основні характеристики звуку. Величина звукового тиску, ледь помітна на слух за відсутності усяких інших шумів і звуків, що заважають, називається пороговою величиною звукового тиску, або, скорочено, порогом чутності, чи абсолютним порогом чутності. Існують два основні типи звуків – музика і мова з різним характером зміни інтенсивності коливань у часі та відмінним впливом на людину; їх пороги чутності є відмінними (рис.1.7). Пороги чутності досить сильно різняться також у різних людей, причому ці відмінності мають випадковий характер для групи людей однакового віку з нормальним слухом.

Як видно з рис. 1.7, пороги чутності сильно залежать від частоти: звуки в діапазоні частот від 2000 до 4000 Гц сприймаються при звуковому тиску, меншому 2·10-5 Па; на нижніх і верхніх звукових частотах поріг чутності істотно зростає. Як би ми не збільшували інтенсивність звуку на частотах вище 20000 Гц або нижче 16–20 Гц, відчуття звуку не виникатиме, тобто звуки з частотою вище 20000 Гц і нижче за 16 Гц лежать за межами частот чутних звуків більшості людей. Частотний діапазон звукових хвиль, який може сприйматися вухом людини, лежить в межах (16 ¸ 20) – 20 000 Гц, і називається звуковим. Частоти нижче 16 Гц називаються інфразвуковими, вище 20000 Гц – ультразвуковими.

 
 

Рис.1.7. Області чутності звуку

Мінімальна помітна на слух різниця інтенсивності двох звуків однієї і тієї ж частоти визначає так званий диференціальний поріг чутності по інтенсивності звуку.

Для оцінки властивостей звуку в аспекті його вибіркового сприйняття людиною використовують поняття висоти та голосності (гучності) звуку. Голосністю називається суб'єктивне відчуття сили звуку, оцінюваної за звуковим тиском чи потоком звукової енергії, що дозволяє слуховій системі розташовувати звуки за шкалою від тихих до гучних звуків. Гучність звуку зв'язана передусім із звуковим тиском. Зазвичай, чим більше звуковий тиск, тим голосніше звучить акустична система. Гучність також залежить від частоти, спектрального складу, тривалості звуку і його локалізації в просторі.

Згідно закону Вебера-Фехнера, відчуття гучності звуку Е пов'язане з його силою J та силою звуку (звукового стимулу) на порозі чутності J0 співвідношенням:

, (1.12)

Константу А приймають рівною деякій зручній для обчислення величині, оскільки вона визначає масштаб відчуття і тому може бути вибрана довільно. Приймаючи, наприклад, умовно 2,3А =10, отримаємо:

. (1.13)

Відповідно рівень звукового тиску

, (1.14)

де p0 – звуковий тиск на нульовому рівні, рівний 2·10-5 Па. Для стандартного порогу чутності вуха людини на частоті 1000 Гц р0 = 2·10-5 Н/м2, що дає рівень звукового тиску в децибелах[1]:

(1.15)

Звуковий тиск і інтенсивність тонального звуку, виміряні приладами, не дають уявлення про відчуття гучності. Натомість людина здатна досить точно встановити рівність гучності двох звуків будь-якого частотного складу. Виходячи з цієї властивості слуху, було введене поняття рівня гучності, що дає змогу визначити гучність одного звуку стосовно іншого, прийнятого за опорний. За одиницю рівня гучності, яку називають фоном, прийняли величину рівня інтенсивності чистого тону з частотою 1000 Гц. Чисельно рівень гучності у фонах дорівнює рівню інтенсивності звуку в децибелах на частоті 1000 Гц. Визначення рівня гучності тонів інших частот проводиться по кривих рівного рівня гучності, які називаються ізофонами.

Для оцінки вибірковості слуху введено поняття висоти звуку. Відповідно до міжнародного стандарту ANSI-994 «висота (Pitch) – це атрибут слухового відчуття в термінах, в яких звуки можна розташувати за шкалою від низьких до високих. Висота залежить головним чином від частоти звукового стимулу, проте на неї також впливає звуковий тиск і форма хвилі». Висота тону вимірюється в спеціальних одиницях – мелах. Один мел дорівнює висоті звуку, відчутному при частоті 1000 Гц при рівні 40 дБ.

Слухова система здатна розрізняти висоту звуку лише періодичних сигналів, тому визначальним параметром для розрізнення висоти тону є частота сигналу. Якщо це складний звук, то висоту слухова система може визначити за його основним тоном, але тільки якщо він має періодичну структуру, тобто його спектр складається з гармонік (обертонів, відношення частот яких є цілими числами). Якщо ця умова не виконується, то визначити висоту тону слухова система не може. Наприклад, звуки таких інструментів як тарілки, гонги тощо не мають певної висоти. Експериментально встановлена залежність висоти тону від частоти сигналу, показана на рис. 1.8.


Рис.1.8. Зв'язок висоти тону і частоти

Забарвлення, або тембр звуку визначається його спектральним складом. Поняття спектру звуку ґрунтується на представленні про те, що довільне періодичне коливання може бути представлене рядом Фур’є – сумою скінченої кількості синусоїдальних коливань (чистих тонів). Спектр звуку представляє собою графік інтенсивностей (амплітуд) цих частотних складових, що графічно позначаються вертикальними лініями відповідної висоти. Спектр чистого тону містить лише одну лінію, яка відповідає його частоті; спектр довільного іншого коливання має більше ліній. Якщо огинаюча спектру має гострий пік, то звук сприймається на слух як тон відповідної висоти; решта складових спектру визначають забарвлення (тембр) звуку. В протилежному випадку звук сприймається як одночасне звучання кількох тонів або шум. Частотні складові, кратні основній частоті тону, називаються гармоніками, або обертонами; гармоніки нумеруються, починаючи з основного тону (перша гармоніка), а обертони - з першої кратної складової (перший обертон - друга гармоніка тощо).

В зв’язку з особливостями слухового сприйняття висота звуку визначається більше за його спектральним складом, ніж за його основним тоном. Наприклад, суб’єктивно сприйнята висота більшості спектрально багатих низькочастотних звуків практично не міняється навіть при повному видаленні з них основного тону, який в слуховому апараті відновлюється за різницею частот перших обертонів.

Крім періодичних коливань (тонів), якими представляють музику та мову, розрізняють також аперіодичні коливання - шуми. Для шумів характерний практично рівномірний розподіл інтенсивності по спектру, без явно виражених піків чи спадів. Виділяють білий, рожевий та коричневий шуми: білий має рівномірну спектральну густину і в чистому вигляді в природних звуках не зустрічається, однак часто має місце в електронних приладах; густина рожевого шуму спадає з ростом частоти обернено пропорційно до неї, що характерне для шуму дощу, прибою, вітру тощо; густина коричневого шуму спадає обернено пропорційно квадрату частоти (шуми, що відповідають звукам ударного походження - грім, обвал тощо).

Цифрове представлення звуку. Переважна більшість операцій обробки звуку здійснюється над отриманим перетворенням звукового сигналу відповідним електричним сигналом. Так, за допомогою мікрофону звукові хвилі перетворюються в аналоговий змінний електричний сигнал, який може переводитися у цифрову форму за допомогою аналого-цифрового перетворювача (АЦП) з подальшим відновленням аналогового сигналу на цифро-аналоговому перетворювачі (ЦАП) і генерацією відповідного звукового сигналу за допомогою динаміків.

Відповідно розрізняють первинні і вторинні звукові сигнали. До первинних відносять: природні шуми; сигнали, що генеруються музичними інструментами, тваринами, людьми (співом, мовою); шумові сигнали, що створюються для супроводу різних музичних і мовних художніх передач (шум потягу, гуркіт машин, свист вітру тощо). До вторинних відносять звукові сигнали, відтворені електроакустичними пристроями: первинні сигнали, що пройшли по електроакустичних трактах зв'язку і віщання, відповідно змінивши свої параметри; сигнали, генеровані електроакустичними пристроями на основі первинних електричних сигналів.

При розповсюдженні акустичного сигналу має місце безперервна зміна його рівня, для первинних акустичних сигналів постійно змінюється також їх форма та спектр. Залежність амплітуди від часу відбиває форму сигналу; кожному типу звуку – мові, музиці, природним шумам, - притаманна певна форма сигналу. Для кожного джерела звуку, навіть того ж самого типу (наприклад, скрипка в оркестрі), спектри мають індивідуальні особливості, що надає звучанню характерне забарвлення, яке називають тембром.

Суцільні спектри характеризуються залежністю спектральної густини від частоти (цю залежність називають енергетичним спектром). Спектральною густотою називають інтенсивність звуку в смузі частот шириною, рівній одиниці частоти. Для акустики цю смугу беруть рівною 1 Гц.

Цифрове представлення звуку базується на процесах дискретизації та квантування, які реалізуються аналого-цифровими перетворювачами (АЦП). АЦП працюють із електричними сигналами, тому оцифровуванню довільного звукового сигналу передує його перетворення у електричний сигнал за допомогою будь якого пристрою, наприклад, мікрофону.

Перетворення отриманого аналогового сигналу у цифровий (рис. 1.9) проходить у кілька етапів: обмеження смуги частот аналоговим фільтром для уникнення шумів дискретизації; дискретизація і квантування аналогового сигналу шляхом запам’ятовування миттєвих відліків сигналу з періодичністю, визначеною частотою дискретизації, за допомогою схеми вибірки/зберігання; кодування отриманого сигналу шляхом перетворення АЦП миттєвого значення кожного відліку в цифровий код або числа. Отримана послідовність біт цифрового коду і являє собою звуковий сигнал в цифровій формі, дискретний за часом та величиною.

Якщо передбачається високоякісне відтворення звуку, то частота дискретизації повинна бути не менше за величину, яка забезпечує збереження всього діапазону чутних частот. Частотний діапазон звукових хвиль, який може сприйматися вухом людини, лежить в межах від 16 (20) Гц до 20 000 Гц. Звідси випливає, що за теоремою Котельнікова-Найквіста частота дискретизації fд повинна бути більшою 40 тис. відліків за сек. Для якісного звучання зазвичай використовуються частоти дискретизації 44.1 чи 48 кГц.

З теореми Фур’е про представлення сигналу довільної форми у вигляді суми простих синусоїдальних коливань різної частоти і амплітуди випливає, що по закінченню аналого-цифрового перетворення звуковий сигнал у цифровій формі, поряд з низькочастотними складовими, відповідними вихідному аналоговому сигналу, міститиме й високочастотні компоненти, які є повторами низькочастотного спектру сигналу у вигляді бічних смуг із центрами в точках, кратних частоті дискретизації (fд, 2fд, 3fд, 4fд тощо). Якщо у вихідному сигналі будуть складові, вищі за fд, то бічні смуги будуть накладатися на низькочастотну складову спектру, що призведе до появи нових спектральних складових в сигналі і, як наслідок, до неможливості його правильного відновлення. Для уникнення накладення спектрів при записі звукового сигналу смугу частот вихідного аналогового сигналу обмежують за допомогою встановлення перед АЦП фільтру низьких частот (ФНЧ), що пригнічує всі частоти вище частоти дискретизації, яка для більшості звукових карт становить 44,1 та 48,0 кГц.

Рис. 1.9. Схема аналого- цифрового (а) та цифро-аналогового перетворення (б)

Процедура дискретизації технічно реалізується пристроєм вибірки/зберігання. Елементом запам'ятовування переважно є конденсатор, що заряджається до рівня напруги вхідного сигналу: потенціал заряду конденсатора відповідає миттєвому значенню напруги сигналу. Напруга на конденсаторі зберігається незмінною протягом деякого відрізку часу, який називають часом зберігання. В ідеалі процес зарядки має відбуватися миттєво; реально ж тривалість цього процесу складає приблизно 1 мкс.

Для отримання сигналу, дискретного не лише за часом, але й за величиною, здійснюють наступну процедуру аналого-цифрового перетворення – квантування, тобто заміну реальних миттєвих значень відліків сигналу на дозволені значення рівнів квантування, до яких ці реальні значення відліків є найближчими. Фактично в процесі квантування здійснюється вимірювання миттєвих значень рівня сигналу, отриманих в кожному відліку із точністю, яка визначається обраною кількістю рівнів квантування, яка, своєю чергою, безпосередньо залежить від кількості розрядів, використовуваних для запису значення рівня. Дійсно, кількість можливих рівнів квантування обмежується довжиною кодового слова, яке використовується для запису значення рівня сигналу: якщо, задавши довжину N-кодового слова, записати значення рівня сигналу за допомогою двійкових чисел, то кількість можливих значень буде рівна 2N; відповідно стільки ж буде і рівнів квантування. Наприклад, якщо значення амплітуди відліку представляється 16-розрядним кодовим словом, то максимальна кількість градацій рівня сигналу (рівнів квантування) дорівнюватиме 216 = 65536, за 8-розрядного представлення матимемо 28 = 256 градацій рівня. Кількість бітів, а натомість і пам’яті, що відводиться під 1 результат вимірювання (1 відлік), є характеристикою точності вимірювання і називається розрядністю дискретизації.Іноді використовують розрядність дискретизації у 8 бітів, але такої точності, зазвичай, недостатньо; переважно застосовують розрядність у 16 бітів, які дозволяють закодувати 65 536 значень амплітуди.

У сучасних АЦП для усунення високочастотних компонент спектру використовується передискретизація – дискретизація на підвищеній частоті, яку називають оверсемплінгом. Діапазон частот вхідного аналогового звукового сигналу обмежується за допомогою ФНЧ із лінійною фазовою характеристикою та частотою зрізу у 25 – 30 кГц, значно вищою за частоту корисного сигналу, який практично не спотворює імпульсний сигнал. В результаті виключаються фазові спотворення і придушення корисних сигналів вищих частот. Відфільтрований сигнал, що має обмежений за частотою спектр, піддається дискретизації на підвищеній частоті, що запобігає накладенням і спотворенню спектру. Отримані дискретні відліки сигналу кодуються, тобто перетворюються в послідовність чисел за допомогою АЦП, причому потік цифрових даних включає і небажані високочастотні компоненти спектру. Далі ці цифрові дані піддаються цифровій фільтрації на цифровому фільтрі високого порядку з крутою частотною характеристикою. Завдяки лінійності фазової характеристики цифрового фільтру фазові спотворення сигналу будуть відсутні. Відфільтрований сигнал матиме коректно обмежений за частотою спектр. Після цифрової фільтрації частота дискретизації сигналу знижується до подвоєного значення найвищої корисної частотної складової шляхом видалення «зайвих» відліків. В результаті небажані високочастотні складові ліквідуються, тоді як високочастотні складові вихідного звукового сигналу зберігаються.

Точність перетворення сигналу з аналогової форми у цифрову обмежується частотою дискретизації і розрядністю АЦП. Спотворення сигналу, що виникають в процесі квантування відліків, призводять до втрати інформації через неточне відтворення огинаючої форми сигналу внаслідок недостатньої кількості рівнів квантування. При зворотньому цифро-аналоговому перетворенні в ході відтворення записаного звукового сигналу це спотворення ліквідувати або зменшити практично неможливо.

Поява помилок квантування при записі звукового сигналу в цифровій формі еквівалентна додаванню до відновленого сигналу деякого шуму. Тому помилки квантування називаються шумом квантування. Шум квантування можна розглядати як специфічні спотворення сигналу, особливо помітні при малих його рівнях.

Рівень шуму квантування в децибелах зазвичай визначається відносно максимального значення сигналу. Чим менше цей рівень, тим вищою є якість звуку. Досяжний рівень шуму визначається розрядністю квантування і частотою дискретизації. Очевидно, що його зменшення можна досягти збільшенням частоти чи/та розрядності дискретизації, проте це призводить до розростання потрібних для запису сигналу обсягів пам’яті та розмірів потоку даних в каналі звукозапису. Ефективнішим є інший метод зменшення шуму квантування на основі методу захисту від накладання, який використовується при візуалізації векторної графіки. Зміст цього методу полягає у дізерингу (dithering) - додаванні до аналогового сигналу незначної дози псевдовипадкового шуму, внаслідок наявності якого різкі переходи між достатньо тривалими рівнями відліків перетворюються на сукупності короткотривалих стрибків рівнів, що надає помилці квантування випадкового характеру і забезпечує «вигладжування» різких переходів при відтворенні сигналу.

Цифро-аналогове перетворення сигналу проводиться в два етапи: на першому з потоку цифрових даних за допомогою цифро-аналогового перетворювача (ЦАП) виділяють відліки сигналу, що поступають з частотою дискретизацію; на другому з дискретних відліків формують безперервний аналоговий сигнал шляхом згладжування (інтерполяції). Ця операція рівносильна фільтрації сигналу ідеальним фільтром низької частоти, який пригнічує періодичні складові спектру дискретизованого сигналу.

Для відтворення звукового сигналу записаний в цифровій формі сигнал перетворюють в аналогову форму (рис.1.9). Як і в АЦП, в ЦАП широко застосовується оверсемплінг, оскільки існує проблема створення відновлюючих (інтерполюючих) аналогових фільтрів. Відразу після першого етапу цифро-аналогового перетворення сигнал являє собою серією вузьких імпульсів, що мають численні високочастотні спектральні компоненти. На аналоговий фільтр в цьому випадку покладається задача пропустити сигнал потрібного частотного діапазону (наприклад, 0–24 кГц) і якомога сильніше подавити непотрібні високочастотні компоненти. Отриманий в результаті цифро-аналогового перетворення звуковий сигнал потрапляє в мікшер і через лінійний вихід направляється в акустичну систему, в якій коливання напруги електричного сигналу перетворюються в коливання звукового тиску.

Цифрове представлення відеосигналу. Основними видами відеосигналу є: RGB-сигнал; композитний відеосигнал, компонентний чи YUV-сигнал та S-video сигнал.

RGB-сигнал; складається із трьох незалежних відеосигналів трьох одноколірних зображень – червоного (R), зеленого – (G) та синього (B) кольору, які подаються на кінескоп і в результаті накладання формують кольорове зображення. На даний час відсутні побутові носії, на які можна було б записати RGB-сигнал, однак з їх появою вирішиться проблема отримання зображення близького до ідеального.

Враховуючи особливості людського зору, а саме меншу чутливість ока до просторових змін відтінків кольору, як до змін яскравості, вихідні RGB-відеосигнали перед передаванням перетворюють (кодують) в сигнал яскравості Y та два кольорорізнісні сигнали U і V:

, , , (1.16)

при цьому U и V передаються с роздільчою здатністю в два раза меньшою, як Y. Таке зменшення об’єму інформації, що передається, дозволяє будувати більш дешеві системи. Вибір коефіцієнтів перетворення диктується жорсткими вимогами двосторонньої сумісності приймачів чорно-білого та кольорового сигналів. Кольорорізнісні сигнали U та V добавляються до сигналу яскравості шляхом модуляції спеціального гармонічного сигналу (колірної піднесучої) на частоті, яка знаходиться в межах спектру сигналу Y. Це приводить до співпадіння полоси частот сигналу яскравості та повного відеосигналу.

Композитний відеосигнал (CV, composite video) – це найпростіший вигляд аналогового відеосигналу, який представляє собою результат складання сигналу яскравості Y, двох колірних піднесучих, модульованих сигналами колірності U та V, а також синхросигналу, який складається із рядкових та кадрових синхроімпульсів. Тому композитний відеосигнал часто позначають абревіатурою CVBS, що означає «Color, Video, Blank and Sync». Використання композитного відеосигналу для телепередачі дозволяє звузити полосу частот, використовувати один канал зв’язку та передавати всю відеоінформацію по одному кабелю. Композитний відеосигнал приймається телевізійними приймачами з ефіру та використовується у більшості побутових форматів відеозапису. Вхід для композитного відеосигналу є у будь-якого плазмового телевізора чи панелі, а вихід має будь-яке AV-джерело від дешевого выдеомагнітофону до дорогого DVD-програвача. У відеомагнітофонах та відеокамерах класів VHS (Video Home System) и Video-8 використовуються тільки композитні відеосигнали, при цьому роздільча здатність обмежена 240 телевізійними лініями. Головний недолік композитного сигналу – втрата якості зображення. Оскільки складові яскравості та колірності об’єднані та передаються одним сигналом, їх неможливо чітко розділити при декодуванні.

Для досягнення викокої якості зображення використовують компонентний відеосигнал. Його отримують розділенням відеосигналу на декілька каналів. Наприклад, в системі RGB відеосигнал ділиться на червоний, синій та зелений компоненти, а також сигнал синхронізації. Його називають RGBS-сигналом і найбільше застосування він знайшов у Європі. В залежності від способу передачі сигналів синхронізації RGB-сигнал може мати декілька різновидів: RGsB-сигнал, якщо синхроімпульси передаються в каналі зеленого кольору та RsGsBs-сигнал, якщо сигнали синхронізації передаються у всіх колврних каналах. В системі YUV, яка отримала розповсюдження в США, основними складовими компонентного відеосигналу є сигнал яскравості (Y-компонента), який також може нести чорно-білу складову RGB-сигналу, та кольорорізнісні сигнали – R-Y-компонента, що вказує долю червоного та B-Y-компонента, що вказує долю синього кольору у загальній яскравості (доля зеленого кольору вираховується за значеннями вказаних компонент). Компонентний відеосигнал використовується в професійній апаратурі класу Betacam, зв’язаний з підтримкою роздільчої здатності до 500 ліній та забезпечує більш високу якість зображення.

Для кожної компонентної системи потрібний свій тип обладнання, а для об’єднання пристроїв різних відеоформатів необхідні спеціальні інтерфейсні блоки.

Сигнал S-video одержується із композитного розділенням його на дві незалежні складові (Y/C), де – Y-сигнал яскравості із синхроімпульсами, а C (Chrominance) – модульовані колірні сигнали. S-video використовується при записі/відтворенні в апаратурі класів S-VHS и Hi-8, при цьому забезпечується роздільча здатність 400 ліній.

Для перетворення відеосигналу в цифрову форму, як уже вказувалось, необхідно виконати три основні операції: дискретизацію, квантування і кодування. Дискретизація – представлення безперервного аналогового сигналу послідовністю його значень (відліків), що беруться в моменти часу, відокремлені один від одного інтервалом, який називається інтервалом дискретизації. Величину, зворотну інтервалу між відліками, називають частотою дискретизації. Чим менше інтервал дискретизації і, відповідно, вище частота дискретизації, тим менше відмінностей між вихідним сигналом і його дискретизованою копією. Ступінчаста структура дискретизованого сигналу може бути згладжена за допомогою фільтру нижніх частот. Відновлення аналогового сигналу за допомогою фільтру НЧ буде точним, якщо частота дискретизації принаймні в 2 рази перевищує ширину смуги частот вихідного аналогового сигналу (теорема Котельнікова-Найквіста), у протилежному випадку дискретизація супроводжується незворотними спотвореннями.

Квантування є заміною поточної величини відліку сигналу найближчим значенням з набору фіксованих величин – рівнів квантування, тобто квантування – це округлення значень відліків. Рівні квантування ділять весь діапазон можливої зміни значень сигналу на скінченне число інтервалів – кроків квантування. Розташування рівнів квантування обумовлене шкалою квантування. Використовуються як рівномірні, так і нерівномірні шкали.

На відміну від флуктуаційних шумів шум квантування корельований з сигналом і не може бути усунений наступною фільтрацією. Шум квантування убуває зі збільшенням кількості рівнів квантування. Квантований сигнал, на відміну від вихідного (аналогового), може приймати тільки кінцеве число значень. Це дозволяє представити його в межах кожного інтервалу дискретизації числом, рівним порядковому номеру рівня квантування. Своєю чергою це число можна виразити комбінацією певних знаків чи символів.

Сукупність знаків (символів) і систему правил, за допомогою яких дані представляються у вигляді набору символів, називають кодом, а кінцеву послідовність кодових символів - кодовим словом. Квантований сигнал можна перетворити у послідовність кодових слів. Ця операція називається кодуванням. Кожне кодове слово передається в межах одного інтервалу дискретизації. Для кодування сигналів звуку й зображення широко застосовують двійковий код. Кодові слова можна передавати в паралельній або послідовній формах.При передачі в паралельній формі треба використати n ліній зв'язку для одночасної передачі по них символів кодового слова в межах інтервалу дискретизації.

Композитний сигнал у системах PAL і NTSC дискретизується з частотою 4fsc, яка дорівнює збільшеній учетверо частоті колірної піднесучої, тобто частоті її четвертої гармоніки. В PAL 4fsc близьке до 17,73 МГц, в NTSC - до 14,31 МГц. В системі NTSC рядок містить 910 відліків, з яких 768 утворюють активну частину цифрового рядка. У системі PAL на інтервал аналогового рядка припадає неціле число відліків із частотою 4fsc, оскільки в системі PAL крім зсуву на чверть рядка використовується додаткове зміщення частоти піднесучої на частоту кадрів (25 Гц). Для збереження безперервного цифрового потоку відліків, що слідують з постійною частотою 4fsc, у системі PAL тривалість цифрового рядка прийнята нерівною тривалості аналогового рядка. Всі рядки поля (за винятком двох) містять по 1135 відліків, а два - по 1137. Швидкість передачі даних для цифрового сигналу в системі NTSC становить 143 Мбіт/с; в системі PAL - 177 Мбіт/с.

Компонентний телевізійний відеосигнал може бути представлений у цифровій формі відповідно до Рекомендацій ITU-R 601, які частіше називають стандартом CCIR61. Цей стандарт встановлює правила роздільної дискретизації, квантування й кодування сигналу яскравості Y і двох кольорорізнісних сигналів R-Y (Сr) і B-Y (Сb). Частота дискретизації для сигналу яскравості Y встановлена на рівні 13,5 Мгц, для кольорорізнісних сигналів - 6,75 Мгц, тобто частота дискретизації сигналу яскравості в 2 рази більше частоти дискретизації кольорорізнісних сигналів внаслідок особливостей зорового сприйняття людини. Це перший етап стиснення відео, який полягає у тому, що для кожного значення різниці кольорів береться вдвічі менше відліків, ніж для кожного значення яскравості. Цей процес називають субдискретизацією колірності. Якщо взяти, як прийнято, у якості умовної (базової для ієрархії цифрових стандартів) одиниці частоту 3,375 Мгц, то частоти дискретизації яскравісного й двох кольорорізнісних сигналів будуть перебувати в співвідношенні 4:2:2, що й відбиває назва стандарту.

Існують і інші формати представлення компонентного сигналу в цифровому вигляді. Кодування за стандартом 4:4:4 передбачає використання частоти 13,5 Мгц для всіх трьох компонентів: R, G, В або Y, Сr, Сb. Формат 4:4:4:4 описує кодування чотирьох сигналів, три з яких є компонентами відеосигналу (R, G, В або Y, Сr, Сb), а четвертий (альфа-канал) несе інформацію про обробку сигналу, наприклад, про прозорість зображення переднього плану при накладанні кількох зображень. Додатковим четвертим сигналом може також бути сигнал яскравості Y. Частота дискретизації всіх сигналів - 13,5 Мгц, тобто всі сигнали передаються в повній смузі частот.