Базові технології мультимедіа: текст

За визначенням мультимедійна інформація містить елементи даних різноманітних типів, як статичних (текст, графіка), так і динамічних (відео, аудіо, анімації).

Текст є візуальним представленням мови і водночас повноправним графічним елементом. Растровим зображенням символів тексту відповідають письменні символи певної мови [31, c 8]. Набори символів стандартизовані, домінуючими стандартними наборами символів є набори ASCII, ISO 646, ISO 8859 Unicode та ISO 10646, у яких для збереження кожного кодового значення застосовується відповідно по 7, 7, 8, 16 та 32 біти.

Візуальне представлення коду символу на екрані комп’ютера називається гліфом. Набори, у які організуються гліфи за ознакою спільності представлення окремих графічних елементів символів, називаються шрифтами. Шрифти класифікують за різними ознаками – шириною різних символів, елементами символьних форм, нахилом літер, товщиною штрихів, способом запису гліфів та типом текстового фрагменту, для відтворення якого придатний шрифт. Відповідно за шириною символів шрифти поділяють на моноширинні (всі символи займають однакову за шириною ділянку, як у шрифті Courier) та пропорційні (порожнє місце навколо літери залежить від її ширини, як у Times, Helvetica тощо). Якщо на кінцях символьних форм додаються невеликі рисочки, такі шрифти називаються шрифтами з засічками, або римськими (Roman fonts, наприклад, Times чи Courier). Якщо таких рисочок (засічок) немає, шрифти називають шрифтами без засічок, або гротескними (наприклад, Arial). За нахилом літер шрифти можуть бути прямі та нахилені чи курсивні. І нахилені, і курсивні шрифти використовують нахилені літери, проте у нахилених шрифтах відсутні каліграфічні відмінності. За товщиною штрихів шрифти поділяються на звичайні та грубі чи напівгрубі.

За призначенням шрифти поділяють на текстові та екранні. Текстовими називають шрифти, придатні для набору великого за обсягом тексту (текст статті, книги тощо), екранними – зручні для набору невеликих фрагментів тексту – заголовків, реклам тощо).

Оскільки гліфи є візуальним зображенням символів, то, як кожне зображення, їх можно записати, використовуючи растрову чи векторну графіку. Отримані першим способом шрифти називаються растровими, другим – ескізними. Гліфи растрових шрифтів мають такі самі характеристики, як будь-яке інше зображення растрової графіки; ескізні – як векторної. Перевагою растрових шрифтів є можливість швидкої візуалізації на екрані шляхом копіювання бітів, недоліком – неможливість задовільного масштабування. Растрові шрифти «прив’язані» до платформи, ескізні є міжплатформеними. Найбільш розповсюдженими форматами ескізних шрифтів є Type1 та TrueType. Оскільки швидкодія сучасних процесорів велика, то саме ескізні шрифти, які можна довільно масштабувати та згладжувати, використовують сьогодні найчастіше. Отримані фрагменти тексту можна форматувати, змінюючи розташування символів стосовно границь фрагменту, їх напрямок тощо.

У мультимедійних продуктах довгі безперервні фрагменти тексту розміром у кілька екранних сторінок незручні для читання, тому мультимедійні текстові елементи організуються переважно у невеликі текстові фрагменти розміром 1 – 2 екрани, для яких використовується комбінація екранних та текстових шрифтів, часто на різноколірному фоні.

Текстові файли можуть створюватися і зберігатися у різних форматах, основні з них наведені нижче:

· American Standard Code for Information Interchange ASCII (.txt)- формат текстових файлів в DOS-кодуванні, розроблений ANSI. Підтримується всіма операційними системами і всіма програмами;

· ANSI (.txt)-формат текстових файлів в кодуванні ANSI, що використовується для кодової сторінки Microsoft Windows;

· MsWord for Windows (.doc, .docх) - формат файлів, розроблений Microsoft, який іідтримується MsWord та іншими текстовими процесорами (.docх – починаючи з MsWord 2007). Крім текстової інформації, файли цього формату можуть містити графічні рисунки з різними параметрами;

· Rich Text Format (.rtf) - формат файлів, розроблений Microsoft, який іідтримується програмами для MSDOS та більшістю текстових процесорів. Зберігає
вихідне форматування документів, а також стилі зображення символів, підтримує 256 кольорів. Крім текстової інформації, файли цього формату можуть містити графічні рисунки з різними параметрами. Формат не підтримує макросів, чим запобігає
переносу відповідних вірусів; використовується в основному для обміну форматованими
текстовими даними між різними платформами та аплікаціями;

· Hiper Text Markup Language HTML (.htm, .html) – формат файлів на мові розмітки гіпертекстових документів. HTML-документи являють собою ASCII-файли, доступні для перегляду та редагування в будь-якому текстовому редакторі, відмінністю яких є присутність спеціальних команд - тегів, які задають правила форматування та перегляду документа, містять інформацію про структуру, вигляд фрагментів та їх зв'язок з іншими фрагментами. Доданий до фрагменту звичайного тексту тег забезпечує певне відображення та розташування цього фрагменту програмою перегляду (браузером);

· Portable Document Format PDF (.pdf) - формат збереження документів, розроблений фірмою Adobe, який забезпечує при перегляді первинний формат документу. Документи в інших форматах можуть бути конвертовані у pdf-формат за допомогою програми Adobe Acrobat (у якій документ у довільному текстовому форматі відкривається як .pdf) та утиліт Adobe Distiller та Adobe PDFWriter (принтерного драйвера, який рекомендований для конвертації не дуже великих текстових документів з обмеженими графічними елементами);

· Standard Generalized Markup Language SGML (.sgml) – формат документів на стандартній мові узагальненої розмітки. Мова містить набір інструментів створення структурованих документів, розмічених за допомогою тегів; забезпечує більш гнучкі та різнобічні можливості форматування у Web, ніж HTML, але програє останній у простоті;

· Extensible Markup Language XML (.xml) – формат документів на розширюваній мові розмітки, яка є спрощеною і більш розповсюдженою версією мови SGML.

· Введення тексту може здійснюється одним з наступних способів:

· вручну з клавіатури за допомогою системи підготовки текстів - текстового процесора (word processor) або настільної видавничої системи;

· скануванням надрукованого тексту з наступним розпізнаванням програмами розпізнавання тексту;

· перетворенням аудіоінформації з використання програм розпізнавання мови.

Сучасні текстові процесори входять до складу наборів офісних додатків, найвідомішими з яких для операційної системи Windows є Microsoft Office та OpenOffice. Перший має більші можливості; перевага другого полягає у вільному розповсюдженні.

Текстові процесори обох пакетів містять потужні інструменти верстки, форматування символів, абзаців, таблиць та розділів як вручну, так і за допомогою стилів. Всі вони забезпечують перевірку граматики, автоматизацію редагування, захист документів за допомогою паролів, колективну роботу, редагування документів в режимі WYSIWYG (What You See Is What You Get), підтримку специфікації OLE, імпорт тексту, графіки, таблиць і баз даних в різних форматах. Microsoft Office забезпечує кращу структуризацію документів, складення змістів та вказівників, кращу інтеграція з Windows, багатший інструментарій для роботи з вбудованими об’єктами, додаткові програми (PhotoEditor), більш зручний та дружній користувацький інтерфейс. У склад Windows входять прості текстові редактори NotePad та WordPad, що можуть застосовуватися для роботи з невеликими текстовими документами, які не передбачають складного форматування.

Структуризація тексту для потреб мультимедіа передбачає його створення чи перетворення у html-формат, тобто уHTML-сторінки. Такі сторінки можуть створюватися:

· конвертуванням у html-формат документу, створеного у довільному текстовому редакторі у форматі, в якому він буде відображатись у Web-браузері чи мультимедійному продукті;

· створенням HTML-сторінки за допомогою спеціалізованого дружнього до користувача HTML-редактора (наприклад, Microsoft FrontPage у складі Microsoft Office чи Macromedia DreamWeaver), у якому документ від самого початку створюється і зберігається у html-форматі способом, подібним до прийнятого у текстових процесорах, що забезпечує найкраще співвідношення можливостей HTML-сторінки та витрат часу на її створення;

· створення HTML-сторінки безпосередньо в HTML-кодах, що дає змогу сформувати найефективніший HTML-код, який забезпечить максимальну інформативність та найбільші можливості дизайну сторінки при її мінімальному об’ємі, проте вимагає глибокого знання мови HTML.

Текст в тілі HTML-документу розмічений тегами, які окреслюють фрагменти тексту, що відповідають певним логічним розділам. Версткою цих фрагментів керують правила таблиці стилів; вкладені таблиці стилів CSS(Cascading Style Shirts) підтримують всі Web-браузери та програми розробки мультимедіа.

Можливості HTML в галузі мультимедіа розширює технологія TIME (Timed Interactive Multimedia Extensions) та підтримуюча її мова SMIL (Synchronized Multimedia Integration Language), які дають змогу стандартизувати взаємодію мультимедійних компонентів з тегами HTML, наприклад, синхронізувати програвання звукових файлів із прокруткою текстових блоків і зображень і проглядати такий документ в будь-якому браузері [103].