Кодирование данных в ЭВМ

В

информатике используются данные различных типов: числовые, текстовые, графические, звуковая информация. Для автоматизации работы с данными различных типов важно унифицировать форму их представления. Для этого используется кодирование, то есть выражение данных одного типа через данные другого типа. В вычислительной технике принята универсальная система двоичного кодирования, которая основана на представлении данных всех типов двоичным кодом, состоящим из последовательности только двух цифр: 0 и 1. Каждая из этих цифр называется двоичной цифрой, или
по-английски – bit (бит).

Одним битом можно закодировать только два различных понятия (значения): 0 или 1 (да или нет, черное или белое, истина или ложь и т. п.). Если количество бит увеличить до двух, то число различных значений составит 4. Тремя битами можно закодировать 8 различных значений. Таким образом, увеличивая число бит на единицу, мы увеличиваем в два раза количество различных кодируемых значений. Общая формула для двоичной системы счисления (формула Р. Хартли) имеет вид: N=2m, где

N – количество различных кодируемых значений;

m – количество бит, используемых для кодирования.

Кодирование числовых данных. Для кодирования числовых данных используется двоичная система счисления, основанием которой является число 2. Эта система счисления, также как и десятичная, является позиционной. Запись числа в двоичной системе счисления в 3,3 раза длиннее, чем запись числа в десятичной системе счисления. В вычислительной технике для более компактной записи двоичных чисел иногда используют восьмеричную и шестнадцатеричную позиционные системы счисления. В некоторых случаях используется двоично-десятичное кодирование, при котором каждая десятичная цифра записывается своим двоичным кодом.

Числа в компьютере представляются в одной из двух форм: естественной и экспоненциальной (нормализованной).

Естественная форма (с фиксированной точкой) применяется для записи целых двоичных чисел. Для хранения целых неотрицательных чисел в памяти компьютера отводится минимум
1 байт. Максимальное значение целого неотрицательного числа, когда во всех разрядах хранятся единицы, равно 28–1=255. Для хранения целых чисел со знаком выделяются 2 байта (слово) или 4 байта (удвоенное слово). Точка фиксируется после младшего разряда, т.е. вне разрядной сетки. Старший разряд является знаковым. Он содержит значение 0, если число положительное, или 1 для отрицательного числа. Максимальное значение n-разрядного целого положительного числа со знаком равно 2n-1–1. Положительные числа записываются в компьютере прямым кодом, то есть обычной двоичной записью со знаком «+». Для представления отрицательных чисел используют дополнительный код, который позволяет заменить операцию вычитания сложением, что существенно упрощает работу процессора и увеличивает его быстродействие. Дополнительный код получается дополнением модуля отрицательного числа до нуля. Алгоритм получения дополнительного кода для отрицательного числа состоит из трех шагов.

1. Записать модуль числа в прямом коде в n двоичных разрядах.

2. Получить обратный код, инвертируя значения всех бит в прямом коде числа.

3. Прибавить 1 к полученному обратному коду.

Пример. Получить дополнительный код отрицательного числа –200910 в 16-разрядном компьютерном представлении.

Решение

1. Модуль числа 2009 в двоичной системе счисления равен 11111011001. Прямой 16-разрядный код числа 2009 получается добавлением нулей перед старшим разрядом двоичного кода до 16 разрядов (5 нулей). Получим прямой код: 0000011111011001.

2. Инвертируя значения бит в прямом коде, получим обратный код: 1111100000100110.

3. Добавляя 1 к обратному коду, получим дополнительный код: 1111100000100111.

Итак, отрицательное число –200910 в 16-разрядном компьютерном представлении будет равно дополнительному двоичному коду 1111100000100111.

Экспоненциальная форма (с плавающей точкой) применяется в компьютере для записи вещественных чисел вида a×10p (0,1£a<1), где a называется мантиссой, а p – порядком (например 0,3057×10+02). При представлении вещественных чисел выделяется 4 байта (удвоенное слово) или 8 байтов (учетверенное слово). Например, если выделено удвоенное слово (32 бита), то распределение двоичных разрядов имеет следующий вид.

   

Знак порядка
Знак числа

 


Кодирование текстовых данных. Текстовые данные состоят из набора символов. Каждому символу компьютера сопоставляется определенное число (порядковый номер). Это число представляется в памяти компьютера в виде двоичного кода. Различными комбинациями из восьми битов (один байт) можно закодировать все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, арифметические операции, специальные символы, например символ амперсанд (&) и др. Максимальное число различных символов, закодированных одним байтом, составляет 256.

Для IBM-совместимых компьютеров наиболее распространена стандартная система кодирования символов ASCII(американский код информационного обмена США). В системе ASCII закреплены две таблицы кодирования: базовая (значения кодов от 0 до 127) и расширенная (значения кодов от 128 до 255). В базовой таблице первые 32 кода являются управляющими кодами, которым не соответствуют никакие символы компьютера. Эти коды не выводятся на экран или печать, но с их помощью можно управлять выводом данных. Коды, начиная с 32 по 127, используются для кодировки символов английского алфавита, знаков препинания, цифр, арифметических действий и некоторых вспомогательных символов. Расширенная таблица кодирования предоставляется национальным системам кодирования. Так, например, в России наибольшее распространение получили: кодировка Windows-1251, используемая в локальных компьютерах, работающих на основе Windows, и ГОСТ-альтернативная кодировка в компьютерах, работающих в MS DOS.

В настоящее время в качестве общемирового стандарта предлагается универсальная двухбайтовая кодировка Unicode. Шестнадцать бит позволяют обеспечить уникальные коды для 65536 различных символов, что вполне достаточно для размещения в одной таблице символов большинства языков планеты. Рассмотрим несколько примеров.

Пример 1. В книге 500 страниц. На каждой странице книги 20 строк по 64 символа. Используя кодировку ASCII, определить объем книги в килобайтах.

Решение

На странице 20×64=1280 символов. В кодировке ASCII код символа занимает 1 байт. Объем страницы равен 1280 байт. В книге 500 страниц, что составляет 500×1280=640000 байт. Переведем в килобайты. 1 килобайт = 1024 байт. Следовательно, объем книги 640000/1024=625 Килобайт.

Пример 2. Сколько времени (в секундах) потребуется модему, передающему сообщения со скоростью 28800 бит/с, для передачи в кодировке ASCII 100 страниц текста в 30 строк по 60 символов каждая.

Решение

Объем текста равен 100×30×60×8=1440000 бит. Для его передачи по модему потребуется 1440000/28800=50 с.

Пример 3. Сообщение содержит 4096 символов. Объем сообщения при использовании равномерного кода составил 1/512 Мбайт. Определить мощность алфавита, с помощью которого записано данное сообщение.

Решение

Мощность алфавита – это количество символов в алфавите. Переведем информационный объем сообщения в биты. 1/512 Мбайт=(1/512)×1024×1024×8=16384 бит. Для кодирования одного символа отводится i=16384/4096=4 бит. Тогда мощность алфавита (N) по формуле Р. Хартли равна N=2i=24=16.

Кодирование графических данных. Наиболее распространенными методами представления графической информации являются растровая, векторная и фрактальная графика.

При растровом методе изображение представляется совокупностью точек – пикселей, для каждой из которых нужно задать цвет и яркость. Растровое кодирование позволяет использовать двоичный код для представления графических данных, так как линейные координаты и яркость каждой точки можно выразить целыми числами. Так, например, система кодирования RGB, состоящая из трех составляющих цветов (красный, зеленый, синий), для кодирования цвета одной точки использует 24 двоичных разряда. При этом система обеспечивает однозначное определение 16,5 млн. различных цветов, что близко к чувствительности человеческого глаза. Одним из недостатков растровых методов является трудность пропорционального изменения размеров изображения.

Векторные методы позволяют избежать проблем масштабирования, характерных для растровых методов. Изображение в векторных методах представляется совокупностью объектов – линий (отрезки, дуги и т.п.) и ограниченных ими фигур. Линии и фигуры задаются уравнениями и свойствами (цвет и начертание линии, цвет и способ заполнения фигуры). Изображение занимает меньший объем памяти, который зависит от числа и сложности объектов. Построение по данным требует специальных расчетов. Векторные методы используются для описания различных шрифтов, они позволяют изменять размер символов в широких пределах. Векторные методы также применяются в автоматизированных системах проектирования при отображении на экране чертежей сложных трехмерных объектов. Однако векторная технология не позволяет достичь высокого фотографического качества изображения, как при использовании растровых методов.

При фрактальном методе изображение строится не из линий, а по специальным формулам. Фрактальная графика позволяет получать наиболее сложное и реалистичное изображение. Используется в играх и других мультимедийных системах.

Рассмотрим некоторые примеры решения задач с использованием графики.

Пример 1. Растровое изображение размером 64´64 пикселя занимает 4 килобайта памяти. Определить максимальное количество цветов, используемых в изображении.

Решение

Сначала узнаем, сколько битовых разрядов используется для кодирования цвета одного пикселя. Всего пикселей 64×64=4096. Объем памяти 4 Кбайт=4×1024=4096 байтов. Получается, что на кодирование цвета каждого пикселя отводится 1 байт памяти, т.е. 8 битов. Далее обращаемся к формуле Р. Хартли, связывающей количество двоичных разрядов (Y) для кодирования цвета с количеством цветов (N). В нашем примере N=2Y=28=256. Итак, каждый пиксель может иметь один цвет из 256.

Пример 2. Растровый графический файл содержит черно-белое изображение с 2 градациями цвета (черный и белый) размером 800´600 точек. Определите необходимый для кодирования цвета точек (без учета служебной информации о формате, авторстве, способах сжатия и пр.) размер этого файла на диске в байтах.

Решение

Поскольку сказано, что изображение двухцветное, следовательно, для указания цвета одной точки достаточно двух значений, кодирующих белый или черный цвет. Два значения могут быть закодированы одним битом. Объем графического файла рассчитывается по формуле V=i×k, где
i (i=1 бит) – глубина цвета, а k – количество точек. Тогда объем графического файла равен V=1×800×600=480000 бит. Учитывая, что 8 бит=1 байт, получаем V=480000/8=60000 байтов. В реальности в графических документах кроме описания цвета точек присутствует еще и служебно-дополнительная информация (о формате записи, авторских правах, способах сжатия и пр.).

Кодирование звуковой информации. В настоящее время можно выделить два основных направления кодирования звуковой информации.

Метод частотной модуляции FM(Frequency Modulation). В природе звуковые сигналы имеют непрерывный спектр частот, то есть являются аналоговыми. В методе FM используется разложение звуковой волны на синусоиды, описывающие базовые колебания (гармоники). Разложение на последовательность гармонических сигналов и представление в виде дискретных цифровых сигналов (двоичных кодов) осуществляется с помощью специальных устройств – аналого-цифровых преобразователей (АЦП). Обратное преобразование и воспроизведение звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). Недостатком данного метода является то, что при преобразованиях неизбежны потери информации, поэтому качество звучания получается не вполне удовлетворительным.

Метод таблично-волнового синтеза(Wave-Table).Образцы множества различных звуков хранятся в заранее подготовленных таблицах (в технике такие образцы называются сэмплами). Числовые коды этих образцов содержат параметры, характеризующие особенности звука. При использовании данного метода качество звука получается высоким и приближается к качеству звучания реальных музыкальных инструментов.

Тесты

№ п/п Вопрос Варианты ответов
Сколько двоичных знаков потребуется для кодирования одной экзаменационной оценки? 1. 1 2. 2 3. 3 4. 4
Сколько различных комбинаций можно построить, используя четыре двоичных разряда? 1. 2 2. 4 3. 8 4. 16
Дано действительное двоичное число +1100111,00111. Представьте его в 4-байтовом формате с плавающей точкой, заполнив все 32 двоичных разряда. Введите ответ:
Знак числа Знак порядка Порядок Мантисса

 

В 4 байтах записано дробное положительное двоичное число в формате с плавающей точкой: Какому двоичному числу соответствует эта запись? 1. +111000000,110 2. +111000,0001 3. +111000,0001100001 4. +101,110000001100001
При переводе в дискретную форму аналогового сигнала длительностью 4 минуты 16 секунд использовались частота дискретизации v=64 Гц и 32 уровня дискретизации. Размер полученного кода в Кбайтах равен ____.

Введите ответ:

         

 

Для компьютерной карточной игры используется 36 карт (4 масти по 9 карт). Двоичный код каждой карты состоит из двух частей: кода масти + кода карты данной масти. Сколько бит должно быть выделено на кодировку каждой карты? 1. 2+3 2. 2+4 3. 1+4 4. 3+3
Один мальчик, чтобы безошибочно определять, кто звонит в дверь, предложил своим друзьям использовать сочетания из трех длинных и коротких звонков. Он раздал индивидуальные комбинации всем друзьям, и у него осталось еще две комбинации для родителей. Сколько друзей у мальчика? 1. 4 2. 6 3. 8 4. 2
Разведчик Белов должен передать сообщение «Место встречи изменить нельзя. Юстас». Пеленгатор определяет место передачи, если она длится не менее 2 минут. С какой скоростью (бит/с) должен передавать радиограмму разведчик? 1. 1 бит/с 2. 2 бит/с 3. 3 бит/с 4. 4 бит/с
Документ состоит из текстовой и графической информации. Текст содержит 30 строк по 30 символов в каждой строке. Размер черно-белого изображения составляет 120´300 точек. Определите информационный объем этого документа в байтах.

Введите ответ:

         

 

Наибольшее натуральное число, кодируемое 7 битами, равно... 1. 256 2. 255 3. 128 4. 127
Целое положительное двоичное число 11002 размещено в одном байте. Переведите его в обратный код.

Введите ответ:

               

 

Под текстовой информацией понимается… 1. Совокупность символов, представляющих собой текстовое сообщение. 2. Совокупность букв какого-либо алфавита. 3. Информация, которую можно вывести на печать. 4. Совокупность графических образов.
В некоторой системе кодирования текстовой информации выделено два бита на один символ. Какое из следующих слов невозможно закодировать в этой системе? 1. Молоко. 2. Лассо. 3. Ворона. 4. Крот. 5. Рококо.
Существует _______ различные(-ых) последовательности(ей) из символов «А» и «В», длиной ровно в пять символов. 1. 25 2. 10 3. 32 4. 120
Два пользователя собирались передавать друг другу тексты, содержащие только русские строчные буквы и пробелы, закодированными в двоичной системе счисления по собственной системе кодирования. Для одного символа было выделено минимальное возможное количество бит. Сколько еще дополнительных символов смогут использовать пользователи в своих текстах? 1. 30 2. 0 3. 1 4. 28 5. 16
Сколько символов содержит кодовое пространство ASCII? 1. 1024 2. 215 3. 8 4. 256
В кодировке ASCII слово МЕГАБАЙТ займет ____ байтов(-а) 1. 1024 2. 8 3. 64 4. 1048576
Объем сообщения составил 32 Кбайта. На одной странице помещается 16 строк по 64 символа в каждой. Число страниц, которое занимает сообщение, равно 64. Алфавит, с помощью которого записано сообщение, содержит _____ символов.

Введите ответ:

         

 

Объем текстовой информации в сообщении на 40 страницах (на странице 40 строк по 80 символов в каждой) в кодировке ASCII равен… 1. 1000 Кбайт. 2. 0,128 Мбайт. 3. 128 Кбайт. 4. 125 Кбайт.
С помощью одного байта при двоичном кодировании можно представить целое неотрицательное число от нуля до… 1. 257 2. 1 3. 255 4. 256
16-битное кодирование в Unicode открывает огромное кодовое пространство, состоящее из 216 символов. Что входит в 16-битную таблицу Unicode? А. Коды ASCII. Б.Коды всех живых языков. В.Коды официальных языков государств, имеющих письменность. Г. Коды мертвых и искусственно созданных языков. 1. А В Г 2. А В 3. А Б В 4. Б В
При перекодировке сообщения из кода Unicode в код ASCII объем сообщения изменился на 1/512 Мб. Сообщение содержит ____символа(-ов). 1. 2048 2. 1024 3. 256 4. 64
Растровое изображение размером 64´64 пикселя занимает 4 килобайта памяти. Максимальное количество цветов, используемых в изображении, равно … 1. 32 2. 256 3. 128 4. 64
Количество информации в слове «Информатика» при условии, что для кодирования используется 32-значный алфавит, равно _______ бит. 1. 11 2. 11/32 3. 55 4. 352
Сколько бит информации содержится в слове "Информация"? 1. 20 2. 10 3. 1 4. 80 5. 100
Документ, содержащий один и тот же текст, создан и сохранен в приложениях Блокнот и Word. Какое из утверждений является правильным? А. Файл типа TXT и файл типа DOC имеют равный размер. Б. Файл типа TXT имеет меньший размер, чем файл типа DOC. В. Файл типа TXT имеет больший размер, чем файл типа DOC. 1. Верно А. 2. Верно Б. 3. Верно В. 4. Все неверны.
Информационный объем одной точки черно-белого изображения равен… 1. 1 биту. 2. 2 битам. 3. 1 байту. 4. 2 байтам.
Информационный объем одной точки 16-цветного растрового изображения равен… 1. 1 биту. 2. 2 битам. 3. 3 битам. 4. 4 битам.
Растровый графический файл содержит черно-белое изображение с 2 градациями цвета (черный и белый) размером 800´600 точек. Определите необходимый для кодирования цвета точек (без учета служебной информации о формате, авторстве, способах сжатия и пр.) размер этого файла на диске в байтах. 1. 3 840 000 2. 480 3. 60 000 4. 480 000
Сотовый телефон имеет монохромный экран без градаций цвета с разрешением 96*68.. Для кодирования цвета одной точки, воспроизводимой на экране сотового телефона, используется 1 бит. Минимальный объем видеопамяти равен... 1. 816 байт. 2. 2176 байт. 3. 6528 байт. 4. 13056 байт.
Растровый газетный рисунок содержит 4 цвета: черный, темно-серый, светло-серый и белый. Сколько бит понадобится для двоичного кодирования цвета? 1. 1 2. 2 3. 3 4. 4
Перечислите основные цвета в модели RGB. 1. Красный, зеленый, синий. 2. Голубой, пурпурный, желтый, черный. 3. Белый, красный, зеленый, синий. 4. Голубой, пурпурный, желтый, белый.
256-цветный рисунок содержит 1 Кбайт информации. Из какого количеств точек он состоит? 1. 128 2. 256 3. 512 4. 1024
Как изменится информационный объем графического файла, если первоначально количество цветов было равно 256, а в результате преобразования установлено 16 цветов? 1. Увеличится в 2 раза. 2. Увеличится в 4 раза. 3. Уменьшится в 2 раза. 4. Уменьшится в 4 раза.
Цветное изображение, использующее 16 цветов, преобразовано в черно-белое. Как изменится объем графического файла? 1. Уменьшится в 2 раза. 2. Уменьшится в 4 раза. 3. Уменьшится в 8 раз. 4. Уменьшится в 16 раз.
256-цветное изображение файла типа BMP имеет размер 1024´768 пикселей. Определите информационную емкость файла. 1. 768 Кбит. 2. 64 Кбайт. 3. 768 Кбайт. 4. 192 Мбайт.
Во сколько раз увеличится информационная емкость файла, содержащего растровое изображение, если повысить глубину его цвета со стандарта «черно-белое» до стандарта «4 294 967 296 цветов». 1. 8 2. 16 3. 32 4. 64
Какой объем памяти видеокарты займет изображение 32-разрядного файла типа BMP, экранный размер которого 1024´768 пикселей? 1. 3 Кбайт. 2. 24 Кбайт. 3. 3 Мбайт. 4. 24 Мбайт.
Какую часть экрана займет изображение файла типа BMP объемом 3 Мбайт, созданного при глубине цвета 32 бита при разрешении экрана 1024´768 точек и качестве передачи цвета 32 бита? 1. Весь экран. 2. 1/2 экрана. 3. 1/3 экрана. 4. 1/4 экрана.
Какую часть экрана займет изображение файла типа BMP объемом 312,5 Кбайт, созданного при глубине цвета 16 бит при разрешении экрана 800´600 точек и качестве передачи цвета 32 бита? 1. Весь экран. 2. 1/2 экрана. 3. 1/3 экрана. 4. 1/4 экрана.
После изменения свойств рабочего стола монитор приобрел разрешение 1024´768 точек и получил возможность отображать 65 536 цветов. Какой объем видеопамяти занимает текущее изображение рабочего стола? 1. 3 Мбайт. 2. 1,5 Мбайт. 3. 12 Мбайт. 4. 24 Мбайт.

Какой объем файла понадобится для хранения представленного ниже черно-белого изображения?
(1 клетка – 1 пиксель)

               
               
               
               

 



?>