Использование различных кодировок

Лабораторная работа № 1. Представление информации в ЭВМ

Цель работы

Научиться переводить числа в те системы счисления, которые использует ЭВМ, подсчитывать объем занимаемой данными информации и уметь переводить значения количества информации из одних единиц измерения в другие.

Задачи лабораторной работы

После выполнения работы студент должен знать и уметь:

знать основные приемы работы с позиционными системами счисления;
уметь переводить числа из десятичной системы счисления в двоичную, восьмеричную и шестнадцатеричную;
производить обратный перевод из этих систем в десятичную;
уметь переводить значения из одних единиц измерения информации в другие.

Перечень обеспечивающих средств

Для обеспечения выполнения работы необходимо иметь компьютер с операционной системой и методические указания по выполнению работы.

Общие теоретические сведения

Система счисления – это способ представления чисел цифровыми знаками и соответствующие ему правила действий над числами.

Системы счисления можно разделить:

непозиционные системы счисления;
позиционные системы счисления.

В непозиционной системе счисления значение (величина) символа (цифры) не зависит от положения в числе.

Самой распространенной непозиционной системой счисления является римская. Алфавит римской системы записи чисел состоит из символов: I – один, V – пять, X – десять, L – пятьдесят, C – сто, D – пятьсот, M – тысяча.
Величина числа определяется как сумма или разность цифр в числе (например, II – два, III – три, XXX – тридцать, CC – двести).
Если же большая цифра стоит перед меньшей цифрой, то они складываются (например, VII – семь), если наоборот – вычитаются (например, IX – девять).

В позиционных системах счисления значение (величина) цифры определяется ее положением в числе.
Любая позиционная система счисления характеризуется своим основанием.
Основание позиционной системы счисления – количество различных цифр, используемых для изображения чисел в данной системе счисления.
Основание 10 у привычной десятичной системы счисления (десять пальцев на руках).
Алфавит: 1, 2, 3, 4, 5, 6, 7, 8, 9, 0.
За основание можно принять любое натуральное число – два, три, четыре и т. д., образовав новую позиционную систему: двоичную, троичную, четверичную и т. д.
Позиция цифры в числе называется разрядом.

Представим развернутую форму записи числа:

A_q = a_n-1q^n-1 + … + a₁q¹ + a₀q⁰ + a_-1q^n-1 + … + a_-mq^-m , где

q – основание системы счисления (количество используемых цифр)
A_q – число в системе счисления с основанием q
a – цифры многоразрядного числа Aq
n (m) – количество целых (дробных) разрядов числа Aq

Пример
порядковый номер
2 1 0 -1 -2
2 3 9, 4 5₁₀ = 210² + 310¹ + 910⁰ + 410^-1 + 510^-2
a₂ a₁ a₀, a_-1 a_-2

Двоичная система счисления

Официальное «рождение» двоичной системы счисления (в её алфавите два символа: 0 и 1) связывают с именем Готфрида Вильгельма Лейбница. В 1703 г. он опубликовал статью, в которой были рассмотрены все правила выполнения арифметических действий над двоичными числами.

Преимущества:

для её реализации нужны технические устройства с двумя устойчивыми состояниями:
есть ток – нет тока;
намагничен – не намагничен;
представление информации посредством только двух состояний надежно и помехоустойчиво;
возможно применение аппарата булевой алгебры для выполнения логических преобразований информации;
двоичная арифметика намного проще десятичной.

Недостаток: быстрый рост числа разрядов, необходимых для записи чисел.

Перевод чисел (8) (2), (16) (2)

Перевод восьмеричных и шестнадцатеричных чисел в двоичную систему: каждую цифру заменить эквивалентной ей двоичной триадой (тройкой цифр) или тетрадой (четверкой цифр).

Примеры:
5371₈ = 101 011 111 001₂;
5 3 7 1
1A3F₁₆ = 1 1010 0011 1111₂ 1 A 3 F

Задание для самостоятельного выполнения

Переведите:

3754₈ X₂
2ED₁₆ X₂

Перевод чисел (2) (8), (2) (16)

Чтобы перевести число из двоичной системы в восьмеричную или шестнадцатеричную, его нужно разбить влево и вправо от запятой на триады (для восьмеричной) или тетрады (для шестнадцатеричной) и каждую такую группу заменить соответствующей восьмеричной (шестнадцатеричной) цифрой.

Примеры:
1101010000111₂ = 1 5 2 0 7₈;
1 101 010 000 111
110111000001101₂ = 6 E 0 D₁₆
110 1110 0000 1101

Задание для самостоятельного выполнения

Переведите:

1011111010101100₂ X₈
1011010100000110₂ X₁₆

Перевод чисел (q) (10)

Запись числа в развернутой форме и вычисление полученного выражения в десятичной системе.

Примеры:

110110₂ = 12⁵ + 12⁴ + 02³ + 12² + 12¹ + 02⁰ = 54₁₀;

237₈ = 28² + 38¹ + 78⁰ = 128 + 24 + 7 = 159₁₀;

3FA₁₆ = 316² + 1516¹ + 1016⁰ = 768 + 240 + 10 = 1018₁₀.

Задание для самостоятельного выполнения

Переведите:

1100011010₂ X₁₀
162₈ X₁₀
E23₁₆ X₁₀

Перевод чисел (10) (q)

Последовательное целочисленное деление десятичного числа на основание системы q, пока последнее частное не станет меньше делителя.
Затем остатки от деления записываются в порядке, обратном порядку их получения.

2009₁₀=31014₅
75₁₀=1001011₂
75₁₀=113₈
75₁₀=B₁₆

Задание для самостоятельного выполнения

Переведите:

141₁₀ X₂
141₁₀ X₈
141₁₀ X₁₆

Для перевода правильных дробей из десятичной системы счисления в произвольную используется метод последовательного умножения на основание системы счисления дробных цифр числа до тех пор, пока не получим в дробной части всех нулей или не достигнем заданной точности (если число не переводится точно).

Пример. Перевести из десятичной системы счисления в двоичную число 0,325.

0,375
x 2
–––––
0,750

Выделяем целую часть: 0

0,750
x 2
–––––
1,500

Выделяем целую часть: 1

0,500
x 2
–––––
1,000

В дробной части получили все нули, т. е. число перевелось в двоичную систему счисления точно: 0,011₂.

Двоичная арифметика

1. Таблица сложения
0 + 0 = 0
1 + 0 = 1
0 + 1 = 1
1 + 1 = 10

2. Таблица вычитания
0 – 0 = 0
1 – 0 = 1
1 – 1 = 0
10 – 1 = 1

3. Таблица умножения
0 0 = 0
1 0 = 0
1 1 = 1

Пример. Сложить два числа в двоичной системе счисления.
1 1 0 1 1
+
1 0 1 1 0 1
––––––––––-
1 0 0 1 0 0 0

Количество информации, которое вмещает один символ N-элементного алфавита, равно i = log₂N.
Это известная формула Р. Хартли. В 32-значном алфавите каждый символ несет i = log₂32 = 5 (бит) информации.

Пример 1. Вычислить количество информации в слове «Информатика» при условии, что для кодирования используется 32-значный алфавит.

Решение. Вычислим количество информации, соответствующее 1 символу при использовании 32-значного алфавита: 32 = 2^х, х = 5 бит. Слово "Информатика" состоит из 11 символов, получаем 11* 5 = 55 (бит).

Пример 2. Растровый графический файл содержит черно-белое изображение с 2 градациями цвета (черный и белый) размером 800 х 600 точек. Определите необходимый для кодирования цвета точек (без учета служебной информации о формате, авторстве, способах сжатия и пр.) размер этого файла на диске в байтах.

Решение. Поскольку сказано, что изображение двуцветное, следовательно, для указания цвета одной точки достаточно двух значении, кодирующих белый или черный цвет. Два значения могут быть закодированы одним битом. Объем графического файла рассчитывается по формуле V=i*k, где i - глубина цвета, а k - количество точек.
Тогда объем графического файла равен 800 * 600 * 1 бит = 480 000 6ит, учитывая, что 8 бит = 1 байт получаем 480 000 / 8 = 60 000 байтов. В реальности в графических документах кроме описания цвета точек присутствует еще и служебно-дополнительная информация (о формате записи, авторских правах, способах сжатия и пр.).

Использование различных кодировок

В кодировке ASCII на каждый символ отводится 1 байт = 8 бит.

В кодировке Unicode на каждый символ отводится 2 байта = 16 бит.

Пример 1. При кодировании с помощью Unicode найти информационный объем фразы «Ученье – свет, а неученье – тьма!».

Решение. Подсчитаем число символов в заданной фразе, учитывая буквы, пробелы и знаки препинания (тире, запятую, восклицательный знак). Всего символов – 33. Вычислим объем фразы: 33 (символа) * 2 (байта) = 66 байт = 528 бит.

Пример 2. Сообщение содержит 4096 символов. Объем сообщения при использовании равномерного кода составил 1/512 Мбайт. Найти мощность алфавита, с помощью которого записано данное сообщение.

Решение. Мощность алфавита – количество символов в алфавите. Переведем информационный объем сообщения в биты.

Для кодирования одного символа отводится

Тогда мощность алфавита по формуле Р. Хартли равна N = 2ⁱ = 2⁴ = 16.

Пример 3. Сколько секунд потребуется модему, передающему сообщения со скоростью 28 800 бит/с для передачи 100 страниц текста в 30 строк по 60 символов каждая в кодировке ASCII.

Решение. В кодировке ASCII каждый символ занимает 8 бит или 1 байт.
Тогда объем текста равен 100 30 60 8 = 1 440 000 битов.
Для его передачи по модему потребуется

секунд.