Объективный (алфавитный) подход к измерению информации

Теперь познакомимся с другим способом измерения информации. Этот способ не связывает количество информации с содержанием сообщения, и называется объективныйили алфавитный подход.

При объективном подходе к измерению информации мы отказываемся от содержания информации, от человеческой важности для кого-то.

Информация рассматривается как последовательность символов, знаков (определение3).

Количество символов в сообщении называется длиной сообщения.

Основой любого языка является алфавит.

Алфавит – это набор знаков (символов), в котором определен их порядок.

Полное число символов алфавита принято называть мощностью алфавита. Обозначим эту величину буквой M.

Например, мощность алфавита из русских букв равна 33:

мощность алфавита из английских букв равна 26.

При алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от объема текста (т.е. от числа знаков в тексте) и от мощности алфавита. Тогда информацию можно обрабатывать, передавать, хранить.

Каждый символ несет x бит информации. Количество информации x, которое несет один символ в тексте, зависит от мощности алфавита M, которые связаны формулой 2x = M. Следовательно x = log2M бит.

Количество информации в тексте, состоящем из K символов, равно K*x или

K* log2M, где x – информационный вес одного символа алфавита.

Удобнее измерять информацию, когда мощность алфавита M равна целой степени числа 2. Для вычислительной системы, работающей с двоичными числами, также более удобно представление чисел в виде степени двойки.

Пример_6, в 2-символьном алфавите каждый символ несет 1 бит информации (2x = 2, откуда x = 1 бит).

Если M=16, то каждый символ несет 4 бита информации, т.к. 24 = 16.

Если M=32, то один символ несет 5 бит информации.

При M=64, один символ «весит» 6 бит и т.д.

Пример_7: Племя “Обезьяны” пишет письма, пользуясь 32-символьным алфавитом. Племя “Слоны” пользуется 64-символьным алфавитом. Вожди племен обменялись письмами. Письмо племени “Обезьяны” содержало 90 символов, а письмо племени “Слоны” – 80 символов. Сравните объем информации, содержащейся в письмах.

Решение: Мощность алфавита племени “Обезьяны” равна 32, информационный вес одного символа алфавита log232 = 5 бит. Количество информации в тексте, состоящем из 90 символов, равно 90*log232 = 450 бит.

Рассуждая аналогично про племя “Слоны”, получим: 80*log264 = 480 бит.

Следовательно, объем информации в письме вождя племени “Слоны” больше объема информации, которую передал в письме вождь племени “Обезьяны”.

Есть алфавит, который можно назвать достаточным. Это алфавит мощностью 256 символов. Алфавит из 256 символов используется для представления текстов в компьютере. В этом алфавите можно поместить практически все необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания, знаки псевдографики. Поскольку 256=28, то один символ этого алфавита «весит» 8 бит.

8 бит информации присвоили свое название – байт.

Байт – поле из 8 последовательных бит. Байт широко используется как единица измерения количества информации.

1 байт = 8 бит

Компьютерные текстовые редакторы работают с алфавитом мощности 256 символов. Поскольку в настоящее время при подготовке книг используются текстовые редакторы, легко посчитать объем информации в тексте.

Если один символ алфавита несет 1 байт информации, то надо просто сосчитать число символов, полученное значение даст информационный объем текста в байтах.

В любой системе единиц измерения существуют основные единицы и производные от них.

Для измерения больших объемов информации используются производные от байта единицы:

1 килобайт = 1 Кб = 210 байт = 1024 байта

1 мегабайт = 1 Мб = 210 Кб = 1024 Кб = 1048576 байт

1 гигабайт = 1 Гб = 210 Мб = 1024 Мб = 1048576 Кб = 1073741824 байт

Пример_8: Книга, набранная с использованием текстового редактора, содержит 70 страниц, на каждой странице 38 строк, в каждой строке 56 символов. Определить объем информации, содержащейся в книге.

Решение: Мощность компьютерного алфавита равна 256 символов. Один символ несет 1 байт информации. Значит 1 страница содержит 38*56=2128 байт информации. Объем всей информации в книге 2128*70=148960 байт.

Если оценить объем книги в килобайтах и мегабайтах, то

148960/1024 = 145,46875 Кбайт.

145,46875/1024 = 0,142059 Мбайт.

Алфавитный подход является объективным способом измерения информации в отличие от субъективного, содержательного, подхода. Только алфавитный подход пригоден при использовании технических средств работы с информацией.

 

По второй части заданий самостоятельно найти подходящий источник данных (статистика, научное исследование, объемы сбыта, интернет-аналитика и т.д.) и провести расчет. Сам источник данных продемонстрировать.

 

Задачи:

1. В детской игре «Угадай число» первый участник загадывает целое число от 1 до 32. Второй участник задает вопросы: «Загаданное число больше числа ___?». Какое количество вопросов при правильной стратегии гарантирует угадывание? Световое табло состоит из лампочек. Каждая лампочка может находиться в одном из трех состояний («включено», «выключено» или «мигает»). Какое наименьшее количество ламп должно находиться на табло, чтобы с его помощью можно было передать 27 различных сигналов? Определите, сколько бит информации несет сообщение о том, что на светофоре горит зеленый свет.

Найти источник данных и рассчитать количество информации в сообщении: житель Ульяновска одет в джинсы.

2. Яд находится в одном из 16 бокалов. Сколько единиц информации будет содержать сообщение о бокале с ядом? Сколько бит информации несет сообщение о том, что из колоды в 32 карты достали «даму пик»? Азбука Морзе позволяет кодировать символы для радиосвязи, задавая комбинацию точек и тире. Сколько различных символов можно закодировать, используя код Морзе длиной не менее пяти и не более шести сигналов?Предположим, вероятность того, что вы получите за контрольную работу оценку “5”, равна 0,6; вероятность получения “4” равна 0,2; вероятность получения “3” - 0,2. Определите, сколько бит информации будет нести сообщение о результатах контрольной работы в каждом из возможных случаев.

Найти источник данных и рассчитать количество информации в сообщении: у конкретного человека голубые глаза.

3. Проводят две лотереи: «4 из 32» и «5 из 64» Сообщение о результатах какой из лотерей несет больше информации? Для записи результатов детской игры «Зарница» используется таблица, в каждой клетке которой записано либо количество баллов, полученных командой в соответствующем виде состязаний (1, 2, 3), либо прочерк (если команда в этом виде соревнований не участвовала). В «Зарнице» соревнуются 30 команд в 10 видах соревнований. Какое количество информации в битах содержит таблица?

Дано: Кол-во цветов = 2 Размер картинки = 7*14 точек I = ?

Дано: Кол-во цветов = 8 Размер картинки = 17*24 точки I = ?

Найти источник данных и рассчитать количество информации в сообщении: абитуриент УлГТУ поступил в группу ИСЭд-11.

4. Информационное сообщение объемом 1.5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение? Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается при помощи минимального возможного количества бит. Станция сделала 80 измерений. Определите информационный объем в битах результатов измерения. Считая, что один символ кодируется одним байтом, подсчитать в байтах количество информации, содержащееся в фразе: «Терпение и труд все перетрут», «Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог.»

Найти источник данных и рассчитать количество информации в сообщении: абитуриент Ульяновска поступил в УлГТУ.

5. Подсчитать в килобайтах количество информации в тексте, если текст состоит из 600 символов, а мощность используемого алфавита – 128 символов. Эллочка-людоедка (в лексиконе которой, как известно, было 30 слов) произносит фразу, состоящую из 50 слов. Какое количество информации в битах сообщает Эллочка?

Шахматная доска состоит из 64 полей: 8 столбцов и 8 строк. Шашечная доска состоит из 100 полей: 10 столбцов и 10 строк. Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?

Найти источник данных и рассчитать количество информации в сообщении: житель Ульяновска имеет 2 телефонных номера.

6. Скорость информационного потока – 20 бит/сек. Сколько времени потребуется для передачи информации объемом в 10 килобайт? Вася и Петя передают друг другу сообщения, используя синий, красный и зеленый фонарики. Это они делают, включая по одному фонарику на одинаково короткое время в некоторой последовательности. Количество вспышек в одном сообщении – 3 или 4. Между сообщениями – паузы. Сколько различных сообщений могут передавать мальчики? Получено сообщение, информационный объём которого равен 3200 битам. Чему равен этот объём в байтах?

Найти источник данных и рассчитать количество информации в сообщении: житель России любит есть картошку.

7. В озере плавает 12500 окуней, 25000 пескарей, 6250 карасей и 6250 щук. Какое количество информации мы получим, когда поймаем какую–нибудь рыбу? Для передачи 300 различных сообщений используют 5 последовательных цветовых вспышек. Цветовые лампы включаются на одинаково короткое время в некоторой последовательности. Лампы скольких различных цветов должно использоваться при передаче (минимальное количество)? Каждое показание счётчика, фиксируемое в памяти компьютера, занимает 10 бит. Записано 100 показаний этого датчика. Каков информационный объём снятых значений в байтах?

Найти источник данных и рассчитать количество информации в сообщении: житель России читает более 1 книги в месяц.

8. В барабане для розыгрыша лотереи находится 32 шара. Сколько информации содержит сообщение о первом выпавшем номере (например, выпал номер 15)? После экзамена по информатике объявляются оценки («2», «3», «4» или «5»). Какое количество информации несет сообщение об оценке учащегося А, который выучил лишь половину билетов, и сообщение об оценке учащегося Б, выучившего все билеты? Для хранения растрового изображения размером 128*128 пикселей отвели 4 килобайта памяти. Каково максимально возможное число цветов в палитре изображения?

Найти источник данных и рассчитать количество информации в сообщении: у человека русый цвет волос.

9. При игре в кости используется кубик с шестью гранями. Сколько бит информации получает игрок при каждом бросании кубика? Загадали число от 1 до 100. Загадавший человек на все вопросы отвечает «Да» или «Нет». Какое наименьшее количество вопросов нужно задать, чтобы гарантированно угадать число? Считая, что каждый символ кодируется 7 битами, оцените информационный объём следующего предложения в кодировке КОИ-8 (в байтах): Сегодня метеорологи предсказывали дождь.

Найти источник данных и рассчитать количество информации в сообщении: у жителя Ульяновской области есть личный автомобиль.

10. Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге? Для передачи секретного сообщения используют код, состоящий из десятичных цифр. При этом все цифры кодируются одним и тем же (минимально возможным) количеством бит. Определите информационный объем в битах такого сообщения длиной в 150 символов. 10. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объём следующего предложения в кодировке Unicode (в байтах): Каждый символ кодируется восемью битами.

Найти источник данных и рассчитать количество информации в сообщении: выпускник Ульяновской школы поступил в ВУЗ.

11. Подсчитайте объем информации, содержащейся в романе А. Дюма "Три мушкетера", и определите, сколько близких по объему произведений можно разместить на одном лазерном диске? (590 стр., 48 строк на одной странице, 53 символа в строке). В княжестве есть только черные, белые и серые автомобили. Белых автомобилей 18. Сообщение о том, что в аварию попал черный автомобиль, несет 7 бит информации. Сообщение о том, что в аварию попал не серый автомобиль, несет 5 бит информации. Сколько черных автомобилей в княжестве? Сколько существует различных последовательностей из символов «а» и «б» длиной ровно в 11 символов?

Найти источник данных и рассчитать количество информации в сообщении: конкретный человек является автором изобретения.

12. На диске объемом 100 Мбайт подготовлена к выдаче на экран дисплея информация: 24 строчки по 80 символов, эта информация заполняет экран целиком. Какую часть диска она занимает? Световое табло состоит из лампочек, каждая из которых может находиться в двух состояниях («включена» или «выключена»). Какое наименьшее количество лампочек должно находиться на табло, чтобы с его помощью можно было передать 200 различных сигналов? В зрительном зале две прямоугольные области зрительских кресел: одна 10х12, а другая 17х8. Какое минимальное количество бит потребуется для кодирования каждого места в автоматизированной системе?

Найти источник данных и рассчитать количество информации в сообщении: занятиее будет проходить в 824 аудитории.

13. В библиотеке 16 стеллажей с книгами. На каждом стеллаже 8 полок. Библиотекарь сообщил читателю, что нужная ему книга находится на пятом стеллаже на третьей сверху полке. Какое количество информации библиотекарь передал читателю? В велокроссе участвуют 119 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем в битах сообщения, записанного устройством, после того как промежуточный финиш прошли 70 велосипедистов? Сообщение передано в семибитном коде. Каков его информационный объём в байтах, если известно, что передано 2000 символов?

Найти источник данных и рассчитать количество информации в сообщении: конкретное дерево в России - береза.

14. В коробке лежат 7 цветных карандашей. Какое количество информации содержит сообщение, что из коробки достали красный карандаш? Измерьте информационный объем сообщения «Ура! Скоро Новый год!» в битах, байтах, килобайтах (Кб), мегабайтах (Мб). В алфавите формального (искусственного) языка всего два знака-буквы («0» и «Х»). Каждое слово этого языка состоит всегда из пяти букв. Какое максимальное число слов возможно в этом языке?

Найти источник данных и рассчитать количество информации в сообщении: конкретный студент УлГТУ обучается программированию.

15. Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов? Репетиционный экзамен в школе сдают 125 человек. Каждому из них выделяют специальный номер. При регистрации участника для записи его номера используют минимально возможное количество бит, одинаковое для каждого участника. Каков объем информации в битах, записанный устройством, после регистрации 60 участников? Алфавит племени содержит всего 8 букв. Какое количество информации несет одна буква этого алфавита?

Найти источник данных и рассчитать количество информации в сообщении: конкретный житель Ульяновска живет на 7 этаже.

16. Юстасу необходимо передать следующее сообщение: «Дорогой Алекс! От всей души поздравляю с успешной сдачей экзамена по ТОИ. Желаю дальнейших успехов. Ваш Юстас». Пеленгатор определяет место передачи, если она длится не менее 3 минут. С какой скоростью (бит/с) Юстас должен передавать радиограмму? Имеется тест, объем которого 20 килобайт (на каждой странице теста 40 строк по 64 символа в строке, 1 символ занимает 8 бит). Определить количество страниц в тесте.

Найти источник данных и рассчитать количество информации в сообщении: конкретный человек в России носит одежду красного цвета.

Контрольные вопросы

1. Понятие информации.

2. Количество информации.

 

Для тех, у кого номер по списку больше 16 номер варианта определяется как остаток от деления по модулю 16 плюс 1, приведено в таблице:

№ варианта № по списку № по списку

 

Примечание:

Работа оформляется письменно с титульным листом.

Должно быть приведено пошаговое решение задач.

При сдаче необходимо устно ответить на контрольные вопросы.