Количество информации. Единицы измерения информации

Количество информации, передаваемой от источника к приемни­ку, связано с вероятностью пребывания источника в том или ином состоянии. Если состояние источника известно заранее (до переда­чи информации), то количество информации, получаемой приемни­ком при передаче, равно нулю. Если же состояние источника не из­вестно заранее, то количество получаемой информации определяется формулой

где N — число состояний, в которых может находиться источник;

Pi — вероятность появления i-ro состояния (i = 1, 2, . . . , N - 1, N).

При равновероятных состояниях источника (т.е. при Р1 = Р2=…= РN= )

 

 

Основание логарифма k в последней формуле определяет единицу количества инфор-мации. При k = 2 соответствующая единица называется бит (Bit — от слов binary digit). Такая единица чаще всего встречается в технике, что обусловлено наиболее частым использованием двузначного алфавита для представления дискретной информации. Один бит равен количеству информации, получа­емому от источника с двумя равновероятными состояниями.

Современные ЭВМ могут обрабатывать не только числовую ин­формацию, но и информа-цию, заданную любыми другими символа­ми. Обычно для представления одного символа служит слово дли­ной в 23 = 8 бит, получившее название байта. Посредством слов такой длины можно закодировать 28 = 256 различных символов, чего вполне достаточно при решении многих задач, связанных с обработкой символьной информации. Количество информации в этом случае удобно из-мерять также в байтах.

Для измерения больших объемов информации в ВТ применяются специальные единицы, ко-торые обозначаются К и М и читаются соответственно «кило» и «мега». При этом 1К = 1024 = 210, 1М = 1 048 576 = 220. Например, 1М байт = 210 К байт = 220 байт = 223 бит, 1М бит = 210 К бит = 220 бит, 1К байт = 210 байт = 213 бит, 1К бит = 210 бит. Иногда в приближенных расчетах по­лагают, что К 103, М 106.

Единицей измерения скорости передачи информации по кана­лам связи служит бод, равный 1 .

Кроме перечисленных единиц для измерения количества инфор­мации, обрабатываемой и хранимой в ЭВМ, используются также еди­ницы, не имеющие постоянного количественного эквивалента. К та­ким единицам относятся поле, слово, массив, сегмент и другие. Поле представляет собой группу бит, имеющую определенное зна­чение (например, поле, в котором указывается в кодированном виде операция, выполняемая на ЭВМ).

Совокупность бит, байтов, полей, слов, объединяемых некото­рым общим признаком (напри-мер, исходные данные для решения задачи), называется массивом. Сегмент — упорядоченная совокуп­ность бит, байтов, полей, слов, массивов, сгруппированных вместе с целью наименования.