Единицы измерения информации и примеры

Мера информации Единицы измерения Примеры из компьютерной области
Синтаксическая:    
шенноновский подход Степень уменьшения неопределен­ности Вероятность события
компьютерный подход Единицы представления инфор­мации Бит, байт, Кбайт и т. д.
Семантическая Тезаурус Пакет прикладных программ, пер­сональный компьютер, компьютер­ные сети и т. д.
Прагматическая Ценность использования Емкость памяти, производитель­ность компьютера, скорость пере­дачи данных и т. д.
    Денежное выражение
    Время обработки информации и принятия решений

 

Свойства информации

Возможность и эффективность использования информации обусловливаются такими ос­новными ее свойствами, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.

Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:

§ правильность концепции, на базе которой сформулировано исходное понятие;

§ обоснованность отбора существенных признаков и связей отображаемого явления.

Нарушение репрезентативности информации нередко приводит к существенным ее погрешностям.

Содержательность информации отражает семантическую емкость, определяемую по формуле . С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных. Наряду с коэффициентом содержательности , отражающим семантический аспект, можно использовать и коэффициент информативности .

Достаточность (полнота) информации означает, что она содержит мини­мальный, но достаточный для принятия правильного решения набор показателей. Понятие полноты информации связано с ее смысловым содержанием и прагматикой. Как неполная, т. е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.

Доступность информации восприятию пользователя обеспечивается выполне­нием соответствующих процедур ее получения и преобразования. Она достигается, в частности, путем согласования семантической формы информации с тезаурусом пользователя.

Актуальность информации определяется степенью сохранения ценности ин­формации в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.

Своевременность информации означает её поступление не позже заранее назначенного момента времени, согласованного со временем решения поставленной задачи.

Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т. п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:

§ формальная точность, измеряемая значением единицы младшего разряда числа;

§ реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;

§ максимальная точность, которую можно получить в конкретных условиях функцио­нирования системы;

§ необходимая точность, определяемая функциональным назначением показателя.

Достоверность информации определяется ее свойством отражать реально су­ществующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т. е. вероятностью того, что отобра­жаемое информацией значение параметра отличается от его истинного значения в пределах необходимой точности.

Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.

Такие свойства информации, как ре­презентативность, содержательность, достаточность, доступность и устойчивость, целиком определяются на методическом уровне разработки информационных систем. Параметры актуальности, своевременности, точности и достоверности обусловливаются в большей степени также на методическом уровне, однако на их величину существенно влияет и характер функционирования системы (в первую очередь ее надежность). При этом парамет­ры актуальности и точности жестко связаны с параметрами своевре­менности и достоверности соответственно.

Классификация информации

Важным понятием при работе с информацией является классификация объектов.

Классификация – система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Таким образом, классификация объектов – это процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Пример 1.5. Всю информацию об университете можно классифицировать по мно­гочисленным информационным объектам, которые будут характеризоваться общими свойствами:

§ информация о студентах – в виде информационного объекта «Студент»;

§ информация о преподавателях – в виде информационного объекта «Препода­ватель»;

§ информация о факультетах – в виде информационного объекта «Факультет» и т. п.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными (напри­мер, вес, стоимость, год), либо признаками (например, цвет, марка автомобиля, фамилия).

Реквизит – логически неделимый информационный элемент, описываю­щий определенное свойство объекта, процесса, явления и т. п.

Пример 1.6. Информация о каждом студенте может быть представлена посредством одинаковых реквизитов:

§ фамилия, имя, отчество;

§ пол;

§ год рождения;

§ место рождения;

§ адрес проживания;

§ факультет, на котором обучается студент, и т. д.

Кроме выявления общих свойств информационного объекта, классификация нужна для разработки правил и процедур обработки информации, представленной совокупностью реквизитов.

При любой классификации желательно, чтобы соблюдались следующие требования:

§ полнота охвата объектов рассматриваемой области;

§ однозначность реквизитов;

§ возможность включения новых объектов.

В любой стране разработаны и применяются государственные, отраслевые, регио­нальные классификаторы. В частности, классифицированы отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т. д.

Классификатор – систематизированный свод наименований и кодов классификационных группировок.

При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объеди­нением этих двух понятий в одно, называемое признаком классификации.

Пример 1.7. В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.

Также можно сказать, что выбраны три признака классификации: возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет.

Существуют три метода классификации объектов: иерархический, фасетный и дес­крипторный. Они различаются разной стратегией применения классификационных признаков.

Иерархическая система классификации (рис. 1.5) строится следующим образом:

§ исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы, которые обра­зуют 1-й уровень;

§ каждый класс 1-го уровня в соответствии со своим клас­сификационным признаком делится на подклассы, которые образуют 2-й уровень;

§ каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т. д.

Учитывая достаточно жесткую процедуру построения иерархической структуры, необходимо перед выполнением классификации определить, какими свойствами должны обладать объединяемые в классы объекты. Эти свойства будут являться признаками классификации.

Рис. 1.5. Иерархическая система классификации

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбран­ного классификационного признака. Для последующей группировки в каждом новом клас­се необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии. Количество уровней, соответствующее числу признаков классификации, характеризует глубину классификации.

Достоинства иерархической системы классификации:

§ простота построения;

§ использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации:

§ жесткая структура, которая приводит к сложности внесения изменений, так как при­ходится перераспределять все классификационные группировки;

§ невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Пример 1.8. Создать иерархическую систему классификации для информационного объекта «Факультет», которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: фа­культет, на котором он обучается, возрастной состав студентов, пол студента, для жен­щин – наличие детей.

Система классификации представлена на рис. 1.6 и будет иметь следующие уровни:

0-й уровень. Информационный объект «Факультет»;

1-й уровень. Выбирается классификационный признак – название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах.

2-й уровень. Выбирается классификационный признак – возраст, который имеет три значения: моложе 20 лет, от 20 до 30 лет, старше 30 лет. В результате по каждому факультету, выделяются три возрастных подкласса студентов.

3-й уровень. Выбирается классификационный признак – пол. В результате каждый подкласс 2-го уровня разбивается на две группы – женщин и мужчин.

4-й уровень. Выбирается классификационный признак – наличие детей у женщин (есть или нет).

Созданная иерархическая система классификации имеет глубину, равную четырем.

Фасетная система классификации в отличие от иерархической позволяет вы­бирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасе­тами. Каждый фасет содержит совокупность однородных значений данного классификационного признака. При этом значения в фасете могут располагаться в произвольном порядке, хотя желательно, чтобы они были упорядочены.

Рис. 1.6. Пример иерархической системы классификации для информационного объекта «Факультет»

Схема построения фасетной системы классификации в виде таблицы отображена на рис. 1.7. Названия столбцов соответствуют выделенным фасетам, которые обозначены , , …, , …, . В каждой ячейке столбца хранится одно определенное значение фасета.

Рис. 1.7. Фасетная система классификации

Процедура классификации состоит в присвоении каждому объекту соответствующих значений фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов с помощью структурной формулы, в которой отражается порядок их следования:

,

где -й фасет; – количество фасетов.

При построении фасетной системы необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в значениях любого фасета.

Достоинства фасетной системы классификации:

§ возможность создания классификации большой емкости, т. е. использования большого числа признаков классификации и их значений для создания группировок;

§ возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построе­ния, так как необходимо учитывать все многообразие классификационных признаков.

Пример 1.9. Для иерархической системы, представленной на рис. 1.5, разработать фасетную систему классификации.

Сгруппируем и представим в виде таблицы (рис. 1.8) все классификационные приз­наки по фасетам:

§ фасет Факультет с двумя значениями;

§ фасет Возраст с тремя значениями;

§ фасет Пол с двумя значениями;

§ фасет Дети с двумя значениями.

 


 


 

Факультет Возраст Пол Дети
Коммерческий Моложе 20 лет М Есть
Информационные системы От 20 до 30 лет Ж Нет
  Старше 30 лет    

Рис. 1.8. Пример фасетной системы классификации
для информационного объекта «Факультет»

 


Структурную формулу любого класса можно представить в виде

(Факультет, Возраст, Пол, Дети).

Присваивая конкретные значения каждому фасету, можно получить следующие классы:

§ (Факультет информационных систем, в возрасте моложе 20 лет, мужчина, дети есть);

§ (Коммерческий факультет, в возрасте от 20 до 30 лет, мужчина, детей нет);

§ ( Коммерческий факультет, в возрасте моложе 20 лет, женщина, детей нет) и т. д.

Для организации поиска информации и ведения тезаурусов эффективно использовать дескрипторную (описательную) систему классификации, язык которой прибли­жается к естественному языку описания информационных объектов. Суть дескрипторного метода классификации заключается в следующем:

§ отбирается совокупность ключевых слов или словосочетаний, описывающих опреде­ленную предметную область или совокупность однородных объектов, причем среди ключевых слов могут быть синонимы;

§ выбранные ключевые слова и словосочетания подвергаются нормализации, т. е. из совокупности синонимов выбирается один или несколько наиболее употребляемых;

§ создается словарь дескрипторов, т. е. ключевых слов и словосочета­ний, отобранных в результате выполнения нормализации.

Пример 1.10. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении.

В качестве ключевых слов могут быть выбраны: ассистент, аудитория, доцент, занятие, коллега, комната, лектор, лекция, обучаемый, педагог, подразделение университета, практическое занятие, преподаватель, профессор, студент, учащий­ся, учитель, факультет.

Среди указанных ключевых слов встречаются синонимы: студент, обучаемый, учащийся; преподаватель, учитель, педагог; факультет, подразделение университета.

После нормализации словарь дескрипторов будет состоять из следующих слов: ассистент, аудитория, доцент, лектор, лекция, практическое занятие, преподаватель, про­фессор, студент, факультет.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

§ синонимические, указывающие на то, что ключевые слова являются синонимами;

§ родо-видовые, отражающие включение некоторого класса объектов в более представительный класс;

§ ассоциативные, соединяющие дескрипторы, которые обладают общими свойствами.

Пример 1.11. Синонимическая связь: студент – учащийся – обучаемый.

Родо-видовая связь: университет – факультет – кафедра.

Ассоциативная связь: студент – экзамен – профессор – аудитория.

Кодирование информации

Система кодирования – совокупность правил кодового обозначения объектов.

Система кодирования применяется для замены названия объекта на его условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации. Код строится на базе алфавита, состоящего из букв, цифр и других символов. Он характеризуется:

§ длиной, т. е. количеством символов;

§ структурой, т. е порядком расположения символов, используемых для обозна­чения классификационного признака.

Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис. 1.9), ко­торые образуют:

§ классификационную систему кодирования, ориентированную на про­ведение предварительной классификации объектов на основе иерархической или фасетной системы;

§ регистрационную систему кодирования, не всегда требующую предваритель­ной классификации объектов.

Рис. 1.9. Система кодирования, использующая разные методы

Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классифи­кационной структуры. Его суть заключается в следующем: сначала записывается код группировки 1-го уровня, затем – код группировки 2-го уровня и т. д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же дос­тоинствами и недостатками, что и иерархическая система классификации.

Пример 1.12. Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 1.6). Прежде чем начать кодирование, необхо­димо определиться с алфавитом. Для большей наглядности выберем десятичную систему счисления. В этом случае длина каждой кодовой комбинации будет определяться глубиной классификации, т. е. равна 4. Кодирование группировки на каждом уровне иерархии можно выполнять путем последовательной нумерации слева направо. В общем виде код запишется как ХХХХ, где X – значение десятичного разряда. Структура кода представлена на рис. 1.10.

Рис. 1.10. Пример последовательного кодирования информации

Принятая система кодирования позволяет легко расшифровать любой код, например:

1310 – студенты коммерческого факультета, в возрасте старше 30 лет, мужчины;

2221 – студенты факультета информационных систем, в возрасте от 20 до 30 лет, женщины, имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Оно заключается в следующем: все фасеты кодируются независимо друг от друга и для значений каждого фасета выделяется определенное количество разрядов кода. Парал­лельная система кодирования обладает теми же достоинствами и недостатками, что и фа­сетная система классификации.

Пример 1.13. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 1.8). В качестве алфавита также выберем десятичную систему счисления. Тогда длина любой кодовой комбинации будет определяться количеством фасетов, т. е. равна 4. В отличие от последовательного кодирования для иерархической системы классификации в данном случае не имеет значения порядок кодирования фасетов. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Структура кода представлена на рис. 1.11.

 


 


 

Пол Дети Возраст Факультет
Код Значение Код Значение Код Значение Код Значение
М Есть Моложе 20 лет Коммерческий
Ж Нет От 20 до30 лет Информационные системы
    Для мужчин Старше 30 лет    

Рис. 1.11. Пример параллельного кодирования информации

 


Принятая система кодирования позволяет легко расшифровать любой код, например:

2132 – женщины в возрасте старше 30 лет, имеющие детей и являющиеся студен­тами факультета информационных систем;

1021 – мужчины в возрасте от 20 до 30 лет, являющиеся студентами коммерческого факультета.

Регистрационное кодирование используется для однозначной идентификации объектов и не всегда требует предварительной классификации. Различают порядковую и серий­но-порядковую системы регистрационного кодирования.

Порядковая система кодирования предполагает последовательную нумерацию объектов натуральными числами. При этом порядок следования может быть случайным или опреде­ляться после предварительной сортировки объектов (например, по алфавиту). Этот метод применяется в случае, если количество объектов невелико (например, при кодировании названий факультетов университета или студентов в учебной группе).

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии прово­дится порядковая нумерация объектов. При этом каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является комбинированной – классифици­рующей и идентифицирующей. Она применяется в случае, если количество серий невелико.

Пример 1.14. Все студенты одного факультета разбиваются на учебные группы (серии), для которых используется порядковая нумерация. Внутри каждой группы проводится сортировка фамилий студентов по алфавиту и каждому студенту присваивается порядковый номер.

КЛЮЧЕВЫЕ ПОНЯТИЯ

 


Адекватность информации

База данных

Виды информационных услуг

Глубина классификации

Данные

Дескриптор

Дистанционный доступ

Информатизация общества

Информатика

Информационная индустрия

Информационная культура

Информационная революция

Информационная услуга

Информационное издание

Информационное общество

Информационные коммуникации

Информационный кризис

Информационный объект

Информационный продукт

Информационный ресурс

Информация

Кибернетика

Классификатор

Классификационный признак

Классификация

Код

Кодирование

Количество информации

Коэффициент информативности

Мера информации:

прагматическая

семантическая

синтаксическая

Объем данных

Ретроспективный поиск информации

Реквизит

Свойство информации:

актуальность

достаточность

достоверность

доступность

репрезентативность

своевременность

содержательность

точность

устойчивость

Связь между дескрипторами:

ассоциативная

родо-видовая

синонимическая

Система классификации:

дескрипторная

иерархическая

фасетная

Система кодирования:

классификационная

параллельная

последовательная


регистрационная

порядковая

серийно-порядковая

Словарь дескрипторов

Тезаурус

Услуга

Фасет

Форма адекватности

прагматическая

семантическая

синтаксическая

Энтропия системы

 


ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ

1. Расскажите об информационных революциях в истории развития цивилизации.

2. Как вы себе представляете информационное общество?

3. В чем проявляется информационный кризис?

4. В чем состоит процесс информатизации?

5. Дайте определение информационной культуре. Как она проявляется?

6. Охарактеризуйте информационный ресурс, информационный продукт, информацион­ную услугу. Приведите примеры.

7. Как вы понимаете базу данных?

8. Расскажите о классификации основных видов информационных услуг.

9. Как и для чего появилась информатика?

10. Расскажите об информатике как об отрасли производства, как о науке, как о прикладной дисцип­лине.

11. Укажите цель и задачи информатики.

12. В чем различие информации и данных?

13. Что такое адекватность, и в каких формах она проявляется?

14. Какие существуют меры информации, и когда их следует использовать?

15. Расскажите о синтаксической, семантической, прагматической мерах информации.

16. Какие существуют свойства информации?

17. Что такое система классификации информации?

18. Основные идеи иерархического, фасетного, дескрипторного методов классификации. Примеры.

19. Что такое система кодирования информации? Классификация методов.

20. Что такое классификационная и регистрационная системы кодирования? Приведите примеры.

21. Сопоставьте назначения системы классификации и системы кодирования.