Информация, данные методы.

До настоящего времени не существует единого мнения, что такое информация. Так, С.А.Христочевский (2001) считает, что для человека существенно прежде всего содержание, смысл сообщения, сигнала, а для ПК смысловой аспект безразличен. В связи с этим смысловой аспект сообщения – это и есть информация. Все технические системы имеют дело с данными, представленными в том виде, который реализован аппаратными и программными средствами этих систем. Следовательно, при взаимодействии человека с техническими системами необходимо обеспечить преобразование (трансформацию) информация – данные, данные – информация.

Иными словами, можно сказать, что в ПК информация всегда представляется с помощью данных, кодирующих ее по какому-то правилу. В процессе решения задачи нужно обязательно иметь в виду следующие этапы преобразований:

· исходная информация – данные;

· данные – данные (то есть обработка данных по какому-то алгоритму);

· данные – выходная информация.

Совершенно иной взгляд на информацию предлагает С.В.Симонович (2000). По его мнению информация – продукт взаимодействия данных и адекватных методов. Из этого следует:

1. Информация – динамический объект. Она существует только в момент взаимодействия данных и методов. Все прочее время она пребывает в состоянии данных. Следовательно, информация существует только в момент протекания информационного процесса. Все остальное время она содержится в виде данных.

2. Одни и те же данные в момент потребления могут поставлять разную информацию в зависимости от степени адекватности взаимодействующих с ними методов.

Пример. Для человека, не владеющего китайским языком, письмо из Пекина дает минимум информации. Использование адекватных методов – максимум информации.

3. Данные являются объективными, поскольку это результат регистрации объективно существующих сигналов. В то же время методы являются субъективными.

В основе искусственных методов лежат алгоритмы. В основе естественных методов лежат биологические свойства субъектов информационного процесса. Следовательно, информация возникает и существует в момент диалектического взаимодействия объективных данных и субъективных методов.

По мнению А.Н.Макаровой (1998) наряду с информацией в информатике используется термин «данные».

Данные – признаки или записанные наблюдения, которые какой-то причине не используются, а только хранятся. Как только данные начинают использоваться для уменьшения неопределенности появляется информация.

Пример: продаются диски с базами данных: номера телефонов, фамилии их владельцев пр. – это данные. Если нужно найти конкретный номер телефона конкретного человека – обращаемся в базу и находим нужное. Это – информация.

Меры информации и данных

При оценке информации различают три аспекта: синтаксический, семантический и прагматический.

Синтаксический аспект связан со способом представления информации вне зависимости от ее смысловых и потребительских качеств и рассматривает формы представления информации для ее передачи и хранения (в виде знаков и символов). Данный аспект необходим для измерения информации. Информацию, рассмотренную только в синтаксическом аспекте, называют данными.


Семантический аспект передает смысловое содержание информации и соотносит ее с ранее имевшейся информацией.

Sп - тезаурусная мера получателя; Ic - семантическое количество информации.

Прагматический аспект передает возможность достижения цели с учетом полученной информации.

где P0 - вероятность достижения цели до получения информации; P1 - вероятность достижения цели после получения информации; Iп - прагматическое количество информации; а > 1.

Виды информации:

1. Научная информация (наиболее полно отражает объективные закономерности природы, общества и мышления);

2. Информация управления:

а) производственная, связанная с управлением людьми;

б) техническая, связанная с управлением техническими объектами.

Также классификация информации может производиться по областям применения:

а) политическая;

б) техническая;

в) педагогическая;

г) физическая;

д) экономическая и др.;

2. По назначению:

а) массовая;

б) специальная.

Для измерения информации используются два параметра

· объем данных;

· количество информации.

В чем различие этих мер? Объем данных оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.

Количество информации отражает меру смыслового содержания информации.

Объем данныхв сообщении измеряется количеством символов (разрядов). В двоичной системе счисления единица измерения – bit (бит).

Для измерения объема данных эту единицу предложил Клод Шэннон.

Бит – наименьшая единица объема данных в двоичном коде.

Термин bit– это аббревиатура, состоящая из двух английских слов (binary digit) – двоичная цифра.

Идея использования лишь двух символов для кодирования информации стара, как мир. Барабаны африканских бушменов передают сообщения в виде комбинации звонких и глухих ударов. Азбука Морзе также представляет собой пример двухсимвольного кодирования информации (точки и тире).

Двоичное представление чисел – не единственная альтернатива десятичной системе счисления. Древняя вавилонская арифметика основана на числе 60, а в привычках и языке англосаксов мы обнаруживаем следы двенадцатеричной системы счисления, которая когда-то господствовала на Британских островах: 12 месяцев, два 12 часовых периода в сутках. Но победила десятичная система.

Процедура отображения - преобразование информации в вид, удобный для восприятия человеком.

Практически всегда основой кодирования чисел в современной ЭВМ является двоичная система счисления.

Системой счисления называется способ записи чисел при помощи ограниченного числа символов (цифр).

Позиционной системой счисления называется система счисления, при которой число, связанное с цифрой, зависит от места, которое она занимает.

В двоичной системе счисления используется только две цифры: 0 и 1. Бит – очень маленькая единица. Чтобы закодировать один символ, например, английскую букву "а", нужно 8 символов:

01000001 – а 01000010 – в
01000011 – с 01000100 – d
01000101 – e 01000110 – f

 

1 байт = 8 бит

1 Кбайт = 210 = 1024 байт

1 Мбайт = 210 = 1024 Кбайт

1 Гбайт = 210 = 1024 Мбайт

Пример. Перевести в десятичную запись число (10000111)2. Перевести в двоичную запись число 89. Сложить в двоичной записи эти два числа, результат перевести в десятичную запись.

Решение:(10000111)2 =1·27 + 1·22 + 1·21 + 1·20 = 128 + 4 + 2 + 1 = (135)10,(89)10 = 1·26 + 1·24 + 1·23 + 1·20 = (1011001)2,

+ 1011001

11100000,

(11100000)2 =128+64+32=(224)10

 

Таблицы для пересчёта систем счисления:

Степень двойки                
значение разряда байт            
десятичное значения если разряд = 1                
                                 
  байт            
Десятичные значения для разрадов байта                      
десятичное значение байта = 128+32+16+2+1= 179                      
                                 
                                 
значение разряда байт            
десятичное значения если разряд = 1                
                                 
шестнадцатиричное число F   F   FF              
                                 
                                 
№ по порядку
значения разрядов в шестнадцатиричной системе A B C D E F
                                 

 

Для измерения смыслового содержания информации (количества информации ) наибольшее распространение получила тезаурусная мера.

Тезаурус – совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации и тезаурусом пользователя изменяется количество семантической информации, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус.

Максимальное количество семантической информации потребитель приобретает при согласовании ее смыслового содержания со своим тезаурусом, когда поступающая информация понятна пользователю и несет ему ранее неизвестные сведения. По этому вопросу очень четко писал академик И.П.Павлов "… однако во всякий момент требуется известное общее представление о предмете для того, чтобы было, на что цеплять факты, чтобы было с чем двигаться вперед, для того, чтобы было, что предполагать для будущих изысканий".