Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии

Компьютерный анализ информационных характеристик текстового учебного материала.

 

Выполнил: ст. гр. И-49 Матвиенко Р.Н.

Проверил: профессор кафедры ИБТКС

В.В. Котенко

 

Таганрог – 2011

Исходные данные.

Вербальная текстовая информация источников:

Блок («1», «Пушкинскому дому», «Скифы», )

Тургенев («отрывок Рудин», «1», «Ася»)

Пушкин («Руслан и Людмила», «Сказка о золотом петушке», «Сказка о рыбаке и рыбке»)

Достоевский («Господин Прохарчин», «Роман в 9 письмах», «Ползунков»)

Гоголь («Нос», «Шинель», «Вий»)

Задание 1. Определение информационных характеристик текстового учебного материала.

 

Рисунок 1 - Информационные характеристики текстовых материалов «Блок - Двенадцать»

Рисунок 2 - Информационные характеристики текстовых материалов «Блок - Пушкинскому дому»

Рисунок 3 - Информационные характеристики текстовых материалов «Блок - Скифы»

Рисунок 4 - Информационные характеристики текстовых материалов «Пушкин - Руслан и Людмила»

Рисунок 5 - Информационные характеристики текстовых материалов «Пушкин - Сказка о золотом петушке»

Рисунок 6 - Информационные характеристики текстовых материалов «Пушкин - Сказка о рыбаке и рыбке»

Рисунок 7 - Информационные характеристики текстовых материалов «Тургенев - отрывок Рудин»

Рисунок 8 - Информационные характеристики текстовых материалов «Тургенев - Один»


Рисунок 9 - Информационные характеристики текстовых материалов «Тургенев - Ася»

Рисунок 10 - Информационные характеристики текстовых материалов «Гоголь - Нос»

Рисунок 11 - Информационные характеристики текстовых материалов «Гоголь - Шинель»

Рисунок 12 - Информационные характеристики текстовых материалов «Гоголь - Вий»

Рисунок 13 - Информационные характеристики текстовых материалов «Достоевский - Господин Прохарчин»

Рисунок 14 - Информационные характеристики текстовых материалов «Достоевский - Ползунков»

Рисунок 15 - Информационные характеристики текстовых материалов « Достоевский - Роман в 9 письмах»

Таблица 1-Информационнаяемкость, энтропия и избыточность заданных текстовых учебных материалов.

Автор Произведение Инф. емкость Энтропия Избыточность
Блок Двенадцать 9,7912 3,864 5,9272
Скифы 8,6724 7,7046 0,9678
Пушкинскому дому 7,6724 7,2339 0,4385
Пушкин Руслан и Людмила 12,0771 10,9402 1,8591
Сказка о золотом петушке 9,5527 8,3389 1,2138
Сказка о рыбаке и рыбке 9,2143 7,9827 1,2316
Гоголь Вий 12,4071 10,1501 2,2573
Шинель 12,014 9,8628 2,1512
Нос 11,7932 9,6037 2,1895
Тургенев Ася 12,641 10,1981 2,3474
Рудин 12,6865 9,9683 2,5335
Один 12,8162 4,7281 7,8971
Достоевский Господин Прохарчин 12,0526 9,3946 2,658
Ползунков 11,1662 8,8081 2,358
Роман в 9 письмах 10,9031 9,2657 1,6374
Матвиенко Автобиография   8,1898 7,3282 0,8616
             

 

Таблица 2Диапазон изменения и средние значения информационной емкости, энтропии и избыточности заданных текстовых учебных материалов.

Автор Инф. Емкость (букву добавить) Энтропия Избыточность Среднее значение емкости Среднее значение энтропии Среднее значение избыточности Диапазон изменения емкости Диапазон изменения энтропии Диапазон изменения избыточности
Блок 9,7912 3,864 0,9272 8,712 6,2675 0,7778 8,8704 - 9,5925 3,864 – 7,7046 0,4385 – 0,9272
8,6724 7,7046 0,9678
7,6724 7,2339 0,4385
Пушкин 12,0771 10,9402 1,8591 10,281 9,087 1,435 9,2143 - 12,7993 7,9827 - 10,9402 1,2138 - 1,8591
9,5527 8,3389 1,2138
9,2143 7,9827 1,2316
Гоголь 12,4071 10,1501 2,2573 12,071 9,872 2,199 10,5718 - 12,0771 9,6037 - 10,1501 2,1512 - 2,2573
12,014 9,8628 2,1512
11,7932 9,6037 2,1895
Тургенев 12,641 10,1981 2,3474 12,715 8,298 4,259 11,0641 - 11,8162 4,7281 - 10,1981 2,3474 - 7,8971
12,6865 9,9683 2,5335
12,8162 4,7281 7,8971
Достоевский 12,0526 9,3946 2,658 11,374 9,156 2,218 10,9031 - 12,4841 8,8081 - 9,3946 1,6374 - 2,658
11,1662 8,8081 2,358
10,9031 9,2657 1,6374
Матвиенко (Автобиография) 8,1898 7,3282 0,8616 8,1898 7,3282 0,8616 8,1898 7,3282 0,8616

Задание 2. Определение коэффициентов избыточности и вербальности.

Коэффициенты избыточности и вербальности рассчитываются по результатам, полученным в задании 1, согласно формулам:

Таблица 3-Коэффициенты избыточности и вербальности.

Автор Диапазон Диапазон
Блок 0,1364 - 0,1648 4,9359 - 6,3333
Пушкин 0,127 - 0,1452 5,8847 - 6,87
Гоголь 0,1905 - 0,201 3,9761 - 4,2486
Тургенев 0,1714 - 0,1959 4,1048 - 4,833
Достоевский 0,1502 - 0,2112 3,7353 - 5,6588
Матвиенко (Автобиография) 0,0507 - 0,0817 1,9353 - 2,5898

Задание 3. Информационный анализ текстового учебного материала.

По результатам, полученным в задании 2 рассчитать формулы:

Таблица 4-Средние значения результатов идентификации.

Автор Вmax В В В
Блок 9,3081 7,8465 0,157 5,3684
Пушкин 10,5221 9,0872 0,1364 6,333
Гоголь 11,2263 9,0223 0,1963 4,0936
Тургенев 11,5222 9,4359 0,181 4,5228
Достоевский 11,5178 9,3269 0,1902 4,2571
Автобиография 8,1898 8,1898 0,0662 2,2626

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии.

Рисунок 16 – Информационные спектры «Автобиография», «Блок – Двенадцать».

Рисунок 17 - Информационные спектры «Автобиография», «Гоголь – Вий».

Рисунок 18 - Информационные спектры «Автобиография», «Достоевский – Ползунков».

Рисунок 19 - Информационные спектры «Автобиография», «Пушкин – Сказка о рыбаке и рыбке».

Рисунок 20 - Информационные спектры «Автобиография», «Тургенев – Один».

Выводы:

1. Результаты проведенных исследований показывают, что каждому источнику текстовой вербальной информации соответствует строго определенные информационная емкость, средняя энтропия, средняя избыточность, средний коэффициент избыточности и средний коэффициент вербальности. Эти значения могут использоваться в качестве идентификаторов источников.

2. Каждому источнику текстовой вербальной информации соответствует строго определенные информационная емкость, средняя энтропия, средняя избыточность, средний коэффициент избыточности и средний коэффициент вербальности. Эти значения могут использоваться в качестве идентификаторов источников.

3. Применение в качестве идентификаторов полученных значений открывает возможность многофакторной идентификации источников вербальной информации.

4. Сравнение ширины спектра показало, что у писателей все показатели текстовой вербальной информации выше, чем у меня.