Гипертекстовые технологии представления текста

Феномен гипертекста можно обсуждать с нескольких точек зрения. С одной стороны, это особый способ представления, организации текста, с другой — новый вид текста, противопоставленный по многим своим свойствам обычному тексту, сформированному в гутенберговской традиции книгопечатания. И, наконец, это новый способ, инструмент и новая технология понимания текста.

 

1.4.1 Историческое замечание. Идея гипертекста связывается с именем Ванневара Буша — советника президента Рузвельта по науке. В. Буш теоретически обосновал проект технической системы «Мемекс», которая позволяла пользователю связывать тексты и их фрагменты по различным типам связей, преимущественно по ассоциативным отношениям. Отсутствие компьютерной техники сделало проект трудно реализуемым, поскольку механическая система оказалась чрезмерно сложной для практического воплощения. Идея В. Буша в 60-е гг. получила второе рождение в системе «Ксанаду» Т. Нельсона, которая уже предполагала использование компьютерной техники. «Ксанаду» позволял пользователю прочитывать совокупность введенных в систему текстов различными способами, в различной последовательности, программное обеспечение давало возможность как запоминать последовательность просмотренных текстов, так и выбирать из них практически любой в произвольный момент времени. Множество текстов со связывающими их отношениями (системой переходов) было названо Т. Нельсоном гипертекстом.

 

1.4.2. Теоретические основания гипертекста. Многие исследователи рассматривают создание гипертекста как начало новой информационной эпохи, противопоставленной эре книгопечатания. Линейность письма, внешне отражающая линейность речи, оказывается фундаментальной категорией, ограничивающей мышление человека и понимание текста. Мир смысла нелинеен, поэтому сжатие смысловой информации в линейном речевом отрезке требует использования специальных «коммуникативных упаковок» — членение на тему и рему, разделение плана содержания высказывания на эксплицитные (утверждение, пропозиция, фокус) и имплицитные (пресуппозиция, следствие, импликатура дискурса) слои. Отказ от линейности текста и в процессе его представления читателю (чтения и понимания), и в процессе синтеза, по мнению теоретиков, способствовал бы «освобождению» мышления и даже возникновению его новых форм.

Прототипический текст — это монолог. Между тем многие лингвисты (и среди них М. Бахтин и Л. Якубинский) указывали на вторичность монолога по сравнению с диалогом. Гипертекст с этой точки зрения позволяет устранить искусственную монологичность текста.

Обычный текст, как правило, имеет автора. Гипертекст автора в традиционном понимании не имеет — у него множество авторов, причем для постоянно изменяющегося гипертекста авторский коллектив также постоянно меняется. Изменение статуса автора меняет и статус читателя: в гипертекстовой системе понимание часто сопровождается изменением компонентов гипертекста или, как минимум, выбором пути просмотра, что опять-таки акт творческий, авторский.

Множественность авторства имеет и еще одно следствие: в гипертексте представлено много точек зрения на проблему, а в обычном тексте — только одна. Именно поэтому гипертекст более объективен и более толе-рантен к читателю, чем классический текст.

Гипертекстовые технологии позволяют легко сочетать различные виды информации — обычный текст, рисунок, график, таблицу, схему, звук и движущееся изображение. Как традиционный текст, так и гипертекст — феномены, порожденные новыми технологиями. В первом случае технология позволила легко тиражировать и распространять знания самых различных типов, а во втором — компьютерные технологии дали возможность изменить сам внешний вид текста и его структуру. Разнородность гипертекста — это первое технологическое свойство гипертекста, технологическое в том смысле, что оно непосредственно следует из используемой компьютерной технологии. Второе технологическое свойство гипертекста — его нелинейность. Гипертекст не имеет стандартной, обычной последовательности чтения. Прочие свойства гипертекста в той или иной степени являются следствиями из этих двух технологических свойств.

Суммировать различия текста и гипертекста можно следующим образом:

• конечность, законченность традиционного текста vs. бесконечность, незаконченность, открытость гипертекста;

• линейность текста vs. нелинейность гипертекста;

• точное авторство текста vs. отсутствие авторства (в традиционном понимании) у гипертекста;

• снятие противопоставления между автором и читателем;

• субъективность, односторонность обычного текста vs. объективность, многосторонность гипертекста;

• однородность обычного текста vs. неоднородность гипертекста.

 

1.4.3. Компоненты гипертекста. Структурно гипертекст может быть представлен как граф, в узлах которого находятся традиционные тексты или их фрагменты, изображения, таблицы, видеоролики и т.д. Узлы связаны разнообразными отношениями, типы которых задаются разработчиками программного обеспечения гипертекста или самим читателем. Отношения задают потенциальные возможности передвижения или навигации по гипертексту. Отношения могут быть однонаправленными или двунаправленными. Соответственно, двунаправленные стрелки позволяют двигаться пользователю в обе стороны, а однонаправленные — только в одну. Цепочка узлов, через которые проходит читатель при просмотре компонентов текста, образует путь или маршрут.

 


A

{текст}

 

B

{фотография}

 

C

{текст}

 

D

{видеоролик}

 

E

{фонограмма}

 

F

{текст}

 

R

{фотография}

 

T

{текст}

 

U

{видеоролик}

 

 

O

{картина}

 

P

{текст}

 

L

{текст}

 

K

{текст}

 

J

{фонограмма}

 

H

{текст}

 

 

I

{текст }


 

Маршруты через узлы В, U, L и Е, О, I соответствуют различным прочтениям гипертекста. Тип чтения гипертекста определяется не только маршрутом, но и качественными характеристиками, связанными с пониманием информации, содержащейся в узлах. Медленное чтение предполагает внимательное знакомство с информацией каждого узла. Часто медленное чтение сопровождается заметками, которые читатель может привязывать к узлам гипертекста. Быстрое чтение — браузинг — наиболее часто используется в информационных системах, основанных на гипертекстовой технологии. При поиске конкретной информации пользователь быстро передвигается по узлам сети, маркируя нужные фрагменты. Для браузинга создается специальная программная поддержка.

Совокупность смежных узлов образует окрестность данного узла. Понятно, что окрестность узла образуют те узлы, в которых содержится информация, близкая по семантике к содержанию данного узла. Узлы сети, в которые входит и выходит много стрелок-отношений, образуют центральную часть гипертекста, а те, которые почти изолированы от других узлов — его периферию.

 

1.4.4. Элементы типологии гипертекста. Первое противопоставление относится к структуре гипертекста. Гипертекст может быть иерархическим или сетевым. Иерархическое — древовидное — строение гипертекста существенно ограничивает возможности перехода между его компонентами. В таком гипертексте отношения между компонентами напоминают структуру тезауруса, основанного на родо-видовых связях. Иерархический гипертекст не реализует всех возможностей технологии гипертекста. В среде разработчиков гипертекстовых систем он не пользуется популярностью (хотя и довольно часто реализуется в работающих системах). Т. Нельсон по поводу иерархического гипертекста писал: «На мой взгляд, иерархии ложны. Они представляют собой слишком сильные упрощения действительности»8). Сетевой гипертекст позволяет использовать различные типы отношений между компонентами, не ограничиваясь отношениями «род—вид».

Второе противопоставление характеризует не саму структуру гипертекста, а возможности программного обеспечения. Здесь различаются простые и сложные гипертексты. Примером простого программного обеспечения гипертекста может служить электронное оглавление документа, которое позволяет перейти к любой части оглавления, минуя этап просмотра всего текста. К простому гипертексту относится и система, которая дает возможность просматривать отсылки к литературе, содержащиеся в тексте, не обращаясь непосредственно к списку литературы. Сложные гипертексты обладают богатой системой переходов между компонентами гипертекста, в них отсутствует представление о базовом тексте, с которым связаны второстепенные по значимости тексты. В некотором смысле нормальный, обычный гипертекст и является сложным гипертекстом.

По способу существования гипертекста выделяются статические и динамические гипертексты. Статический гипертекст не меняется в процессе эксплуатации; в нем пользователь может фиксировать свои комментарии, однако они не меняют существо дела. Для динамического гипертекста изменение является нормальной формой существования. Обычно динамические гипертексты функционируют там, где необходимо постоянно анализировать поток информации, то есть в информационных службах различного рода. Гипертекстовой является, например, Аризон-ская информационная система (AAIS), которая ежемесячно пополняется на 300-500 рефератов в месяц.

Отношения между элементами гипертекста могут изначально фиксироваться создателями, а могут порождаться всякий раз, когда происходит обращение пользователя к гипертексту. В первом случае речь идет о гипертекстах жесткой структуры, а во втором — о гипертекстах мягкой структуры. Жесткая структура технологически вполне понятна. Технология организации мягкой структуры должна основываться на семантическом анализе близости документов (или других источников информации) друг к другу. Это нетривиальная задача компьютерной лингвистики. В настоящее время широко распространено использование технологий мягкой структуры на ключевых словах. Переход от одного узла к другому в сети гипертекста осуществляется в результате поиска ключевых слов. Поскольку набор ключевых слов каждый раз может различаться, каждый раз меняется и структура гипертекста. Жесткость или мягкость архитектуры

8)Цитируется по [Субботин 1994, с. 51].

гипертекста зависит и от количества информации, которая в нем содержится. Если узлов в сети гипертекста порядка одной—трех тысяч, то чаще всего используется жесткая архитектура, если же количество узлов достигает нескольких десятков тысяч или даже миллионов единиц, то мягкая структура оказывается более предпочтительной, поскольку кодировка жестких связей отнимает слишком много времени. Заметим, что структура Интернета часто функционирует как гипертекст мягкой

архитектуры.

Технология построения гипертекстовых систем не делает различий между текстовой и нетекстовой информацией. Между тем включение визуальной и звуковой информации (видеороликов, картин, фотографий, звукозаписей и т. п.) требует существенного изменения интерфейса с пользователем и более мощной программной и компьютерной поддержки. Такие системы получили название гипермедиа или мультимедиа. Наглядность мультимедийных систем предопределила их широкое использование в обучении, в создании компьютерных вариантов энциклопедий. Известны, например, прекрасно выполненные CD-ромы с мультимедийными системами по детским энциклопедиям издательства «Дорлинг Киндерсли».

 

1.4.5. Некоторые гипертекстовые системы. Технологически в основе гипертекста лежат компьютерные программы, которые поддерживают следующие базовые функции:

• обеспечение быстрого просмотра информационного массива (браузинг);

• обработка ссылочных отношений (обращение и вызов фрагмента текста или другой информации, на которую производится отсылка);

• навигация по гипертексту, запоминание маршрута движения; представление пути движения в легко воспринимаемой форме;

• возможность формирования обычного линейного текста как результата движения по гипертексту;

• дополнение гипертекста новой информацией;

• введение новых отношений в структуру гипертекста (для систем с жесткой структурой).

Программные оболочки гипертекста, как правило, универсальны. Они могут использоваться в различных областях для создания тематически разных гипертекстов. Таковы, например, оболочка ZOG и разработанная на ее основе промышленная гипертекстовая система KMS (университет Карнеги-Меллон, США). Сферы применения этих гипертекстовых систем необычайно разнообразны — от работы с документацией и поддержки электронной почты до гипертекстов, предназначенных для экспертов, работающих над бюджетом. Имеются и специализированные системы. Так, система NoteCards (продукт компании «Xerox PARC») предназначена для аналитической работы, а система WE, моделирующая особенности получения нового знания — для помощи в авторской работе. Наиболее популярны в настоящее время программные пакеты HyperCard компании «Apple». Они относительно просты в использовании. Гипертекст в оболочке HyperCard представляется в виде каталожных карточек. Пользователь с помощью довольно простого интерфейса организует структуру карточки и устанавливает связи между карточками. Пакеты HyperCard позволяют сочетать различные типы информации, в частности карточки могут включать графическую, звуковую и др. информацию. Следует отметить, что современные базы данных также включают поля для визуальной и звуковой формы данных (ср., например, базу данных ACCESS 7, работающую в среде Windows). Близка к HyperCard по своим свойствам и программа SuperCard фирмы «Silicon Beach». Некоторые системы гипертекста содержат специальные средства ориентации пользователя в гиперпространстве — карты или закладки, отмечающие наиболее посещаемые узлы гипертекста. Комплексом средств ориентации обладает система Hypergate Writer фирмы «Eastgate Systems Inc».

* * *

Место лингвистов в проектах по созданию гипертекстовых систем не определено еще достаточно четко, но лингвистическая поддержка гипертекстовой технологии необходима. Для гипертекстов с мягкой структурой требуется разработка семантических процессоров, устанавливающих отношения семантической близости между документами в автоматическом режиме. Гипертексты с жесткой структурой требуют установления системы смысловых отношений между компонентами гипертекста, что является одной из важнейших задач лингвистической семантики и лингвистики текста. Особая задача, которая не получила достаточного освещения в литературе по данной проблематике — отбор информации в узлы сети гипертекста. Эта сфера относится как к инженерии знаний, так и к работе лингвиста-прикладника, определяющего какие смысловые связи должны быть оставлены во фрагменте текста, помещаемого в узел системы гипертекста, а какие могут быть «обрублены», элиминированы. Принципы отбора семантических отношений определяются практическими задачами гипертекстовой системы.

Задание 1. Известно, что обычный текст содержит некоторые компоненты, которые в большей степени характеризуют гипертекст. Например, оглавление, аппарат сносок и примечаний — все это инструменты создания нелинейности текста, обеспечения системы нелинейных переходов. Какие элементы гипертекста обнаруживаются в следующих текстах:

• в тексте библии и евангелий;

• в газетной, журнальной и щитовой рекламе;

• в словарях и энциклопедиях;

• в деловых и информационных справочниках типа «Москва — золотые
страницы», «Досуг в Москве и Петербурге».

Задание 2. Многие хорошо известные программные продукты включают элементы гипертекста. Выявите и опишите элементы гипертекста в следующих программах:

• в текстовом редакторе WinWord;

• в операционной среде Windows-95.

 

Основная литература

1.Баранов А. Н. Категории искусственного интеллекта в лингвистической семантике. Фреймы и сценарии. М., 1987.

2.Городецкий Б. Ю. Компьютерная лингвистика: моделирование языкового общения // Новое в зарубежной лингвистике. Вып. XXIV. Компьютерная лингвистика. М., 1989. С. 5-31.

3.Войскунский А. Е. Моделирование мышления // Речевое общение: проблемы и перспективы. М., 1983. С. 16-60.

4.Олкер X. Р. Волшебные сказки, трагедии и способы изложение мировой истории // Язык и моделирование социального взаимодействия. М., 1987. С. 408-440.

5.Поспелов Д. А. Ситуационное управление. Теория и практика. М., 1986. С. 71-83; 99-106.

6.Субботин М. М. Гипертекст. Новая форма письменной коммуникации // ВИНИТИ. Сер. Информатика. Т. 18. М., 1994.

Дополнительная литература

1.Баранов А. Н., Паршин П. Б. Варианты и инварианты текстовых макроструктур (к формированию когнитивной теории текста) // Проблемы языковой вариативности. М., 1990. С. 135-168.

2.Цимбурский В. Л. Макроструктура повествования и механизмы его социального воздействия // Когнитивные исследования за рубежом. Методы искусственного интеллекта в моделировании политического мышления. М., 1990. С. 34-61.