КОНТЕКСТНО-ЗАДАННАЯ СПЕЦИФИКА АЛГОРИТМА АНАЛИЗА
Специфика приведенного выше примера аналитического разбора сообщения заключается в том, что данный вариант разбора вырван из контекста решаемой аналитиком задачи. Этим обусловлено впечатление перегруженности цикла анализа различными операциями, как правило, неосознанно отбрасываемыми или выполняемыми аналитиком в соответствии классу решаемых задач.
Каждому человеку ежедневно приходится выступать в роли аналитика, но едва ли кому-нибудь удастся припомнить, что ему приходилось проделывать подобные операции над каждым получаемым им сообщением. Очевидно, что алгоритм поведения аналитика при выполнении им задачи анализа сообщений адаптивен, однако на каком же этапе анализа отбрасываются лишние ветви рассуждений?
Действительно, на основании опыта протоколирования реальной аналитической работы, можно сделать вывод о том, что алгоритм работы аналитика действительно выстроен по адаптивной схеме, но не в той области, где это кажется наиболее уместным. Для понимания сообщения в любом случае необходимо, чтобы та часть аналитической работы, в ходе которой аналитик производит разбор рефлексивной структуры, субъект-объектной иерархии и привязку временных шкал соответствующих уровней сообщения, проделывалась им во всех случаях. Нарушение этого требования может привести к нарушению временной, объектной или рефлексивной структуры. Если результат нарушения первых двух (структур) понятен большинству специалистов, некогда осваивавших чтение иностранной художественной литературы, то нарушение рефлексивной структуры может привести к нарушению именно той составляющей сообщения, где наиболее ярко проявляют себя отношения прагматического и эмоционального порядка. То есть в результате ошибок в восстановлении рефлексивной структуры, отношение одобрения может сместиться к осуждаемому объекту и наоборот.
Из этого можно сделать вывод о том, что адаптация и оптимизация алгоритма анализа сообщения производится только на этапе формулирования окончательных выводов. То есть уже тогда, когда аналитик идентифицирует сообщение, его фрагмент или последовательность сообщений с некоторой моделью, ранее сформированной на основании личного или иным образом приобретенного опыта.
Рассмотрение процесса анализа сообщения с точки зрения его алгоритмизации и автоматизации позволяет сделать целый ряд интересных выводов.
1. Исключение транзитивных элементов субъект-объектной, временной и рефлексивной иерархий производится на этапе субъектного (объектного) связывания высказываний в рамках одного сообщения, сеанса информационного взаимодействия или некоторого конечного ансамбля сообщений.
2. Анализ сообщения, содержащего указания на некоторые совокупности субъектов и объектов (как иерархические, так и одноуровневые) может осуществляться циклически с постепенным вовлечением в процесс анализа все новых и новых субъектов и объектов.
3. Одно и тоже сообщение может использоваться более, чем в одном цикле анализа с вовлечением различных наборов субъектов и объектов, ко всему прочему размещенных еще и в различных временных срезах.
4. Эмоциональная окрашенность сообщения может быть выражена в специфическом подборе слов и распространяться как на сообщение в целом, так и на отдельные объекты.
5. Различные эмоциональные акценты, а также специфические термины, используемые для передачи модальных оттенков, могут быть использованы при автоматизированном ранжировании конкурентных сценариев, синтезируемых на основании анализа потока сообщений.
6. Возможность редукции сложных высказываний к лексическим примитивам способна существенно снизить сложность соотнесения отдельных фрагментов сообщения с различными уровнями рефлексивной, субъект-объектной и временной иерархий.
7. Возможность смены уровня абстракции описания сообщения позволяет упростить процедуры распознавания сообщений, относящихся к описанию феноменов сходной природы.
Общим следствием предложенных выше частных выводов является необходимость синтеза и хранения наряду с оригиналом сообщения его описания, построенного с учетом обеспечения возможности синтеза и предварительного анализа сценариев без привлечения оригиналов сообщений. При этом описание сообщения должно быть сформировано с учетом возможности смены уровня абстракции, т. е. с привлечением некоторой стандартизованной иерархической терминологии. Одним из возможных путей реализации такого рода описаний является создание метаязыка, представляющего собой специфическую надстройку над естественным языком человеческого общения, предназначенную для редуцирования высказываний естественного языка. В качестве же вспомогательного инструмента для создания моделей высказываний, допускающих смену уровня абстракции в интересах решения задачи распознавания сценариев и прецедентов, целесообразно использовать пополняемую объектную иерархическую реализацию фрагментов естественного языка.
Использование для представления сообщений метаязыка редуцирования высказываний и объектной иерархической реализации фрагментов естественного языка (объектного иерархического лексикона) позволит привести процесс анализа сообщений к объектной парадигме и упростить процесс синтеза сценариев и ситуационных моделей, сведя его к процессу объединения последовательностей объектов-высказываний, обладающих единым интерфейсом. Такая технология в идеале способна свести этот процесс к примитивным логическим операциям.
Помимо прочего использование стандартизованных интерфейсов объектов-высказываний может обеспечить формальную проверку внутренней и контекстной непротиворечивости.
В данном примере и комментариях к нему основное внимание было сосредоточено на системах, способных осуществлять свои функции с продуцированием и потреблением текстовых массивов. Логическая структура изложения описывается следующей последовательностью:
- классификация информативных признаков сообщений;
- разбор примера сообщения;
- проблемы алгоритмизации аналитической работы.
Ниже приводится перечень наиболее важных положений.
1. В социальных и эргатических системах возможно появление информации, предваряющей событие (изменение состояния системы), что является следствием планового характера деятельности человека.
2. Успешное решение задачи автоматизации информационно-аналитической работы возможно лишь при создании специализированной системы синтеза, хранения и распознавания сценариев, ситуационных моделей и исторических прецедентов.
3. Задача автоматизации этих процессов включает в себя среди прочих задачи автоматизированной предобработки сообщений, таких, как: извлечение временной и субъект-объектной иерархии, классификация, атрибуция, регистрация и редукция сложных высказываний к лексическим примитивам.
4. Решение задач автоматизированной предобработки сообщений является первым шагом на пути к автоматизации процесса синтеза сценариев и ситуационных моделей на основе анализа потоков сообщений СМИ.
5. Предложенное в статье систематизированное описание информативных аспектов сообщений и факторов, обуславливающих их ценность для анализа информации, содержащейся в сообщениях (в том числе и на внешнем по отношению к ним уровне), позволяет унифицировать и алгоритмизировать процесс анализа сообщений СМИ.
6. Одним из крайне важных приложений информации, извлекаемой из сообщений на основе анализа их временной и субъект-объектной иерархий, является формирование портрета инерционных характеристик социальных сред.
7. Вскрытие специфики эмоциональной окраски формулировок в сообщении может способствовать выявлению попыток манипуляции сознанием индивида или группы, т. е. создания «виртуальной реальности» (искаженного информационного поля), в которой они призваны действовать, не считаясь с реалиями.
8. В интересах восстановления системы взаимоотношений между участниками информационного взаимодействия, система хранения должна содержать в себе не только данные и сообщения, но и их оценки, данные с позиций участников модели (например, «конструктивная тенденция», «деструктивная тенденция», «улучшение параметров», ухудшение параметров» и т. д.).
9. Ценность моделей определяется возможностью смены уровня абстракции, что позволяет применять их к ситуациям, обладающим лишь частичным сходством с ранее имевшим место историческим прецедентом.
10. В интересах автоматизации информационно-аналитической деятельности помимо прочих проблем, надлежит решить следующие: проблему создания метаязыка описания сообщений и проблему синтеза объектного иерархического лексикона.
Безусловно, создание систем поддержки информационно-аналитической работы представляет собой комплексную междисциплинарную задачу, требующую совместной работы специалистов различных научных отраслей (таких, как специалисты в области лингвистики текста, информатики, искусственного интеллекта, логики и философии), а также специалистов-практиков, специализирующихся на решении информационно-аналитических задач. Все же, несмотря на существование финансовых затруднений, препятствующих ведению серьезных научно-исследовательских проектов, можно высказать надежду, что необходимый уровень кооперации специалистов, работающих в этой области, будет достигнут. Это позволит приблизиться к успешному решению проблемы автоматизации аналитической работы.
ЛИТЕРАТУРА
1. Конотопов П.Ю. Методика предобработки сообщений средств массовой информации // VII Санкт-Петербургская Международная Конференция «Региональная информатика — 2000» («РИ-2000»), Санкт-Петербург, 5-8 ноября 2000 г.: Тезисы докладов. Часть 2. — СПб., 2000
2. Конотопов П.Ю. Мультипликативная модель генерации сообщений вторичными источниками и проблема фильтрации субъективных оценок // VII Санкт-Петербургская Международная Конференция «Региональная информатика — 2000» («РИ-2000»), Санкт-Петербург, 5-8 ноября 2000 г.: Тезисы докладов. Часть 2. — СПб., 2000
3. Richard S. Friedman. Open Source Intelligence / Parameters. Summer 1998, pp. 159-65. (Review Essay.) [electronic resource] / US Army War College, Carlisle, available on http://carlisle-www.army.mil/usawc/parameters/98summer/sum-essa.htm, 1998.
4. Даллес А. ЦРУ против КГБ. Искусство шпионажа. / Пер. с нем. В.Г.Чернявского, Ю.Д.Чупрова. — серия «Секретная папка». — М.:ЗАО Изд-во Центрполиграф, 2000. — 427 с.
5. Ван Дейк Т.А. Язык Познание Коммуникация. — Благовещенск: БГК им. И.А. Бодуэна де Куртенэ, 2000.
6. Семиотика / В двух томах / Сборник трудов под ред. Ю.С. Степанова. — Благовещенск: БГК им. И.А. Бодуэна де Куртенэ, 1998. — 634 с. — сквозная нумерация страниц.
7. Логический подход к искусственному интеллекту: От модальной логики к логике баз данных / Пер. с франц. Тейз А., Грибомон П., Юлен Г. и др. — М.: Мир, 1998. — 449 с.
Приложение 4
ГЛОССАРИЙ
А
Алгоритм — строго определенная последовательность (или описание последовательности) выполнения операций над некими сущностями, приводящих к заданному результату.
Аналитика — целостная совокупность принципов методологического, организационного и технологического обеспечения мыслительной деятельности, обеспечивающая эффективную обработку информации с целью выработки оптимальных управленческих решений, совершенствования качества имеющегося и приобретения нового знания
Аналитическая реконструкция — воссоздание образа, содержания и внутренней структуры объекта (системы, процесса, явления) и механизмов его функционирования на основе знания взаимосвязей, признаков и следов (результатов) бытия (существования, деятельности) реконструируемого объекта (процесса, явления) с его сущностью
Аппроксимация — процедура, направленная на получение некоторого упрощенного описания (например, математического описания) объекта с заданной точностью (достаточной для проведения данного исследования).
Аспект изучения — обусловленная спецификой целей исследования точка зрения, с которой рассматривается предмет, явление и т. п.
Аттрактор — в моделировании и прогнозировании некоторое состояние к которому устойчиво стремится система при условии нахождения ее параметров в некотором конусообразном коридоре.
Б
Бифуркация (точка бифуркации) — понятие, описывающее неравновесное состояние системы, из которого равновероятным является скатывание к одному из возможных сценариев ее изменения.
В
Верификация — процесс проверки истинности некоторого утверждения с привлечением системы логических выкладок и аксиом, либо методом практической апробации выдвинутых утверждений.
Визуализация данных — процесс отображения данных, их преобразования из внутреннего представления, используемого в ЭВМ, к виду, комфортно воспринимаемому человеком.
Г
Герация — синоним циркуляции. Важнейшее понятие современной науки, характеризующее устойчивое состояние изменчивых процессов по принципу «юлы» (торсион, твистер и др).
Д
Дескриптор — лексическая единица или совокупность лексических единиц, выбранных из единого специализированного словаря, характеризующих основное содержание или тематику некоторого документа или массива документов, используемая для осуществления поиска в дескрипторных информационно-поисковых системах.
Диффамация — опубликование в печати сведений, действительных или мнимых, порочащих кого-либо.
Диссипация — процесс рассеяния чего-либо, перехода элементов системы из связного состояния, в состояние, характеризующееся наличием слабых или полной потерей связей и утратой упорядоченности системы. В диссипативных системах под действием внешних потоков энергии или информации происходят процессы самопроизвольного образования временных когерентных систем (самоупорядочения).
Доктрина — описание общих принципов достижения желаемого результата, не учитывающее факта обеспеченности необходимыми для его достижения ресурсами и не определяющее строгих процедур достижения цели.
Е
Евразийство — культурно-философское и идеологическое течение, исходным тезисом которого является тезис о существовании на территории, примерно соответствующей границам бывшей Российской империи, особенной культурно-исторической общности, существование которой обусловлено процессом взамопроникновения западной (европейской) и восточной (азиатской) культур.
И
Инноватика — наука о нововведениях.
Интерфейс — система или подсистема, реализующая посреднические функции между различными системами; решает задачу взаимно-однозначного отображения множеств специфических сигналов, необходимых для коммуникации между системами.
Информация — 1) снятая неопределенность, связанная со случайными процессами, а также с превращением возможности в действительность; 2) свойство объекта уменьшать неопределенность процесса изменения его состояния во времени; 3) степень модификации структуры входными данными; 4) сведения о лицах, предметах, событиях, явлениях и процессах независимо от формы их представления, используемые в целях получения знаний, принятия решений; 5) степень изменения знания об объекте.
Информационное пространство — совокупность информационных ресурсов, методов и средств доступа к ним, методов, технологий и средств преобразования, обработки и представления информации в виде, наиболее соответствующем потребностям пользователей.
Информационные ресурсы — данные и знания, зафиксированные на соответствующих носителях информации, а также языковые средства, применяемые для описания конкретной предметной области и для доступа к данным и знаниям.
Извлечение знаний — процесс определение взаимосвязей и взаимозависимостей явлений и процессов на основе существующей информации.
Интеркодирование — процесс формирования суждения совершенно определенного человека о содержании сообщения.
Итерация — процесс повторного применения некоторой совокупности операций к некоторому множеству однотипных объектов.
К
Контент-анализ — процедура оценки и интерпретации формы и содержания сообщения, основанная на применении методов математической статистики и математической лингвистики.
Концепция — замысел достижения цели, учитывающий наличие ресурса.
М
Методика аналитического исследования — строго регламентированная система правил, регулирующих порядок, т. е. очередность и последовательность совершения соответствующих операций, применения методов и технологических приемов сбора, обработки и анализа информации.
«Мозгового штурма» метод — возник в 30-е годы как способ продуцирования новых идей; содержит две фазы:1)генерацию идей; 2)оценка и отбор лучших идей; требует раскрепощения мысли, свободы воображения
Н
Нововведение — целенаправленное изменение, которое вносит в среду внедрения (организацию, поселение, общество и т. д.) новые относительно стабильные элементы (как материальные, так и социальные)
Нейронные сети — разновидность систем обработки информации, принцип функционирования которых близок к принципу функционирования нервной системы живых организмов; обладают способностью к обучению на множестве прецедентов, за счет чего могут использоваться как для решения задач распознавания, так и задач прогнозирования; могут быть реализованы как аппаратно, так и программно.
О
Организация — 1) устойчивая упорядоченность качественно изменяющейся системы, то есть процесса; 2) объединение людей, совместно реализующих некоторую программу или цель и действующих на основе определенных процедур и правил.
Оптимизация — интеграция имитационных, управленческих, информационно-аналитических методов для выбора из множества управленческих решений тех из них, которые обеспечивают наиболее эффективное (с точки зрения определенного критерия) продвижение к поставленной цели.
П
Признак объекта исследования — показатель изучаемого объекта, характеризующий его форму и содержание; признаки изучаемого объекта могут быть: количественными и качественными, существенными и несущественными, пространственными и временными, абстрактными и конкретными; в отдельных случаях признак объекта исследования может сам рассматриваться как самостоятельный объект исследования.
Программа исследования — план намеченного исследования, содержащий описание основных задач и целей исследования и перечисление последовательныхдействий, составляю-щих процесс исследования.
Понятие — отражение в словесной форме сущностных признаков предметов, явлений и отношений.
Р
Ранжирование утверждений — метод Q-сортировки и шкалирования путем попарного сравнения; опирается на суждения группы экспертов.
Реферирование — процесс извлечения основного содержания сообщения или документа с использованием совокупности интеллектуальных процедур, основанных на различных методах; может осуществляться как экспертом, так и с применением средств автоматизации.
С
Структура — совокупность устойчивых элементов и взаимосвязей, существующих между элементами системы, обеспечивающих ее целостность и тождественность самой себе, то есть сохранение основных свойств при различных внешних и внутренних изменениях
Т
Творческая деятельность — разработка нового, связанного с изменением и развитием данного объекта, а также разработка принципиально новых объектов, включающих те же или новую функцию.
Ц
Целеполагание — процесс формирования субъектом некоторой системы целей под действием совокупности мотивационных факторов и осознанных потребностей.
Цель исследования — конкретно или в общих чертах сформулированный образ желаемого результата исследовательской деятельности.
Э
Экспертных оценок метод — метод получения знания на основе анализа мнений членов группы экспертов.
Экстраполяция — перенос знаний о прошлых явлениях, закономерностях, основных тенденциях их развития в будущее. Занимает значительное место в прогнозировании, если сроки для проведения прогноза невелики, а быстрота его разработки имеет существенное значение. Во многом базируется на субъективных оценках исследователя и содержит много элементов случайного
Эксформация — информация, претерпевшая специфические изменения в ходе ее усвоения субъектом (то, что понято).
Q
Q-сортировки метод — распределение случаев по 10-бальной шкале с помощью специальных таблиц, а затем процентное шкалирование всех изучаемых случаев
Приложение 5