Вопрос 3. Особенности документального потока

Документальный поток — это совокупность функционирующих в обществе первичных документов. Доступным для использования он становится лишь в процессе его выявления и анализа.

Если поток первичных документов выявляют через его отражение в библиографических пособиях, речь идет о реальномпотоке.

Если изучают документы, отраженные в прикнижных и пристатейных списках литературы, списках публикаций к диссертациям и отчетам НИР, выявляют поток цитированной литературы. Счетчики числа посещений позволяют изучать интенсивность обращения к электронным документам, доступ к которым возможен через компьютерные сети.

Когда осуществляется мониторинг читательского спроса, анализу подлежит поток использованной литературы. Книгоиздатели и книгораспространители изучают поток литературы, приобретенной различными группами граждан.

В практике информационного обслуживания и обеспечения чаще всего обращаются к реальному документальному потоку. Вместе с тем в сложных случаях поиска библиографы издавна практиковали выявление нужной информации через списки литературы к известным читателю публикациям, то есть через поток цитированной литературы. Однако из-за чрезвычайной трудоемкости такой путь избирался крайне редко. Появление указателей (баз данных) «Science Citation Index», «Social Science Citation Index» и «Arts and Humanities Citation Index» изменило ситуацию и сделало эту процедуру гораздо более доступной.

В совокупности поток реальной, цитируемой и использованной литературы рассматривается при проведении библиографических, социолого-науковедческих, исторических, прогностических и др. исследованиях.

Владение методами анализа документального потока позволяет выявлять:

- именно ту социальную информацию, которая предпочтительна для читателей;

- наиболее авторитетные и актуальные материалы;

- уровень информационной обеспеченности отрасли или проблемы;

- направления и темпы развития различных областей научно-практической деятельности;

- вклад отдельных стран, организаций, авторских коллективов в развитие тех или иных областей;

- интегративные связи между отраслями и проблемами. В ходе информационно-библиотечной деятельности чаще всего рассматривают тематическую, типо-видовую, географическую, языковую, издательскую, организационно-фирменную и авторскую структуру потока. В подавляющем большинстве случаев в качестве ведущего, базового избирают признак тематики или отраслевой принадлежности документов, что объясняется спецификой читательских запросов, относящихся к определенной области знания. На этой основе выделяют отраслевой поток или поток документов сквозной, межотраслевой тематики. Далее в пределах отрасли или тематического направления анализируют все другие структуры и, прежде всего типо-видовую, географическую, авторскую.

Однако бывают случаи, когда интерес представляет деятельность каких-либо организаций, авторов или авторских коллективов (например, при составлении биобиблиографических указателей или указателей трудов коллективов), либо состояние книгоиздания. Тогда в качестве основных рассматривают соответственно организационно-фирменную, авторскую и издательскую структуры, а уже в их пределах тематику документов. Это позволяет охарактеризовать профиль и диапазон деятельности организаций (в том числе издательств и редакций журналов) и специалистов.

В процессе информационного обслуживания анализ структуры документального потока позволяет уточнить поисковое задание и критерии отбора публикаций, показывая на работы каких авторов и авторских коллективов, организаций, фирм, стран следует обратить особое внимание. При проведении информационных исследований по особенностям структуры судят о состоянии и направлениях развития самой научно-практической деятельности.

Изучение закономерностей развития документального потока существенно для многих отраслей. Прогнозирование объема документальных фондов и памяти ЭВМ, потребности в кадрах библиотек и информационно-аналитических центров, перспектив полиграфической промышленности, книгоиздания и книгораспространения, обучения в высшей и средней школе — это и многое другое определяется особенностями фиксации и передачи обществу социальной информации, а значит и развитием документального потока. Активные исследования документального потока относятся к началу XX в. и продолжаются в наши дни.

Одной из наиболее ярко проявляющихся закономерностей является рост объема потока, выражающийся в непрерывном увеличении числа вновь создаваемых документов.

В 1956 г. Д. Прайсом была предложена модель экспоненциального (ускоренного) роста потока с удвоением числа публикаций каждые 10-15 лет. Появились понятия «информационный кризис», «информационный взрыв», выражающие опасения, что человечество не справится с лавиной им же порожденного знания. Однако уже к началу 60-х гг. тот же Д. Прайс писал, что экспоненциальный рост потока не продолжается бесконечно, постепенно он приближается к какому-либо пределу, после чего процесс замедляется и останавливается, не достигая абсурдных значений. Были выявлены факторы, ограничивающие рост потока. Это — завершение каких-либо направлений исследований; прекращение ассигнований; кадровые ограничения, приводящие к сокращению числа потенциальных авторов; изменения общественных интересов и т. д.

Установлено, что экспоненциальный рост документального потока по какому-либо определенному актуальному направлению или проблеме характерен для относительно непродолжительного периода времени, после чего стабилизируется, а иногда и затухает. Темпы роста потока неодинаковы как для отдельных отраслей, так и для различных направлений внутри отрасли. В экономике и лингвистике, энергетике и транспорте есть проблемы, развивающиеся чрезвычайно активно, есть — стабильные и затухающие. Поэтому усредненные данные, характеризующие рост документального потока даже в пределах только одной отрасли, не отражают реального положения дел. Пришлось осознать невозможность создания сегодня универсальной модели роста документального потока.

Опыт, накопленный в ходе изучения динамики документального потока, позволил выявить ряд моментов, значимых для информационно-библиотечной деятельности. Так, во-первых, темпы роста потока документов по определенной тематике, определенных стран, организаций, авторов свидетельствуют об актуальности, общественной значимости проблемы и реальном вкладе в ее разработку различных специалистов. Во-вторых, существуют механизмы саморегулирования объема потока, не позволяющие основываться при его изучении лишь на статистических показателях. Такими механизмами выступают: старение информации и способность информации к уплотнению.

Дискретность (прерывистость) фиксации и передачи социальной информации, приводящая к фрагментарности содержания документов, объясняется тем, что сообщения, как правило, создаются по ходу, а не по окончанию исследований, разработок, внедрения новшеств. Причиной такого поведения служит и стремление авторов заявить о своем праве на изобретение или существенное усовершенствование объекта, и необходимость оперативного извещения профессионального сообщества, всего населения о каких-либо событиях или явлениях, и сложность подготовки обобщающих публикаций, и неуверенность в возможности продолжения работы в данном направлении или коллективе.

В результате отдельные документы оказываются как бы встроенными друг в друга, и без знания предыдущих документов читателю не понятен смысл последующих. Но это лишь одно следствие фрагментарности. Другим является дублирование, наличие в документах повторяющихся сведений теоретического и фактического характера, полученных на предыдущих этапах деятельности или почерпнутых из публикаций других авторов.

Задача специалиста по информации — собрать воедино фрагменты знания и представить пользователям сведения о совокупности документов, отражающих реальную картину общественной практики. Одновременно желательно устранить или хотя бы уменьшить дублирование информации. Сложность решения такой задачи связана с тем, что прямые указания на связь между родственными документами часто отсутствуют, и ее приходится устанавливать самостоятельно.

Как уже отмечалось, старение — это объективный процесс утраты социальной информацией и документами, эту информацию фиксирующими, ценностных свойств по мере появления новых, более полных и достоверных сведений. Старение социальной информации и старение документов — явления теснейшим образом взаимосвязанные, но не тождественные. Старение информации заключается в опровержении некоторых взглядов, теорий, замене устаревших методов новыми, в отказе от использования каких-либо процессов или оборудования из-за появления новых. Иначе говоря, устаревает та информация, которая перестает адекватно отражать действительность. Определение темпов старения информации — процесс исключительно сложный, методика же установления темпов старения документов существует и достаточно широко используется.

С этой целью вводят предложенный в 1960 г. Р. Бартаном и Р. Кеблером показатель «полупериод жизни документов», измеряемый временем, в течение которого опубликована половина всех использованных изданий. Обычно полупериод жизни документов вычисляется на основе анализа потока цитированной литературы по какой-либо определенной отрасли или проблеме. Возможно его установление и по данным использования читателями фонда библиотеки, хотя в этом случае точность результата снижается (читатели могли использовать литературу прежних лет издания не потому, что она не утратила актуальности, а из-за отсутствия в фонде библиотек новых публикаций).

Сопоставление полупериода жизни документов различной отраслевой принадлежности, а в пределах отрасли разных типов и видов изданий свидетельствует о том, что:

- в различных отраслях темпы старения документов различны;

- во многих случаях темпы старения документов находятся в прямой зависимости от темпов развития отрасли (именно поэтому, например, чрезвычайно быстро устаревают документы по информатике, радиоэлектронике, авиа- и ракетостроению);

- если отрасли развиваются активно, но вновь создаваемое знание описывает явление природы или имеет отношение к художественному творчеству, документы стареют медленно или вообще не утрачивают своей значимости (литература по архитектуре; с описанием явлений природы, флоры, фауны; месторождений полезных ископаемых; археологических открытий; фольклорных экспедиций и т. д.);

- в пределах одной отрасли макродокументы (монографии, руководства, учебники) устаревают медленнее, чем микросообщения (статьи, тезисы докладов), а теоретические, обобщающие — медленнее, чем документы, содержащие в основном фактические сведения, что и объясняет причины быстрого устаревания справочников и словарей.

Явлению старения противостоит процесс актуализации информации. Это возвращение к активному использованию публикаций прошлых лет, происходящее в связи с переоценкой обществом каких-либо концепций, идей, методов, способов производства. Зачастую причиной такой переоценки становится осознание ошибочности путей, избранных в социальной жизни или науке; получение нового знания, позволяющего иначе взглянуть на опыт предшественников; стремление к рассмотрению проблем в историческом ракурсе. Актуализация проявляется сначала в повышении спроса на изданную литературу прошлых лет, а затем в переиздании этих работ с развернутыми вступительными статьями и комментариями современных авторов.

Рассеяние публикаций — это факт опубликования статей определенной тематики в непрофильных изданиях, то есть в журналах, не имеющих отношения к данной области культуры, науки или отрасли промышленности.

Родоначальником изучения явления рассеяния считается С. Бредфорд. Проанализировав в 20-30-е гг. XX в. распределение статей по электротехнике, геофизике, трению и смазке, он так описал выявленную закономерность: «Если научные журналы расположить в порядке убывания числа помещенных в них статей по какому-либо заданному предмету, то в полученном списке можно выделить ядро журналов, посвященных этому предмету, и несколько групп или зон, каждая из которых содержит столько же статей, что и ядро. Тогда число журналов в ядре и последующих зонах будет относится как 1: п: п2».

Последующие исследования феномена рассеяния для разных областей науки показали, что хотя само это явление наблюдается в потоке статей любой тематики, однако степень концентрации публикаций в ядерной зоне и соотношение числа журналов в зонах везде различны. В связи с этим нет универсальной математической модели, пригодной для описания распределения публикаций и журналов вне зависимости от их тематической принадлежности. И лишь об одной универсальной закономерности можно говорить: о нарастающей сложности поиска информации при стремлении к полноте ее выявления.

Дальнейшие исследования показали, что интенсивность рассеяния зависит от стадии разработки проблемы. На этапе возникновения нового научного направления отсутствие специализированных журналов приводит к рассеянию публикаций. На этапе его становления возникают сначала тематические сборники, а затем и профильные периодические издания. Для этого периода характерна концентрация публикаций. Когда же перед уже сформировавшимся направлением встает задача широкомасштабного внедрения результатов в другие отрасли, инновационные публикации будут помещаться в непрофильных журналах (то есть рассеиваться), а материалы дальнейших исследований проблемы — в специализированных. Для специалистов, интересующихся данным направлением, рассеяние первых публикаций — потеря ценнейшей информации, а рассеяние инновационных сообщений несущественно, так как в них содержатся сведения, уже известные по публикациям в профильных журналах.

Изучая причины и механизмы рассеяния, Д.Ю. Теплов пришел к выводу о целесообразности его рассмотрения как механизма информационного обмена между отраслями. Им экспериментально доказана возможность подразделения отраслей на информационно-активные и информационно-пассивные. К активным относятся те, которые «притягивают» к себе достижения смежных областей и для которых характерна концентрация статей в профильных журналах. Это авиа- и ракетостроение, горное машиностроение, автомобилестроение.

Информационно-пассивными являются отрасли, «отдающие» свои публикации в периодические издания других областей. Ярчайшим примером таких отраслей, для которых характерно рассеяние статей, являются юриспруденция, экономика, история, информатика, автоматика, радиоэлектроника.

Результаты изучения рассеяния оказались еще более интересными, когда начали комплексно анализировать реальные отраслевые потоки и поток цитированной литературы. Причем исследователи совершенно обоснованно подчеркивают практическую значимость, применимость результатов в плане установления:

- связей данной проблемы с другими областями, что важно и для корректировки комплектования фонда, и для определения тематических границ информационного поиска;

- круга продуктивных, то есть публикующих наибольшее число статей по какой-либо проблеме и наиболее используемых журналов;

- рациональной стратегии обслуживания пользователей с обязательным привлечением библиографических изданий при удовлетворении запросов, относящихся к информационно-пассивным отраслям;

- значимости статей через значимость, авторитетность опубликовавших их журналов;

- периода и основных этапов развития научных направлений.

Благодаря проведенным исследованиям было осознано, что чем более интенсивно теории, методы, материалы, оборудование одной отрасли используются в других областях человеческой деятельности, тем более интенсивного рассеяния публикаций следует ожидать и тем важнее обращение к библиографическим пособиям и БД, преодолевающим это рассеяние. Результаты изучения рассеяния-концентрации статей в периодических изданиях различной тематики являются основанием для совершенствования многих информационно-библиотечных процессов.

Значительно более сложным для исследования является рассеяние информации, связанное с такой особенностью социальной информации, как относительная независимость плана содержания от плана выражения. Это означает, что одно и то же содержание может быть зафиксировано в различных знаковых формах: в виде текста, графиков, формул; на разных языках; в терминах разных наук. Для информационного поиска наиболее существенна последняя причина рассеяния. Она объясняет, почему искомое читателем знание часто удается обнаружить в самых неожиданных областях и почему начальная формулировка запроса читателей может значительно отличаться от его окончательной формулировки.

Если рассеяние статей преодолевается универсальными, отраслевыми и межотраслевыми библиографическими пособиями, с рассеянием информации дело обстоит намного сложнее. Требуется осуществление многоступенчатого ассоциативного поиска по предметным рубрикам или ключевым словам с выходом за пределы первоначально обозначенной отрасли, часто с привлечением аппарата ссылок или указателей цитируемой литературы.

Таким образом, знание особенностей структуры и закономерностей развития отраслевых документальных потоков значительно расширяет возможности информационно-библиотечной деятельности.