Источниковедение и квантитативная история. Количественные методы исследования массовых источников

Историки часто имеют дело с источниками, в которых объем содержащихся сведений чрезвычайно велик: с материалами переписей и социологических обследований, делопроизводственной документацией и т.п. Подобные источники содержат наряду с непосредственно выраженной в исходных данных и скрытую информацию, характеризующую взаимосвязи между явлениями исторической действительности. Такие источники принято называть массовыми.

Интерес к массовым источникам в отечественной науке стал особенно заметен с середины XX в., однако до сих пор не существует общепринятого определения этого понятия. В 1964 г. Б. Г. Литвак предложил понимать под массовыми "источники, которые имеют или которым можно придать сравнительно разработанный формуляр, что даст возможность содержащиеся в них отдельные частные факты, сами по себе имеющие ограниченную для исторического исследования ценность, подвергнуть статистической или иной обработке и научной группировке для получения данных обобщающего характера". В 1965 г. Б. Г. Литвак уточнил это определение в статье, написанной в соавторстве с Μ. П. Губенко: "Под массовыми источниками мы разумеем такие документы, которые отражают единичный факт или явление, сами по себе имеющие ограниченный интерес, но в совокупности позволяющие выяснить ту или иную закономерность". Авторы подчеркивали, что по своей форме подобные документы представляли определенный формуляр или его зачатки.

В 1979 г. в монографии "Очерки источниковедения массовой документации XIX – начала XX в." Б. Г. Литвак вновь обратился к определению массовых источников, предложив относить к таковым документы, "само возникновение которых связано с повседневностью во всех ее проявлениях, с элементарной необходимостью фиксации этих проявлений, будничных сторон социальной жизни". Ученый выделил признаки массовых источников: ординарность обстоятельств происхождения; однородность, аналогичность или повторяемость содержания; однотипность формы, тяготеющей к стандартизации. Таким образом, наличие достаточно большого количества единиц наблюдения Б. Г. Литвак не считал определяющим признаком. Из числа массовых источников исключалась статистика на том основании, что статистическое наблюдение "не имеет никакой научно-статистической заданности, не имеет цели изучить данное явление или факт, а только регистрирует его или спонтанно возникает как часть этого факта".

С конца 1970-х гг. все больше сторонников стала приобретать точка зрения И. Д. Ковальченко, согласно которой массовыми являются источники, характеризующие такие объекты действительности, которые образуют определенные общественные системы с соответствующими структурами. Массовые источники отражают сущность и взаимодействие массовых объектов, составляющих эти системы, а следовательно, строение, свойства и состояние самих систем. Этот подход позволяет признать массовыми источниками не только отдельные документы, отражающие единичные факты или явления, но и содержащие факты обобщенные, такие как статистика (в том числе статистические публикации), материалы личного учета, документы с разработанными формами и другие подобные, а также нарративные источники (после "частотных, классификационных преобразований"). Подобное понимание стало преобладающим в отечественной историографии.

Таким образом, согласно точке зрения Б. Г. Литвака, принадлежность источников к массовым следует из их собственной структуры, а также функций и особенностей бытования.

Согласно концепции И. Д. Ковальченко источники относятся к массовым, исходя из потребностей исследователя в информации о массовых явлениях: массовым является тот источник, который такую информацию предоставляет. Различие двух подходов не ограничивается спецификой массовых источников, а выводит на две модели источника: источник как система, обладающая независимыми от исследователя структурой и функциями, и источник как оболочка для множества данных. Общепринятой точки зрения по данному вопросу не существует.

Мнение

Μ. Φ. Румянцева утверждает, что определение школы И. Д. Ковальченко почти не принимает во внимание природу массовых источников, так как речь идет только об особенностях отражаемых ими явлений. Это соответствует источниковедческой парадигме, в которой в качестве исторического источника понимается все, что дает информацию о прошлом человеческого общества. В таком случае возникает вопрос: что должен представлять из себя предмет, чтобы он мог дать информацию об историческом событии и какими должны быть источники для того, чтобы они давали информацию о массовых явлениях? Μ. Ф. Румянцева также критикует включение в число массовых источников статистических материалов на том основании, что в них приводится множество цифр, а статистика может искажать явление до полной неузнаваемости. По ее мнению, критерий отнесения источников к массовым – их качественная, а не количественная характеристика: "Массовость не тождественна множественности, понятие массовости противостоит не понятию единичности, а понятию уникальности исторического источника". В связи с этим источники относятся к массовым, если они возникли в повседневной жизни, имеют однородное ОГЛАВЛЕНИЕ и форму, тяготеющую к стандартизации.

По степени формализации среди массовых источников условно могут быть выделены:

1) формализованные источники – документы, имеющие стандартные разработанные формы, идентичные или близкие к статистическим (анкеты, листки по учету кадров, описи имущества и т.п.), а также результаты их обработки;

2) полуформализованные источники – документы, которые не имеют разработанной формы, но описывают стандартные ситуации и положения (характеристики, автобиографии, жалобы, письма в газеты и пр.);

3) неформализованные источники – документы эпистолярного и мемуарного жанра.

Мнение

Закономерен вопрос: можно ли использовать понятие "массовый источник" но отношению к документам с нетрадиционными носителями информации, например, аудиовизуальным, звуковым и др.?

В. М. Магидов считает, что это вполне возможно, если пойти по пути более универсальной трактовки понятия, согласно которой массовые документы не являются какой-то особой разновидностью, поскольку их формальные характеристики в определенной мере присущи всем историческим источникам. Иначе говоря, ученый ставит вопрос не о массовых источниках, а о массовой информации, заключенной в различных типах источников, в том числе управленческой, научно-технической документации, кино-, фото- и фонодокументах и др.

В. М. Магидов отмечает, что кино-, фото- и фонодокументам присущи некоторые черты, благодаря которым их можно условно отнести к категории массовых источников: широта документирования событий и явлений, большой объем производства, возможность тиражирования, доступность, универсальность их воздействия па духовный и эмоциональный мир человека. Отдельно взятый фильм, фотография, радиопередача повседневно отражают выборочные события или факты, не составляющие достаточно полной картины об определенном историческом периоде. Однако в совокупности они позволяют выявить закономерности развития общества, которые возможно определить только посредством документов, несущих массовую информацию.

В зарубежной исторической науке отсутствует термин "массовые источники", и существует понятие "массовые данные" (mass data). Проблемы работы с этими данными сводятся к особенностям их обработки с помощью современных информационных технологий. По мнению И. Д. Ковальченко, источник – система более высокого уровня, а данные – подсистема, возникшая в результате целенаправленной исследовательской деятельности.

Для эффективного использования и широкого вовлечения в научный оборот массовых источников требуется применение специальных методов. Необходимая исследователю информация может быть получена в ходе описательного и (или) количественного анализа. В нервом случае историк часто вынужден оперировать весьма приблизительными оценками ("больше – меньше", "медленно – интенсивно"), особенно если речь идет об изучении "неуловимых" проблем истории: общественного мнения, религиозности, мотивации поведения и т.п. Очевидно, что существует потребность в более точном выражении этих проблем, т.е. в выявлении их количественной меры.

Количественный анализ также становится необходимым для выявления скрытой в источнике информации и повышения тем самым его информационного потенциала.

Количественный анализ – выявление и формирование системы численных характеристик изучаемых объектов, явлений и процессов действительности, которые в ходе математической обработки создают основу для раскрытия количественной меры соответствующего качества. Таким образом, количественные методы не противостоят качественным, а могут стать закономерной составной частью исследования.

Считается, что первые опыты применения количественных методов для обработки исторических материалов относятся к 1660-м гг., когда английские "политические арифметики" Д. Граунт и В. Петти попытались проанализировать данные демографии. Одним из основоположников источниковедения массовой документации в России можно считать Д. П. Журавского (1810–1856), который в работе "Об источниках и употреблении статистических сведений" (Киев, 1846) воспользовался естественной формализацией содержания документов для статистического обобщения имеющейся в них информации.

Активное использование количественных (математико-статистических) методов анализа исторических источников началось со второй половины XIX в., когда стали применяться простейшие статистические методы (группировка, расчет показателей вариации и др.). Однако особый интерес к ним возник в связи с развитием вычислительной техники в XX в. В науке сформировалось особое направление, получившее название квантитативная история.

Квантитативная (от англ. quantity – количество) история (в отечественной историографии 1960–1990-х гг. использовался также термин "количественные методы в исторических исследованиях") – междисциплинарное научное направление, представляющее собой совокупность концепций и средств формализации и анализа информации исторических источников с помощью математических методов.

Французский ученый Ле Руа Ладюри под впечатлением от происходивших во второй половине XX в. в исторической науке дискуссий о месте квантитативной истории в системе наук записал: "Либо историк будет программистом, либо не будет никем". В СССР в 1960-е гг. также были сконструированы универсальные ЭВМ такого масштаба, что позволяли ведущим научным коллективам создавать у себя вычислительные центры. Сильная школа квантитативной истории сложилась на базе МГУ благодаря усилиям И. Д. Ковальченко. В 1968 г. в составе отделения истории Академии наук СССР была создана Комиссия по применению ЭВМ и математических методов в исторических исследованиях.

Квантитативная история развивалась на основе идеи точного, верифицируемого измерения информации и последующего ее статистического анализа, и на начальном этапе предполагалось автоматическое разрешение с помощью ее методов многих спорных проблем истории, что дало повод позднее назвать этот этап романтическим.

В рамках квантитативной истории могут быть решены несколько научных проблем, в том числе:

создание и сопровождение архивов машиночитаемых данных,

– восстановление истории семей;

статистический анализ данных,

– изучение текстов;

– моделирование исторических процессов и явлений.

Работа с массовыми источниками имеет свою специфику. Очевидно, что создать единую методику вряд ли возможно, поскольку каждый из источников имеет свои особенности формализации, пределы информативности. Однако некоторые аспекты методики работы с массовыми источниками имеют общезначимый характер.

Исходная задача источниковедческого изучения массовых источников – выявление их комплексов, характеризующих различные стороны, явления и процессы исторической действительности. Сложность в том, что нередко массовые данные собирались различными ведомствами, по неодинаковым программам и различными методами. Некогда упорядоченные комплексы документов оказались разрозненными, утраченными и пр. В связи с этим для их выявления и систематизации надо проделать значительную работу.

Важнейшей задачей источниковедческого анализа массовых источников является установление репрезентативности (представительности) содержащихся в них данных. Необходимо проверить представительность данных в количественном отношении, т.е. насколько они равномерно охватывают совокупность объектов и их разновидности, а также выяснить, насколько заключенные в них сведения позволяют раскрыть суть исследуемых явлений и процессов.

Существенной является проверка сопоставимости в пространстве и времени данных массовых источников, поэтому выяснение целей, программ и методов сбора информации об изучаемых объектах играет важнейшую роль.

Специфика массовых источников состоит в том, что при работе с ними необходимо стремиться к положению, при котором результаты их статистического анализа могли быть использованы для сравнительной характеристики аналогичных явлений (в соседних регионах, других хронологических периодах). Иными словами, каждый индивидуальный исследовательский результат должен совмещаться с другими индивидуальными результатами. Если результат такой способностью не обладает, наука в целом получает только иллюстративный эмпирический материал. В связи с этим особое значение придается выбору и корректному описанию применяемых количественных методов.

Основные этапы источниковедческого изучения массовых источников:

1) постановка исследовательской задачи;

2) выявление и отбор источников; их репрезентативность (представительность) определяется тем, в какой мере показатели отражают те черты и свойства, которые характеризуют внутреннюю суть изучаемых явлений и процессов (качественная репрезентативность), а также достаточностью для получения надежных признаков (количественная репрезентативность);

3) выбор количественного метода;

4) математическая обработка и анализ количественных данных;

5) интерпретация полученных результатов.

Основные методы квантитативной истории:

методы дескриптивной статистики (для статистического описания совокупности объектов);

выборочный метод (для оценки параметров генеральной совокупности по выборочным данным);

корреляционный и регрессионный анализ (для анализа взаимосвязей);

кластерный и факторный анализ (для классификации объектов или признаков);

контент-анализ (для анализа содержания документальных источников).

Применяются также эконометрические методы, методы спектрального анализа, теории игр, методы визуализации и моделирования, концепции синергетики и др.

Активное развитие электронно-вычислительной техники в последние десятилетия способствует тому, что обработка массовых источников в настоящее время все чаще проводится с использованием информационных технологий (подробнее ^ 3.8). В частности, историки получили возможность использовать различные виды программного обеспечения, в том числе:

– статистические пакеты (STATISTICA для Windows, Statgraphics, SPSS и др.) для анализа статистических источников и источников с неколичественной информацией;

– электронные таблицы (Lotus 1-2-3, Quattro Pro, Excel и др.) для работы со статистическими источниками, которые представлены в форме таблиц;

– системы управления базами данных (DBASE, FoxPro, Paradox и др.) для обработки статистических источников, структурированных массовых источников, имеющих единый формуляр (метрические книги, личные дела, анкеты и др.), текстовых (нарративных) источников.

Обращение к количественным методам позволило перенести центр тяжести с изучения отдельных исторических событий и процессов на исследование историко-типологических структур (этноконфессиональная, социальная структура общества, имущественные, аграрные отношения), а также на раскрытие через статистические тенденции закономерностей массовых общественных явлений.