Приемы качественно-количественного анализа документов
Основная трудность при работе с доступными (т. е. нецелевыми) документами — умение читать данные на языке гипотез исследования. Ведь документ был составлен вовсе не для того, чтобы проверить гипотезы социолога. Поэтому, прежде чем анализировать документальные материалы по существу, социолог вынужден проделать утомительную работу поиска в документе индикаторов (признаков) ключевых понятий исследования.
Качественный анализ документов — необходимое условие для всех количественных операций. Но прежде следует заметить, что квантификация текстов далеко не всегда целесообразна.
В каких случаях не следует прибегать к количественному анализу? Видимо, это неразумно, если мы имеем дело с уникальными документами, где главная цель изучения — всесторонняя содержательная интерпретация материала. Не следует обращаться к количественному анализу, если перед нами описания весьма сложных явлений, если документальных данных недостаточно для массовой обработки или они неполные (нерепрезентативн ы).
Когда количественный анализ текстов уместен? Прежде всего, отмечает один из основателей этого метода Б. Берельсон [315], если требуется высокая степень точности при сопоставлении однопорядковых данных. Далее, когда достаточно много материала, чтобы оправдать усилия, связанные с его количественной обработкой, и если этот материал репрезентирует области изучения. Квантификация необходима, когда текстового материала не только достаточно, но столь много, что его нельзя охватить без суммарных оценок. Квантификация возможна при условии, что изучаемые качественные характеристики появляются с достаточной частотой.
Наиболее целесообразно использовать количественный анализ, если квантифицированные тексты сопоставляются с иными, также количественными характеристиками. Например, выраженные в статистических распределениях особенности содержания газетных сообщений сопоставляются с численностью подписчиков, их мнениями об этих материалах, тоже выраженными в числах.
Квантификация текстового материала получила весьма широкое распространение, и в 40-х гг. для нее была разработана специальная процедура, названная "контент- анализ".7
7 Вместе с тем, как отмечал В. Е. Семенов [239. С. 42], еще в 20— 30-е гг. количественные способы анализа текстов начали применять отечественные исследователи (социологи и психологи): В. А. Куэмичев, Н. А. Рыбников, И. Н. Шпилърейв, которые, однако, не ставили целью разработку детальной техники этого метода.
Контент-анализ — это перевод в количественные показатели массовой текстовой (или записанной на пленку) информации с последующей статистической ее обработкой. Его основные операции были разработаны американскими социологами X. Лассуэллом и Б. Бе-рельсоном [343, 315]. Важный вклад в развитие процедур контент-анализа внесли российские и эстонские социологи, особенно А. Н. Алексеев, Ю. Вооглайд, П. Виха-лемм, Б. А. Грушин, Т. М. Дридзе, М- Лауристинь.
Основные процедуры контент-анализа. Контент-анализ начинается с выявления смысловых единиц, в ка-честве которых используют:
(а) Понятия, выраженные в отдельных терминах. Это могут быть понятия из области экономики: формы собственности, приватизация, финансовая система, денежное обращение, технический прогресс, методы хозяйствования, оптимизация управления и др.; термины политического содержания: правящие круги и оппозиция, интернационализм или национализм, авторитаризм, демократия, международное сотрудничество, консенсус, конфликт интересов; нравственные или правовые символы: права человека, гуманизм, активность, инициативность, деловая предприимчивость, нарушение законности, преступность, коррупция; научные: модель, система, космическое пространство и т. п. Очевидно, что анализ текста по содержанию понятий несет немало важной социальной информации. Например, по частоте употребления понятий, связанных с наукой и новой техникой, можно определить, в какой мере источник информации ориентирован на научно-техническую модернизацию.
(б) Тема, выраженная в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т. п.
По тематике можно еще более полно представить содержание документа. Темы развертывания инициативы и предприимчивости, борьбы с бюрократизмом и сверхцентрализацией, соблюдения прав человека и законности, социальной справедливости, гражданского мира и согласия или же тематика укрепления государственности, централизма, дисциплины и борьбы со всяческими врагами как лидирующая проблематика средств массовой информации очень показательны для определения их политико-идеологических позиций. Столь же показательны сюжеты из личных документов, например, писем о самом себе или о своих близких, о делах производственных и политике, об искусстве и т. п. Все это — свидетельства определенной направленности взглядов, интересов, ценностных ориентации и норм деятельности.
(в) Имена исторических личностей, политиков, выдающихся ученых и деятелей искусства, организаторов производства, лидеров движений и партий, наименования общественных институтов, организаций и учреждений.
Эти характеристики могут свидетельствовать о влиянии отдельных лиц или представляемых ими социальных институтов, сообществ, групп на общественное мнение. По числу ссылок на отдельных авторов определяют значимость той или иной научной идеи: если число ссылок растет или падает, это свидетельствует о росте или падении авторитета данной концепции. По частоте упоминаний общественных движений или их лидеров легко заключить о влиятельности этих движений.
(г) Целостное общественное событие, официальный Документ, факт, произведение, случай и т. п. несут специфическую смысловую нагрузку и тоже могут быть приняты за единицу анализа. Частота и длительность (во времени) упоминания общественного события или государственного решения — свидетельство его важности для общества.
(д) Смысл апелляций к потенциальному адресату — пользователю рекламируемой продукции, или гражданину как возможному стороннику политического, иного движения. В коммерческой рекламе содержатся апелляции к возрастным когортам (например, "молодежь выбирает..."), социальному слою, активирующие разные потребности личности (здоровье, социальный статус...)» нацеленные на мотивацию избежания опасности или достижение успеха и т. д. В политической рекламе, как правило, единицами анализа могут выступать апелляции к определенным ценностям (справедливости, разумности, добру...), к нравственным нормам и стремлениям обустроить жизнь лучшим образом и т. д.
Эстонский социолог М. Лауристинь следующим образом обобщает задачи, объект и предмет контент-анализа применительно к изучению массовых коммуникаций [138]: (1) проблематика отражения действительности; (2) область реализации целей коммуникатора и социального института, который он представляет; (3) сфера потребностей аудитории массовой коммуникации, удовлетворяемых ею; (4) область взаимодействия коммуникатора (органа информации, пропагандиста...) и аудитории. Далее развертывается система индикаторов применительно к каждому из названных аспектов. Например, для первого аспекта (отражение реальности) ставятся задачи: (а) реконструировать события и явления и (б) установить закономерности отображения действительности средствами массовой коммуникации. Объектом анализа здесь выступают содержание сообщений, их тематика и смысловые значения, а предметом — картина мира, представляемая средствами массовой информации. В последнем аспекте (взаимодействие) ставятся задачи прогнозировать эффективность информационного воздействия, его социальный эффект и коммуникативные отношения между различными группами аудитории. Как объект коммуникации здесь указываются язык и структура текста (то, о чем сообщается) и характеристики источника сообщения, а также его адресата. Предмет анализа в этом случае — соответствие средств коммуникации ее целям и опыту аудитории, содержания сообщений — социальному опыту слушателей и зрителей и, наконец, соответствие коммуникативных отношений между группами населения, как они отображаются в сообщениях, реальным отношениям, как они есть в действительности.
Контент-анализ текстов может быть применен в самых разных областях исследования. Одним из примеров его использования в педагогических науках является интересная работа петербургских социопедагогов [32а]. Они применили данный способ для изучения эффективности нравственного просвещения. Ученикам 9—10-х классов дневной и вечерней школ было предложено определить смысл 15 нравственных понятий: культура, труд, просвещение, религия, нравственность, долг, образование, предрассудки, мораль, искусство, творчество, честь, знания, совесть, красота. Смысловые единицы анализа были представлены в упорядоченной номинальной шкале: (а) неудовлетворительное осмысление предмета (ответы типа "не знаю", предложение логического "круга", тавтология), дальше — (б) пояснение смысла путем простого перечисления примеров, скажем, "искусство — это музыка, живопись, литература", (в) указание на существенное свойство предмета, но неполное его осмысление, например "честь—это собственное достоинство", (г) максимально полное смысловое определение.
В итоге были получены данные, указывающие на особенности восприятия моральных категорий учащимися разного возраста и с разным жизненным опытом.
Итак, смысловые единицы анализа выделяются на основе содержания гипотез исследования, подсказываются методологическими посылками программы.
Например, в нашем исследовании сравнивалось действие внешних и внутренних факторов, определяющих степень самостоятельности в производственной деятельности инженера-проектировщика. Чтобы получить сведения о требованиях, предъявляемых к инженерам со стороны организации, мы взяли для контент-анализа характеристики, представляемые на каждого сотрудника в период прохождения им государственной аттестации.
Единицей анализа в характеристике, согласно цели и задачам исследования, должны быть суждения, касающиеся требования "быть самостоятельным в работе". Индикаторы этих требований отыскиваются в текстах характеристик (схема 17).
Мерой выражения признака "требование самостоятельности" может быть, например, отношение частоты упоминания в характеристике качеств инициативы и знаний, вместе взятых, против исполнительности и аккуратности. Чем чаще упоминается в характеристиках требование исполнительности и чем реже — требование знаний, инициативы и творчества, тем абсолютное значение "индекса несамостоятельности".8
8 На небольшой пробе в одном из проектных институтов (40 человек) автор этой методики В. Н. Каюрова обнаружила, что для инженеров, не имеющих подчиненных, "индекс несамостоятельности" равен 0,62; для руководителей групп, начальников отрядов и партий — 0,38, а для главных специалистов и руководителей проектов — 0,22 [166. С. 104—108].
Единицы счета могут и совпадать и не совпадать с единицами анализа. В первом случае квантификация сводится к определению частот упоминания выделенной смысловой единицы по отношению к другим категориям (как в случае построения индекса самостоятельности инженеров),
Во втором случае единицей счета избирают физическую протяженность или площадь текстов, заполненную смысловыми единицами: число строк, абзацев, квадратных миллиметров, знаков, колонок — в печатных текстах; длительность трансляции по радио или телевидению, метраж пленки при магнитофонных записях.
Контент-анализ текста может быть весьма многосторонним, причем одновременно используются несколько единиц анализа и несколько единиц счета.
В исследовании Б. А. Грушина для определения фактического использования населением источников информации сначала с помощью контент-анализа фиксировалось все "поле" сообщений, передаваемых через газеты и другие каналы массовой информации, а затем — "поле" массового сознания, т. е. уровень информированности населения по проблемам, выявленным путем анализа текстов.
Рассмотрим, как, например, фиксировалось содержание информации по проблемам международной жизни (центральные и местные газеты) [101. С. 41—56].
По каждой зарубежной стране материалы рассматриваются с точки зрения (а) частоты информации, (б) объема, (в) содержания, (г) знака информации и (д) типа материалов.
(а) Частота информации определяется как частота упоминания данной страны или проблемы, указанных в разделе "в", частота положительных—отрицательных оценок (раздел "г") и частота описательно-оценочной информации (раздел "д").
(б) Объем информации фиксируется двумя единицами: по числу строк текста и по удельному весу информации о данной стране в общем объеме газетного текста.
(в) Содержание сообщений о данной стране группируется в таких, например, смысловых единицах, как сообщения, касающиеся промышленности, сельского хозяйства, политического и общественного устройства, природных условий... быта и нравов... освободительной борьбы... внутриполитических акций... отношения к СССР и т. д. (всего 28 категорий).
(г) Знак информации определяется как "положительное" и "отрицательное", "сбалансированное" и "нейтральное" отношения, что соответственно кодируется как +, —, ±, 0.
(д) Тип и характер информации: 1. Фактографическая, содержащая сведения, полученные из неопределенного источника (источник не указывается); 2. Комментаторская: оценка фактов, свидетелем которых был автор сообщения; 3. Комментаторская: оценка фактов, свидетели которых не указываются;
4. Художественно-фактографическая: типа очерков, зарисовок "с натуры" с участием автора или с указанием источника;
5. Художественно-фактографическая: типа безадресных очерков с упоминанием событий, реальность которых сомнительна;
6. Общетеоретическая информация иностранных авторов, не содержащая ссылок на конкретные факты; 7. Аналогия предыдущей — советских авторов; 8. Абстрактно-художественная: безадресные стихи, рассказы и т. п. иностранных авторов; 9. Та же советских авторов.
Далее по каждому из этих пунктов разрабатывается подробная инструкция с указанием правил отнесения материалов в рубрику по индикаторам газетного текста. Например, при определении знака информации инструкция требует от кодировщика определять знак "не на основе собственных впечатлений от текста (тем более не на основе привычных традиционных для средств массовой коммуникации способов освещения того или иного вопроса), но исключительно на основе видимым образом (в лексике текста) выраженного отношения коммуникатора к проблеме". Дается инструкция по тематике и "знаку" информации, например, о позиции в вопросах войны и мира. Кодировать "+": "...выступает за сохранение мира на земле..."; кодировать "±": "...Занимает в вопросах войны и мира нейтральную позицию..."; кодировать "—"; "...Создает обстановку военного напряжения".
Закодированный по детальной инструкции текст заносится в шифрованный лист и далее подвергается статистической обработке.
Надежность информации, получаемой контент-анализом, обеспечивается следующими способами:
а) Обоснование полноты объема выделяемых смысловых единиц методом "снежного кома". Это делается следующим образом. Первоначально выделяются все смысловые единицы из первого анализируемого текста, далее из второго текста — те же плюс дополнительные] ранее не встречавшиеся, из третьего документа— опять те же, что уже встречались в двух предыдущих, плюс дополнительные и т. д. После изучения очередных 3—5 текстов, в которых уже не попадается ни одной новой единицы, ранее фиксированной в предыдущих документах, можно полагать, что "поле" смысловых единиц из изучаемого массива исчерпано.
Из рис. 10 видно, что в итоге изучения 20 случайно отобранных из всего массива текстов было выделено суммарно 120 единиц контент-анализа, что исчерпывает "поле", т. е. всю выборочную совокупность документов. Конечно, при изучении всего массива могут попасться новые смысловые единицы, относящиеся к предмету и ранее не предусмотренные. В этом случае они включаются в анализ дополнительно.
б) Контроль на обоснованность содержания смысловых единиц с помощью судей. Специалисты в данной области обсуждают, насколько предложенные качественные единицы соответствуют поставленным задачам.
В нашем исследовании б экспертов независимо друг от друга классифицировали 120 понятий, отнесенных к деловым и личностным качествам инженера, в 6 общих категорий (творческие качества, исполнительские и т. д.), причем 86 % понятий были классифицированы однозначно минимум четырьмя судьями. Остальные, более спорные, подвергались специальному обсуждению и после согласованного решения относились в соответствующую общую категорию.
в) Обоснованность по независимому критерию. Например, данные контент-анализа дневников или сочинений учащихся с целью выявить их профессиональную склонность выборочно проверяются путем опросов, или по данным наблюдений, или тестом по известной группе.
г) Устойчивость данных определяется при помощи кодирования одного текста разными кодировщиками на основе единой инструкции. Можно использовать стабильную единицу анализа и разные единицы счета (по частотам смысловых единиц и по физической протяженности одновременно).
Процедуры подсчета. В общем виде процедуры подсчета при контент-анализе аналогичны стандартным приемам классификации по выделенным группировкам, ранжирования и шкального изменения. Например, изучая тематику газеты, мы произведем процентовку по сгруппированным смысловым единицам разного содержания. Можно предпринять перекрестную классификацию (содержание выдвигаемых идей, средства, предложенные для их осуществления, аргументы).
По такой таблице целесообразно получить коэффициент энтропии распределения (Е) и коэффициент ассоциации (?*). Мы увидим, в какой мере та или другая группа идей связана со специфической аргументацией и средствами реализации идеи.
Для исчисления результатов контент-анализа используются и специально разработанные формулы.
Так, А. Н. Алексеев предложил формулу оценки "удельного веса" смысловых категорий в общем объеме текста [166. С. 19 — 24]. Формула указывает на уровень интенсивности представленной в тексте определенной темы (или аргументации, способов обращения к читателю и т. д.). Эта формула:
где Укс — "удельный вес" данной смысловой единицы; Кгл — число случаев, когда смысловая единица оказалась главной; Кет, — число случаев, когда та же единица оказывается второстепенной; 2 — сумма анализируемых текстов (документов).
Применяются также статистические расчеты доходчивости текста (терминов, предложений), его интересности для читателя и более сложные приемы изучения взаимосвязи распределений смысловых единиц [233. С. 60 — 67].
Техника контент-анализа находит широкое распространение в социальных исследованиях.
Большой эффективности при использовании контент-анализа добились в 60-е гг. эстонские социологи, работавшие в сотрудничестве с газетой "Эдази" в Тарту (руководитель исследований Юло Вооглайд). Содержание газеты подвергалось ежедневному контент- анализу по специальной программе, данные заносились на перфокарты, приспособленные для ручной обработки, и еженедельно обобщались на редакционных совещаниях. Результат — повышение оперативности, обогащение содержания, удвоение тиража районной газеты за счет подписчиков по всей республике [31, 35, 36].
Применявшийся вначале для изучения эффективности массовой пропаганды, этот прием стал ныне сильным средством анализа всевозможных официальных и неофициальных документов. Контент-анализ применяют также в практике изучения писем, поступающих в различные организации и органы управления [106. С. 120—121], в политологии, социальной психологии и педагогике, в криминологии, искусствоведении, этнографии и т. д. [238, 116, 168, 230, 45]. Крайне трудоемкие процедуры обработки данных контент-анализа существенно облегчаются компьютерными программами (они входят в комплект SPSS и имеются в виде специальных разработок). Благодаря расширяющемуся применению персональных компьютеров и введению в их память текстовой информации появилась возможность намного интенсивнее использовать контент-анализ ответов респондентов на открытые вопросы в анкетах.9 Политологические исследования широко используют эту технику при изучении политических документов, программ общественных движений, видеозаписей массовых собраний, съездов, митингов и т. п.
Оценка метода документального анализа Документы нередко выступают в качестве главного источника информации, дополняемой опросом или прямым наблюдением. Обычно это материалы прессы, а также письма читателей, статистические отчеты, карточки персонального учета (например, библиотечные формуляры при изучении читательского спроса), административные инструкции, рекламные тексты, политические листовки и т. д.
9 О компьютерных программах контент-анализа см. [123, 288].
Использование личных, или, как иногда говорят, "человеческих", документов, в теоретической парадигме жесткого, например структурно-функционального, анализа более ограниченно. Такие материалы хороши для социально-психологических и педагогических исследований. Личные документы — прекрасная база для жанра социологического эссе, широко используемого нашими польскими коллегами. Большой популярностью пользуются в Польше своеобразные конкурсы сочинений или биографий, объявляемые через газету. Итоги анализа таких материалов публикуются в виде полусоциологичес-ких-полужурналистских очерков, ставящих подчас весьма острые и серьезные проблемы.
И напротив, в интерпретационных теоретических подходах (феноменологических, культурологических) жизненные истории, биографии — великолепный источник изучения социальных процессов и обыденных практик людей.10
10 См. гл. 6.
Социолог должен проявить недюжинную изобретательность в поисках подходящих документов, подчас весьма неожиданных.
Советский демограф В. И. Переведенцев [205] остроумно проверил гипотезу о влиянии этнических факторов на миграцию населения. Он сопоставил данные об интенсивности миграции коренного населения союзных республик с данными Всесоюзной переписи 1959 г. о доле, лиц коренной национальности (по республикам), не считающих язык своей национальности родным языком. Оказалось, что эти пропорции совпадают почти идеально. Так, интенсивность миграции украинцев (в пропорции к русским) 11%, а доля украинцев, не говорящих на родном языке, — 12,3%, для белорусов — соответственно 15% против 15»8%, для народов Закавказья — 5% против 4,6%, народов Средней Азии — около 1% против 1,5%, для казахов — 4% против 1,6%, для народов Прибалтики — 4% против 3,5%. Очевидно, что этнический фактор существенно влиял на миграцию.
Главные недостатки описанного метода состоят в отмеченных выше проблемах получения достоверной информации из биографических материалов и в том, что при изучении человеческой деятельности в документах часто отражается не процесс, но лишь результаты [213. С. 362].
Анализ документов — важный метод сбора информации при формулятивном плане исследования (для выдвижения гипотез и общей разведки темы) и на стадии работы по описательному плану. В экспериментальных исследованиях возникают значительные трудности перевода языка документов на язык гипотез, но, как показывает опыт, и эти затруднения можно преодолеть при умелом обращении с материалом.
Наконец, огромное и вполне самостоятельное значение имеют для социолога данные государственной статистики, которыми надо уметь пользоваться, а также знать, с какой регулярностью они собираются и публикуются.11
11 Пример изящного и многостороннего использования материалов государственной статистики для проверки гипотез о тенденциях изменения социальной структуры общества— [57]. О документальном анализе см. также [170. Кн. 2].