Приемы качественно-количественного анализа до­кументов

Основная трудность при работе с доступными (т. е. нецелевыми) документами — умение читать данные на языке гипотез исследования. Ведь документ был составлен вовсе не для того, чтобы проверить гипотезы социолога. По­этому, прежде чем анализировать документальные материа­лы по существу, социолог вынужден проделать утомительную работу поиска в документе индикаторов (признаков) ключевых понятий исследования.

Качественный анализ документов — необходимое условие для всех количественных операций. Но прежде следует заметить, что квантификация текстов далеко не всегда целесообразна.

В каких случаях не следует прибегать к количе­ственному анализу? Видимо, это неразумно, если мы имеем дело с уникальными документами, где главная цель изучения — всесторонняя содержательная интер­претация материала. Не следует обращаться к ко­личественному анализу, если перед нами описания весь­ма сложных явлений, если документальных данных не­достаточно для массовой обработки или они неполные (нерепрезентативн ы).

Когда количественный анализ текстов уместен? Прежде всего, отмечает один из основателей этого мето­да Б. Берельсон [315], если требуется высокая степень точности при сопоставлении однопорядковых данных. Далее, когда достаточно много материала, чтобы оправ­дать усилия, связанные с его количественной обработ­кой, и если этот материал репрезентирует области изуче­ния. Квантификация необходима, когда текстового мате­риала не только достаточно, но столь много, что его нельзя охватить без суммарных оценок. Квантификация возможна при условии, что изучаемые качественные ха­рактеристики появляются с достаточной частотой.

Наиболее целесообразно использовать количествен­ный анализ, если квантифицированные тексты сопостав­ляются с иными, также количественными характеристи­ками. Например, выраженные в статистических распреде­лениях особенности содержания газетных сообщений со­поставляются с численностью подписчиков, их мнениями об этих материалах, тоже выраженными в числах.

Квантификация текстового материала получила весьма широкое распространение, и в 40-х гг. для нее была разработана специальная процедура, названная "контент- анализ".7

7 Вместе с тем, как отмечал В. Е. Семенов [239. С. 42], еще в 20— 30-е гг. количественные способы анализа текстов начали применять отечественные исследователи (социологи и психологи): В. А. Куэмичев, Н. А. Рыбников, И. Н. Шпилърейв, которые, однако, не ставили целью разработку детальной техники этого метода.

Контент-анализ — это перевод в количественные показатели массовой текстовой (или записанной на пленку) информации с последующей статистической ее обработкой. Его основные операции были разработа­ны американскими социологами X. Лассуэллом и Б. Бе-рельсоном [343, 315]. Важный вклад в развитие проце­дур контент-анализа внесли российские и эстонские со­циологи, особенно А. Н. Алексеев, Ю. Вооглайд, П. Виха-лемм, Б. А. Грушин, Т. М. Дридзе, М- Лауристинь.

Основные процедуры контент-анализа. Контент-анализ начинается с выявления смысловых единиц, в ка-честве которых используют:

(а) Понятия, выраженные в отдельных терминах. Это могут быть понятия из области экономики: формы собственности, приватизация, финансовая система, де­нежное обращение, технический прогресс, методы хозяй­ствования, оптимизация управления и др.; термины по­литического содержания: правящие круги и оппозиция, интернационализм или национализм, авторитаризм, де­мократия, международное сотрудничество, консенсус, конфликт интересов; нравственные или правовые симво­лы: права человека, гуманизм, активность, инициатив­ность, деловая предприимчивость, нарушение законности, преступность, коррупция; научные: модель, система, кос­мическое пространство и т. п. Очевидно, что анализ тек­ста по содержанию понятий несет немало важной соци­альной информации. Например, по частоте употребле­ния понятий, связанных с наукой и новой техникой, можно определить, в какой мере источник информации ориентирован на научно-техническую модернизацию.

(б) Тема, выраженная в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т. п.

По тематике можно еще более полно представить со­держание документа. Темы развертывания инициативы и предприимчивости, борьбы с бюрократизмом и сверх­централизацией, соблюдения прав человека и законнос­ти, социальной справедливости, гражданского мира и со­гласия или же тематика укрепления государственности, централизма, дисциплины и борьбы со всяческими вра­гами как лидирующая проблематика средств массовой информации очень показательны для определения их по­литико-идеологических позиций. Столь же показательны сюжеты из личных документов, например, писем о самом себе или о своих близких, о делах производственных и по­литике, об искусстве и т. п. Все это — свидетельства опре­деленной направленности взглядов, интересов, ценност­ных ориентации и норм деятельности.

(в) Имена исторических личностей, политиков, выдаю­щихся ученых и деятелей искусства, организаторов про­изводства, лидеров движений и партий, наименования об­щественных институтов, организаций и учреждений.

Эти характеристики могут свидетельствовать о влия­нии отдельных лиц или представляемых ими социальных институтов, сообществ, групп на общественное мнение. По числу ссылок на отдельных авторов определяют зна­чимость той или иной научной идеи: если число ссылок растет или падает, это свидетельствует о росте или паде­нии авторитета данной концепции. По частоте упомина­ний общественных движений или их лидеров легко зак­лючить о влиятельности этих движений.

(г) Целостное общественное событие, официальный Документ, факт, произведение, случай и т. п. несут спе­цифическую смысловую нагрузку и тоже могут быть приняты за единицу анализа. Частота и длительность (во времени) упоминания общественного события или государственного решения — свидетельство его важно­сти для общества.

(д) Смысл апелляций к потенциальному адресату — пользователю рекламируемой продукции, или гражда­нину как возможному стороннику политического, иного движения. В коммерческой рекламе содержатся апел­ляции к возрастным когортам (например, "молодежь выбирает..."), социальному слою, активирующие разные потребности личности (здоровье, социальный статус...)» нацеленные на мотивацию избежания опасности или до­стижение успеха и т. д. В политической рекламе, как правило, единицами анализа могут выступать апелля­ции к определенным ценностям (справедливости, ра­зумности, добру...), к нравственным нормам и стремле­ниям обустроить жизнь лучшим образом и т. д.

Эстонский социолог М. Лауристинь следующим об­разом обобщает задачи, объект и предмет контент-ана­лиза применительно к изучению массовых коммуника­ций [138]: (1) проблематика отражения действительнос­ти; (2) область реализации целей коммуникатора и со­циального института, который он представляет; (3) сфе­ра потребностей аудитории массовой коммуникации, удовлетворяемых ею; (4) область взаимодействия комму­никатора (органа информации, пропагандиста...) и ауди­тории. Далее развертывается система индикаторов при­менительно к каждому из названных аспектов. Напри­мер, для первого аспекта (отражение реальности) ставят­ся задачи: (а) реконструировать события и явления и (б) установить закономерности отображения действи­тельности средствами массовой коммуникации. Объек­том анализа здесь выступают содержание сообщений, их тематика и смысловые значения, а предметом — карти­на мира, представляемая средствами массовой информа­ции. В последнем аспекте (взаимодействие) ставятся за­дачи прогнозировать эффективность информационного воздействия, его социальный эффект и коммуника­тивные отношения между различными группами ауди­тории. Как объект коммуникации здесь указываются язык и структура текста (то, о чем сообщается) и харак­теристики источника сообщения, а также его адресата. Предмет анализа в этом случае — соответствие средств коммуникации ее целям и опыту аудитории, содержа­ния сообщений — социальному опыту слушателей и зрителей и, наконец, соответствие коммуникативных от­ношений между группами населения, как они отобра­жаются в сообщениях, реальным отношениям, как они есть в действительности.

Контент-анализ текстов может быть применен в самых разных областях исследования. Одним из примеров его ис­пользования в педагогических науках является интересная ра­бота петербургских социопедагогов [32а]. Они применили дан­ный способ для изучения эффективности нравственного про­свещения. Ученикам 9—10-х классов дневной и вечерней школ было предложено определить смысл 15 нравственных понятий: культура, труд, просвещение, религия, нравственность, долг, образование, предрассудки, мораль, искусство, творчество, честь, знания, совесть, красота. Смысловые единицы анализа были представлены в упорядоченной номинальной шкале: (а) неудовлетворительное осмысление предмета (ответы типа "не знаю", предложение логического "круга", тавтология), даль­ше — (б) пояснение смысла путем простого перечисления примеров, скажем, "искусство — это музыка, живопись, литера­тура", (в) указание на существенное свойство предмета, но не­полное его осмысление, например "честь—это собственное дос­тоинство", (г) максимально полное смысловое определение.

В итоге были получены данные, указывающие на особен­ности восприятия моральных категорий учащимися разного возраста и с разным жизненным опытом.

Итак, смысловые единицы анализа выделяются на основе содержания гипотез исследования, подсказыва­ются методологическими посылками программы.

Например, в нашем исследовании сравнивалось действие внешних и внутренних факторов, определяющих степень само­стоятельности в производственной деятельности инженера-проектировщика. Чтобы получить сведения о требованиях, предъявляемых к инженерам со стороны организации, мы взяли для контент-анализа характеристики, представляемые на каждого сотрудника в период прохождения им государ­ственной аттестации.

Единицей анализа в характеристике, согласно цели и зада­чам исследования, должны быть суждения, касающиеся требова­ния "быть самостоятельным в работе". Индикаторы этих требо­ваний отыскиваются в текстах характеристик (схема 17).

Мерой выражения признака "требование самостоятельно­сти" может быть, например, отношение частоты упоминания в характеристике качеств инициативы и знаний, вместе взятых, против исполнительности и аккуратности. Чем чаще упоми­нается в характеристиках требование исполнительности и чем реже — требование знаний, инициативы и творчества, тем абсолютное значение "индекса несамостоятельности".8

8 На небольшой пробе в одном из проектных институтов (40 че­ловек) автор этой методики В. Н. Каюрова обнаружила, что для инже­неров, не имеющих подчиненных, "индекс несамостоятельности" равен 0,62; для руководителей групп, начальников отрядов и партий — 0,38, а для главных специалистов и руководителей проектов — 0,22 [166. С. 104—108].

 

Единицы счета могут и совпадать и не совпадать с единицами анализа. В первом случае квантификация сводится к определению частот упоминания выделенной смысловой единицы по отношению к другим категори­ям (как в случае построения индекса самостоятельнос­ти инженеров),

Во втором случае единицей счета избирают физи­ческую протяженность или площадь текстов, заполнен­ную смысловыми единицами: число строк, абзацев, квад­ратных миллиметров, знаков, колонок — в печатных текстах; длительность трансляции по радио или телеви­дению, метраж пленки при магнитофонных записях.

Контент-анализ текста может быть весьма многосто­ронним, причем одновременно используются несколько единиц анализа и несколько единиц счета.

В исследовании Б. А. Грушина для определения фактического использования населением источников информации сначала с помощью контент-анализа фик­сировалось все "поле" сообщений, передаваемых через газеты и другие каналы массовой информации, а за­тем — "поле" массового сознания, т. е. уровень инфор­мированности населения по проблемам, выявленным путем анализа текстов.

Рассмотрим, как, например, фиксировалось содержание ин­формации по проблемам международной жизни (центральные и местные газеты) [101. С. 41—56].

По каждой зарубежной стране материалы рассматрива­ются с точки зрения (а) частоты информации, (б) объема, (в) со­держания, (г) знака информации и (д) типа материалов.

(а) Частота информации определяется как частота упоми­нания данной страны или проблемы, указанных в разделе "в", частота положительных—отрицательных оценок (раздел "г") и частота описательно-оценочной информации (раздел "д").

(б) Объем информации фиксируется двумя единицами: по числу строк текста и по удельному весу информации о данной стране в общем объеме газетного текста.

(в) Содержание сообщений о данной стране группируется в таких, например, смысловых единицах, как сообщения, каса­ющиеся промышленности, сельского хозяйства, политического и общественного устройства, природных условий... быта и нра­вов... освободительной борьбы... внутриполитических акций... отношения к СССР и т. д. (всего 28 категорий).

(г) Знак информации определяется как "положитель­ное" и "отрицательное", "сбалансированное" и "нейтральное" отношения, что соответственно кодируется как +, —, ±, 0.

(д) Тип и характер информации: 1. Фактографическая, со­держащая сведения, полученные из неопределенного источни­ка (источник не указывается); 2. Комментаторская: оценка фактов, свидетелем которых был автор сообщения; 3. Коммен­таторская: оценка фактов, свидетели которых не указываются;

4. Художественно-фактографическая: типа очерков, зарисовок "с натуры" с участием автора или с указанием источника;

5. Художественно-фактографическая: типа безадресных очер­ков с упоминанием событий, реальность которых сомнительна;

6. Общетеоретическая информация иностранных авторов, не содержащая ссылок на конкретные факты; 7. Аналогия пре­дыдущей — советских авторов; 8. Абстрактно-художествен­ная: безадресные стихи, рассказы и т. п. иностранных авторов; 9. Та же советских авторов.

Далее по каждому из этих пунктов разрабатывается под­робная инструкция с указанием правил отнесения материалов в рубрику по индикаторам газетного текста. Например, при определении знака информации инструкция требует от коди­ровщика определять знак "не на основе собственных впечатле­ний от текста (тем более не на основе привычных традицион­ных для средств массовой коммуникации способов освещения того или иного вопроса), но исключительно на основе види­мым образом (в лексике текста) выраженного отношения коммуникатора к проблеме". Дается инструкция по тематике и "знаку" информации, например, о позиции в вопросах войны и мира. Кодировать "+": "...выступает за сохранение мира на земле..."; кодировать "±": "...Занимает в вопросах войны и мира нейтральную позицию..."; кодировать "—"; "...Создает обстановку военного напряжения".

Закодированный по детальной инструкции текст зано­сится в шифрованный лист и далее подвергается статистичес­кой обработке.

Надежность информации, получаемой контент-ана­лизом, обеспечивается следующими способами:

а) Обоснование полноты объема выделяемых смыс­ловых единиц методом "снежного кома". Это делается следующим образом. Первоначально выделяются все смысловые единицы из первого анализируемого текста, далее из второго текста — те же плюс дополнительные] ранее не встречавшиеся, из третьего документа— опять те же, что уже встречались в двух предыдущих, плюс до­полнительные и т. д. После изучения очередных 3—5 текстов, в которых уже не попадается ни одной новой единицы, ранее фиксированной в предыдущих докумен­тах, можно полагать, что "поле" смысловых единиц из изучаемого массива исчерпано.

Из рис. 10 видно, что в итоге изучения 20 случайно отобранных из всего массива текстов было выделено суммарно 120 единиц контент-анализа, что исчерпывает "поле", т. е. всю выборочную совокупность документов. Конечно, при изучении всего массива могут попасться новые смысловые единицы, относящиеся к предмету и ранее не предусмотренные. В этом случае они включа­ются в анализ дополнительно.

б) Контроль на обоснованность содержания смысло­вых единиц с помощью судей. Специалисты в данной области обсуждают, насколько предложенные качествен­ные единицы соответствуют поставленным задачам.

В нашем исследовании б экспертов независимо друг от друга классифицировали 120 понятий, отнесенных к деловым и личностным качествам инженера, в 6 общих категорий (творческие качества, исполнительские и т. д.), причем 86 % понятий были классифицированы однозначно минимум че­тырьмя судьями. Остальные, более спорные, подвергались спе­циальному обсуждению и после согласованного решения отно­сились в соответствующую общую категорию.

в) Обоснованность по независимому критерию. На­пример, данные контент-анализа дневников или сочине­ний учащихся с целью выявить их профессиональную склонность выборочно проверяются путем опросов, или по данным наблюдений, или тестом по известной группе.

г) Устойчивость данных определяется при помощи кодирования одного текста разными кодировщиками на основе единой инструкции. Можно использовать ста­бильную единицу анализа и разные единицы счета (по частотам смысловых единиц и по физической протя­женности одновременно).

Процедуры подсчета. В общем виде процедуры под­счета при контент-анализе аналогичны стандартным приемам классификации по выделенным группировкам, ранжирования и шкального изменения. Например, изучая тематику газеты, мы произведем процентовку по сгруппированным смысловым единицам разного со­держания. Можно предпринять перекрестную классифи­кацию (содержание выдвигаемых идей, средства, предло­женные для их осуществления, аргументы).

По такой таблице целесообразно получить коэффи­циент энтропии распределения (Е) и коэффициент ассо­циации (?*). Мы увидим, в какой мере та или другая группа идей связана со специфической аргументацией и средствами реализации идеи.

Для исчисления результатов контент-анализа используются и специально разработанные формулы.

Так, А. Н. Алексеев предложил формулу оценки "удельного веса" смысловых категорий в общем объеме текста [166. С. 19 — 24]. Формула указывает на уровень интенсивности пред­ставленной в тексте определенной темы (или аргументации, способов обращения к читателю и т. д.). Эта формула:

где Укс — "удельный вес" данной смысловой единицы; Кгл — число случаев, когда смысловая единица оказалась главной; Кет, — число случаев, когда та же единица оказы­вается второстепенной; 2 — сумма анализируемых текстов (документов).

Применяются также статистические расчеты доходчивос­ти текста (терминов, предложений), его интересности для чита­теля и более сложные приемы изучения взаимосвязи распреде­лений смысловых единиц [233. С. 60 — 67].

Техника контент-анализа находит широкое распрост­ранение в социальных исследованиях.

Большой эффективности при использовании кон­тент-анализа добились в 60-е гг. эстонские социологи, работавшие в сотрудничестве с газетой "Эдази" в Тарту (руководитель исследований Юло Вооглайд). Содержа­ние газеты подвергалось ежедневному контент- анализу по специальной программе, данные заносились на перфокарты, приспособленные для ручной обработки, и еженедельно обобщались на редакционных совещаниях. Результат — повышение оперативности, обогащение со­держания, удвоение тиража районной газеты за счет подписчиков по всей республике [31, 35, 36].

Применявшийся вначале для изучения эффективно­сти массовой пропаганды, этот прием стал ныне силь­ным средством анализа всевозможных официальных и неофициальных документов. Контент-анализ применя­ют также в практике изучения писем, поступающих в различные организации и органы управления [106. С. 120—121], в политологии, социальной психологии и педагогике, в криминологии, искусствоведении, этногра­фии и т. д. [238, 116, 168, 230, 45]. Крайне трудоемкие процедуры обработки данных контент-анализа суще­ственно облегчаются компьютерными программами (они входят в комплект SPSS и имеются в виде специальных разработок). Благодаря расширяющемуся применению персональных компьютеров и введению в их память текстовой информации появилась возможность намного интенсивнее использовать контент-анализ ответов рес­пондентов на открытые вопросы в анкетах.9 Политоло­гические исследования широко используют эту технику при изучении политических документов, программ об­щественных движений, видеозаписей массовых собра­ний, съездов, митингов и т. п.

Оценка метода документального анализа Документы нередко выступают в качестве главного источника информации, дополняемой опросом или пря­мым наблюдением. Обычно это материалы прессы, а также письма читателей, статистические отчеты, карточ­ки персонального учета (например, библиотечные фор­муляры при изучении читательского спроса), адми­нистративные инструкции, рекламные тексты, полити­ческие листовки и т. д.

9 О компьютерных программах контент-анализа см. [123, 288].

 

Использование личных, или, как иногда говорят, "че­ловеческих", документов, в теоретической парадигме же­сткого, например структурно-функционального, анализа более ограниченно. Такие материалы хороши для со­циально-психологических и педагогических исследова­ний. Личные документы — прекрасная база для жанра социологического эссе, широко используемого нашими польскими коллегами. Большой популярностью пользу­ются в Польше своеобразные конкурсы сочинений или биографий, объявляемые через газету. Итоги анализа та­ких материалов публикуются в виде полусоциологичес-ких-полужурналистских очерков, ставящих подчас весь­ма острые и серьезные проблемы.

И напротив, в интерпретационных теоретических подходах (феноменологических, культурологических) жизненные истории, биографии — великолепный источ­ник изучения социальных процессов и обыденных прак­тик людей.10

10 См. гл. 6.

 

Социолог должен проявить недюжинную изобрета­тельность в поисках подходящих документов, подчас весьма неожиданных.

Советский демограф В. И. Переведенцев [205] остро­умно проверил гипотезу о влиянии этнических факто­ров на миграцию населения. Он сопоставил данные об интенсивности миграции коренного населения союзных республик с данными Всесоюзной переписи 1959 г. о доле, лиц коренной национальности (по республикам), не считающих язык своей национальности родным языком. Оказалось, что эти пропорции совпадают почти идеально. Так, интенсивность миграции украинцев (в пропорции к русским) 11%, а доля украинцев, не говоря­щих на родном языке, — 12,3%, для белорусов — соот­ветственно 15% против 15»8%, для народов Закавка­зья — 5% против 4,6%, народов Средней Азии — около 1% против 1,5%, для казахов — 4% против 1,6%, для народов Прибалтики — 4% против 3,5%. Очевидно, что этнический фактор существенно влиял на миграцию.

Главные недостатки описанного метода состоят в от­меченных выше проблемах получения достоверной ин­формации из биографических материалов и в том, что при изучении человеческой деятельности в документах часто отражается не процесс, но лишь результаты [213. С. 362].

Анализ документов важный метод сбора инфор­мации при формулятивном плане исследования (для выдвижения гипотез и общей разведки темы) и на стадии работы по описательному плану. В эксперимен­тальных исследованиях возникают значительные трудности перевода языка документов на язык гипо­тез, но, как показывает опыт, и эти затруднения мож­но преодолеть при умелом обращении с материалом.

Наконец, огромное и вполне самостоятельное зна­чение имеют для социолога данные государственной статистики, которыми надо уметь пользоваться, а так­же знать, с какой регулярностью они собираются и публикуются.11

11 Пример изящного и многостороннего использования материалов государственной статистики для проверки гипотез о тенденциях изме­нения социальной структуры общества— [57]. О документальном ана­лизе см. также [170. Кн. 2].