МЕТОД АНАЛИЗА ПРОДУКТОВ ДЕЯТЕЛЬНОСТИ

Одним из самых распространенных продуктов челове­ческой деятельности является текст, который, в частности, можно понимать как упорядоченную систему знаков — кем-то, для кого-то, с какой-то целью, по каким-то правилам созданную.

Варианты текстов являются документами, которые в на­стоящее время понимаются как любая фиксированная ин­формация — печатная, рукописная, записанная с помощью любого технического средства. В науках, изучающих доку­менты, обычно приняты следующие методы их анализа*:

* По сб : Лекции по методике конкретных социальных исследований/ Подред Г М. Андреевой —МГУ 1972.

Остановимся подробнее на варианте формализованного метода анализа текстов (документов как видов текстов) — ко нтент-анализе.

Исторически этот метод, как и сам термин, возник в прак­тике американских журналистов, где он был сначала приме­нен к исследованию специфических материалов — материа­лов прессы. Позднее метод был исследован американским социологом Г. Лассуэлом и применен для анализа пропаган­ды. Лассуэл подчеркнул формализованный характер контент-анализа, определяя его как метод «количественного анализа содержания» с использованием математических средств, применяемый для исследования содержания материалов пропаганды, повторяемости их отдельных частей и т. п.

Назначение метода: конечно, и в данном случае заклю­чается в том, чтобы исследователь был в состоянии осмыс­лить текст,передаваемый в процессе коммуникации... здесь предлагаются особые технические средства, особые при­емы, которые как бы расставляют для исследователя не­которую контрольную сетку, регламентирующую возмож­ные чрезмерные отклонения на тропах интуиции.Суть метода контент-анализа заключается в выделении в тексте ключевых понятий (или иных смысловых единиц) с по­следующим подсчетом частоты употребления этих единиц, соотношения различных элементов текста друг с другом, а также с общим объемом информации.

Техника контент-анализа сводится к нескольким пос­ледовательным действиям: 1) выделение единиц анали­за, 2) отыскание их индикаторов в тексте, 3) статистиче­ская обработка.

1. Выделение единиц анализа: самым заманчивым и простым было бы выделение в качестве единицы контент-анализа определенного термина, слова, выражающего понятие, меру употребления которого в тексте надо уста­новить. Но (!!!) это и будет худший вариант анализа, не столько формализованный, сколько просто формальный. При таком подходе неизбежна потеря значительной доли информации и поэтому возможно не меньшее, а большее искажение содержания документа. Выделенная единица анализа должна быть обязательно (!) смысловой едини­цей, т. е. необходимо установить, в каких проявлениях тек­ста присутствует определенная смысловая нагрузка. Она не обязательно реализуется в одном слове (термине), она может проявляться в некоторых устойчивых сочетаниях слов, может вообще не присутствовать в явном термино­логическом облачении и т. д.


Поэтому в принципе при поиске единицы контент-ана-лиза можно получить два возможных варианта решения проблемы: — считать за единицу анализа символ. В конеч­ном счете символ выражается либо в отдельном слове, либо в сочетании слов; — смысловой единицей контент-анализа считать какой-либо объект, о котором имеются высказывания в тексте, или какие-то черты, свойства объекта.

При некоторых обстоятельствах этот объект может быть описан и при помощи одного слова, в других ситу­ациях — при помощи сочетания нескольких слов, т. е. посредством определенных суждений. Выделение едини­цы анализа поэтому является весьма непростым делом. Чисто технически поиск единицы контент-анализа тре­бует осуществления следующего действия: отыскания в тексте индикатора выбранных единиц.

2. Отыскание его в тексте требует от исследователя не­обходимости ограничить на этом этапе свою задачу коли­чественным описанием существующего, а не идеального текста... правильно знать границы возможного примене­ния контент-анализа и просто не допускать его абсолюти­зации, не ожидать от него результатов, которые он не может дать... нужно научиться действовать конвенциональ­но и иметь отвагу руководствоваться своим мнением. Пос­ле выполнения этой операции исследователь приступает к следующему этапу.

3. Статистическая обработка. Она заключается в под­счете частоты употребления понятия (при условии учета выделенных индикаторов) или в установлении пропор­ций между различными группами индикаторов. Характер и направление этих подсчетов определяются целями и за­дачами исследования.

Одна из важных задач контент-анализа — установле­ние идентичности содержания, вкладываемого в один и тот же термин разными авторами. Существуют специаль­ные способы определения точности употребления поня­тий в тексте, а также «разложения понятий по степеням».

При анализе содержания мы учитываем в тексте при­знаки определенных категорий, раскрывающих тему*. Все множество признаков — чаще всего лексических еди­ниц — характеризуется их качественно своеобразным

* См кн . Оценка содержательного разнообразия в школьных сочи-нениях/Сост Б. А. Еремеев — СПб., 1992.

составом — словарем — и устойчивостью. Чем больше состав, тем с большей дегализированностью раскрыва­ется тема и/или подтема. И тем более конкретно выра­женное в тексте представление: конкретное есть синтез многих определений (К. Маркс).

Чем больше устойчивость отдельных признаков — лек­сических единиц, тем более определенно раскрывается тема и/или ее составляющие. Это говорит о большей очевид­ности для автора соответствующих фрагментов действи­тельности и принятых способов их обозначения в данной ситуации порождения речи. И чем больше частотность лек­сических единиц, тем надежнее высказывание как акт ком­муникации.

Содержательное разнообразие тек­ста тем больше, чем длиннее словарь и чем меньше его устойчивость. С точки зрения психологии, содержательное разнообразие свиде­тельствует о большей сложности факта сознания, вопло­щенного в тексте.

Для оценки разнообразия нужен показатель, который учитывал бы соотношение единиц содержания в данном их множестве. Это значит, что нужно учитывать и количество различных единиц, и их частотность, и их об­щую «массу». Для этого подходит оценка энтропии (Н) по К. Шеннону, в битах*:

Здесь р^ — частотность, или относительная частота дан­ной (i) единицы счета по отношению к их сумме:

L — количество различных единиц (длина словаря). Чем больше различных единиц счета — слов и выра­жений, раскрывающих тему, — тем больше энтропия Н. Чем реже используется каждая единица (в пределе — одно-

* Бит — единица неопределенности, соответствующая утверждению о том, что произошло одно из двух равновероятных событии В нашем слу­чае — при двух различных единицах счета, каждая из которых встречается столько же раз, сколько и другая


кратно), тем больше энтропия Н. И наоборот: чем мень­ше различных единиц счета и чем чаще они повторяют­ся, тем меньше величина энтропии. Таким образом, оцен­ка неопределенности по К. Шеннону действительно ха­рактеризует соотношение единиц содержания и тем самым — содержательное разнообразие текста, вы­ражающее предметное разнообразие авторских представ­лений.