ПОСЛЕДОВАТЕЛЬНОСТЬ ДЕЙСТВИЙ ПРИ АНАЛИЗЕ ДАННЫХ
В зависимости от программных целей исследования анализ полученных данных может быть более или менее глубоким и основательным.
Цель исследования определяет уровень анализа в том смысле, что либо позволяет, либо запрещает прекратить его на какой-то стадии. В полном же объеме, т. е. от первого до последнего шага, последовательность действий социолога при анализе эмпирических данных может быть представлена следующим образом.
Первая стадия — описание всей совокупности данных в их простейшей форме. Предварительно осуществляется общий контроль качества полученной информации: мы выявляем ошибки и пропуски, допущенные при сборе данных и при вводе их в компьютер для обработки, бракуем какие-то "единицы" выборочной совокупности, не отвечающие модели выборки (коррекция выборки), отсеиваем некомпетентных респондентов (изымаем их данные полностью или частично), производим другие контрольные действия, которые на социологическом жаргоне называют "чисткой массива".
Дальше следует собственно описание: мы используем аппарат дескриптивной статистики для упорядочения всех данных по отдельным признакам (переменным). Изучаются простые распределения, выявляются аномалии и скошенности, рассчитываются показатели средней тенденции, вариации распределений.
Все это необходимо для решения двух задач: (1) общей оценки выборочной совокупности и частных под-выборок (половозрастных, социально-профессиональных и других) с тем, чтобы понять, каким образом особенности выборок будут сказываться на интерпретации того или иного частного вывода и обобщающих заключений; (2) для того чтобы в последующих операциях с данными не утратить представления о составляющих более сложных зависимостей и комбинаций, которыми впоследствии будем оперировать.
Например, в итоговых или промежуточных выводах мы находим, что такие-то условия деятельности или характеристики людей более важны, чем некоторые другие. Чтобы правильно интерпретировать это заключение, следует вспомнить, каковы основные характеристики выборки, нет ли в ней заметных аномалий. Очень возможно, что в общей выборке доминируют представители определенного социального статуса, возрастной когорты, национальной принадлежности и т. п. С этими их особенностями связаны социальные функции, интересы, образ жизни. В итоге может оказаться, что наши суммарные выводы неосновательны: они преимущественно объясняются спецификой доминирующей подвыборки обследованных. Чтобы проверить эту рабочую гипотезу, надо расчленить массив информации на соответствующие подвыборки и повторить анализ раздельно для каждой из них, включая доминирующую. Так устанавливаются ограничения выводов.
Обращение к "простой структуре" данных нужно и для того, чтобы при всевозможных комбинациях и сложных построениях не утратить представления об их первооснове. Вдруг "выскакивает" интереснейший факт, какие-то явления неожиданно тесно коррелируют. При попытке объяснить, что происходит, мы забыли, что сведения об этих явлениях получены по ответам респондентов на два вопроса одинаковой конструкции, соседствующих в анкете, и что это, видимо, следствие монотонного реагирования на похожие по форме вопросы. Возвращаемся к исходным распределениям и видим, что они совершенно подобны именно в силу психологического эффекта "эхо". Открытия не состоялось.
Вторая стадия — "уплотнение" исходной информации, т. е. укрупнение шкал, формирование агрегированных признаков-индексов, выявление типических групп, жестких подвыборок общего массива и т. п.
Генеральная цель всех этих операций — сокращение числа признаков, нужных для итогового анализа. Одновременно достигается первичное обобщение данных, нужное для более глубокого понимания существа изучаемых процессов.
Допустим, например, что при контент-анализе по смысловой единице "а" практически информации не было получено (2% всего массива сведений). Сохранив этот пункт, мы потом будем постоянно наталкиваться на нулевые значения. Если можно, целесообразно объединить данную смысловую единицу с подобной ей, укрупнить шкалу. Тогда следует дать уточненную интерпретацию нового признака, теперь достаточно емкого по статистике наполнения.
Формирование сводных, агрегатных признаков освобождает от необходимости утомительно интерпретировать малосущественные частности, повышает уровень обобщений, ведет к более емким теоретическим умозаключениям. Одно дело, когда в прикладном — "инженерном" — исследовании мы анализируем соотносительное значение каждого из элементов производственной ситуации в его влиянии на отношение к работе. И совершенно иначе мы действуем, если наша задача состоит в обнаружении социальной закономерности при повторном сравнительном исследовании. Здесь важно обобщить информацию по более емким структурам, например, по всем факторам условий и всем составляющим содержания труда. Поскольку мы знаем частные составляющие того и другого, т. е. аккуратно прошли первый этап анализа, наши дальнейшие операции с данными будут более целеустремленными, экономичными и практичными с точки зрения приближения к основным целям исследования.
На данной стадии, в развитии которой осуществляется переход к анализу взаимосвязей (3-я стадия), будут использоваться довольно сильные операции — факторный анализ, типологизация и подобные им.
Очень важно дать необходимые промежуточные истолкования каждого из агрегируемых показателей, ибо это — новые свойства, нуждающиеся в осмыслении, построении соответствующих интерпретационных схем. Как замечает Г. С. Батыгин, "с известной долей преувеличения всю деятельность социолога можно назвать интерпретирующей: случайно попавший в выборку человек интерпретируется как респондент; его жизненные реалии и высказывания интерпретируются в шифрах и "закрытиях" вопросников; первичная социологическая информация интерпретируется в средних величинах, мерах рассеяния и корреляционных коэффициентах; числовые данные должны сопровождаться какими-либо рассуждениями, т. е. опять же интерпретироваться" [10. С. 177]. Тем более нуждаются в построении интерпретационных схем новые емкие признаки, сгруппированные, типологизированные данные.
Третья стадия анализа как бы вклинивается в предыдущую. Это — углубление интерпретации и переход к объяснению фактов путем выявления возможных прямых и косвенных влияний на агрегированные свойства, социальные типы, устойчивые образования.
Здесь главная опасность — подмена косвенных, опосредованных связей прямыми. Такая ошибка — самая распространенная и менее всего заметная со стороны.
В книге "Человек и его работа" мы совершили именно такую ошнбку — приняли некоторые связи за прямые и при-Шли к заключению, что в простых видах труда высокое образование отрицательно коррелирует с продуктивностью. Впоследствии было установлено, что поскольку в 1964 г. подавляющее число молодых рабочих имело преимущественно более высокое образование в сравнении с большинством рабочих среднего и старшего возрастов, а те, в свою очередь, обладали большим опытом и стажем, тогда как первые — малым, то прямая связь между образованием и продуктивностью рабочего фактически была ложной. Она опосредована возрастом, стажем работы, уровнем производственного опыта. Все обнаружилось, как только из всей совокупности обследованных были выделены подгруппы разного стажа и возраста: в каждой возрастной подгруппе по правилам, описанным выше (введение контрольной переменной, в нашем случае — возраста), обнаружились усиленные прямые связи уровня образования и деловитости, продуктивности рабочих, т. е. чем выше образование, тем выше и производственные результаты.
Итак, на данной, вероятно самой ответственной, стадии анализа должны быть получены основные выводы, проверены главные гипотезы, необходимые и для теоретического осмысления проблемы, и для разработки практических рекомендаций.
Четвертая стадия, заключительная, — попытка прогноза развития изучаемого процесса, событий, явлений при определенных условиях [23, 24, 25, 212, 214]. Лучшим образом решению этой задачи отвечает повторное обследование. При невозможности осуществить повторные исследования на базе разового используют модели мысленного экспериментирования, регрессионные, детерминационные, стохастические и др. Полезно прибегнуть к оценкам экспертов [256] в данном предмете, чтобы проверить надежность прогноза, являющегося результатом квазиэкспериментов.
Общая логика анализа эмпирических данных может быть иллюстрирована схемой 31.
Не все элементы приведенной схемы должны быть реализованы в каждом исследовании, она иллюстрирует принципиальный порядок аналитических действий. Однако этот порядок остается мертвой конструкцией до тех пор, пока решительно все операции с данными, начиная с первичных измерений и формализации изучаемых объектов, не наполнены содержательным смыслом.
Интерпретационная схема — единственное, что в конечном итоге обеспечивает убедительность и теоретико-
практическую значимость результатов исследования. Основы интерпретации и объяснения заложены в исследовательской программе. Теперь наша задача, следуя программным целям, — дополнить и уточнить гипотезы, проверить их на материале полученных данных. "Как бы ни была полна и конкретна полученная информация, — пишет Г. С. Батыгин, — она всегда помещается в определенную "систему координат" и выступает в качестве фрагмента более широкой картины, содержание которой — научный и жизненный опыт социолога" [10. С. 180—181].
Построение интерпретационных моделей — сугубо творческая, неформализуемая операция. Здесь лидируют знания, теоретическая подготовка, практический опыт, лексика, интуиция, гражданская ответственность исследователя. Мы можем заключить: "установлена такая-то связь или закономерность", но мы можем сказать, что подтверждены ранее установленные факты и найдено объяснение тому, что ранее казалось противоречивым; мы можем написать, что выявленные связи имеют место при определенных условиях и в определенной ситуации, а можем и не сделать такой оговорки; сошлемся на другие данные, подкрепляющие нашу объяснительную схему, либо умышленно или по незнанию игнорируем их; сформулируем социальную проблему или не обратим на нее внимания; призовем к действиям или ограничимся констатацией фактов...
В каждом из нюансов интерпретации и в итоговых объяснениях данных проявляется целостная личность исследователя. Он выступает не в роли узкого профессионала, функционирующей электронно-вычислительной машины, но как теоретик и практик, как ученый и гражданин, общекулътурный кругозор которого сочетается с богатством ассоциаций и активной гражданской позицией.
Практические советы
1. Приступая к анализу данных, будем строго придерживаться программных гипотез, избегая двух крайностей: поспешных заключений относительно их подтверждения, если факты "укладываются" в гипотезу, но вместе с тем соблазна увлечься самим процессом анализа как таковым, что нередко уводит в сторону от целевой ориентации исследования.
2. Первоначальные группировки и классификации разумнее всего производить, исходя из элементарных описательных гипотез, а последующие — предварять уточняющими и интерпретационными предположениями, продвигаясь к объяснительным. Чем дальше мы углубляемся в анализ данных, тем большее значение приобретают объяснительные гипотезы, непосредственно связанные с программными задачами исследования.
3. Если гипотезы нетривиальны, особое внимание следует уделять заключениям, которые с ними, не согласуются. В результате перепроверок, использования различных приемов анализа мы вводим ограничения, уточнения исходных гипотез и обнаруживаем либо их справедливость, либо уверенное опровержение, что побуждает выдвинуть новые гипотезы и осуществить их последовательную проверку.
4. Не следует смешивать уточнение и интерпретацию данных с их объяснением. Последнее является главной задачей анализа, позволяет установить причинные зависимости, истолковать найденные связи в понятиях более общих тенденций и закономерностей, дает основание для прогноза и, следовательно, для перехода к обоснованию практических решений социальных проблем.
5. При использовании стратегии качественного анализа данных (о чем см. ниже — гл.VI) будем помнить, что не следует бросаться из одной крайности в другую. Количественный анализ и качественное осмысление массовой статистики под углом зрения исследовательских гипотез не менее ценны, чем всесторонняя интерпретация статистически непредставительных данных. В одном случае мы приобретаем определенное знание о частных фрагментах социальной реальности, в другом — выявляем смыслы фактов и явлений без гарантий их типичности, распространенности в широком "социальном пространстве". Понимая эти особенности двух разных стратегий, мы должны комбинировать их в зависимости от целевой установки исследования. Хорошо сказано: "дискуссия о преимуществах качественной методологии и недостатках количественной — это призрачное противостояние" [62, С. 32].