Шкалограммный анализ Гуттмана

7.5.2. Шкалограмма Гуттмана

Известный американский психолог Л.Гуттман предложил свой способ адаптации тестовой традиции к потребностям социоло­гии [Guttman, 1950]. В принципе идея была той же — опереться на проверку того, что наблюдаемые признаки представляют со­бой плотную "связку" в смысле корреляции друг с другом, и предложить такой способ измерения латентной переменной, чтобы при фиксации ее значения эти корреляции исчезали. Опи­сание метода можно найти в [Грин, 1966; Гуттман, 1966; Оси­пов, Андреев, 1977; Рабочая книга..., 1983; Ядов, 1995].

Наблюдаемые признаки — дихотомические. Предполагается, что выполнение условий, требующихся для реализации тесто­вой традиции, будет обеспечено, если удастся доказать возмож­ность определенным образом их упорядочить. А именно: будем говорить, что признаки упорядочены, если, скажем, относи­тельно человека, положительно реагирующего на третий при­знак, можно быть почти уверенным, что он положительно реа­гировал и на четвертый, пятый и т.д. признаки.

Подобные шкалы называются кумулятивными. Они использо­вались и до Гуттмана. Так, кумулятивна известная шкала социаль­ной дистанции Богардуса, содержащая семь признаков, отража­ющих различные степени социальной дистанции. Эти признаки могут быть следующим образом упорядочены (речь идет об отно­шении респондента к человеку или социальной группе, дистан­ция до которой вычисляется): допущение человека в качестве род­ственника посредством брака, как личного друга, в качестве сосе­да, допущение равной работы, гражданства, допущение в страну только в качестве туриста. Кумулятивность шкалы представляется очевидной: относительно респондента, согласного принять кого-то в качестве соседа, можно почти наверняка сказать, что он согласится с тем, чтобы тот же человек имел одинаковые с ним работу, гражданство, или мог приехать в страну как турист.

Значение латентной переменной рассчитывается как сумма положительных ответов, данных респондентом на рассматрива­емые вопросы. Нетрудно показать, что если рассматриваемые дихотомические признаки удалось упорядочить, то соответству­ющая матрица данных приведется к так называемому диагональ­ному виду (табл. 7.2).

Плюсами помечены положительные ответы респондентов на соответствующие вопросы анкеты (их согласие с соответствую­щими суждениями), минусами — отрицательные.

Нетрудно проверить, что согласие респондента, скажем, с 4-м суждением означает его согласие с 5-м, 6-м и т.д. А это и означа­ет, что наши признаки упорядочены.

Но поскольку количество респондентов, как правило, будет больше числа суждений, то многие респонденты будут давать одинаковые наборы ответов, и матрица приобретет ступенчато-диагональный вид (табл. 7.3).

Нетрудно показать, что для таких переменных будут выпол­нены все требующиеся посылки: они будут связаны друг с дру­гом и фиксация значения латентной переменной приведет к распаду этих связей.

Действительно, пусть р. и р. — вероятности положительных от­ветов на /-й и у'-й вопросы соответственно, р.. — вероятность по­ложительного ответа на /-й и у'-й вопросы одновременно (напом­ним, что в выборочном исследовании вероятность какого-либо события отождествляется с относительной частотой его встречае­мости).

Таблица 7.3. Результат шкалограммного анализа Гуттмана: приведение матрицы данных к ступенчато-диагональному

виду

 

 

 

Респон­денты Суждения Значение латентной переменной
+ + + + + + + + +
+ + + + + + + + +
+ + + + + + + + +
- + + + + + + + +
- - + + + + + + +
- - + + + + + + +
- - - + + + + + +
- - - + . + + + + +
- - - + + + + + +
- - - - + + + + +
- - - - + + + + +
          + + + +
            + + +
              + +
              + +
              + +
                +
                 

 

Вспомним одно из основных положений теории вероятнос­тей. Независимость двух событий означает, что вероятность на­ступления обоих событий вместе равна произведению вероят­ностей наступления каждого из них в отдельности. Учитывая это, нетрудно видеть, что в нашем случае независимость двух при­знаков с номерами i и j означает, что

 

Pt=P,Pj- (?-2>

Однако в действительности, если предположить, что признаки упорядочены в нашем смысле (и / < j ), то окажется, что р. = = pi (для нашего примера со шкалой Богардуса — вероятность того, что респондент согласен допустить рассматриваемого чело­века одновременно и в качестве соседа, и в качестве сограждани­на, равна вероятности того, что он допустит этого человека в качестве соседа, поскольку второе требование само собой будет выполнено). Поскольку соотношение (7.2) не выполняется, то признаки зависимы.

Если же взять только тех людей, которые имеют одно и то же значение латентной переменной, то, как нетрудно проверить, для них однозначно восстанавливается картина их ответов на рассматриваемые вопросы: скажем, балл 5 респондент может иметь только в том случае, если он дал положительные ответы на пос­ледние 5 вопросов. Другими словами, респонденты с одним и тем же значением латентной переменной имеют одни и те же значения рассматриваемых признаков. Ни о какой связи тут го­ворить не приходится.

Гуттман предложил простой алгоритм, позволяющий либо привести матрицу к диагональному виду, либо показать, что это сделать в принципе невозможно. Прежде чем описать этот алгоритм, заметим, что мы должны учитывать еще одно обсто­ятельство.

Выше в действительности был описан некий идеальный слу­чай. Мы уже говорили, что в социологии практически никакая теоретическая схема никогда не проходит в совершенно "чис­том" виде, никакая гипотеза не может стопроцентно выпол­няться, никакие данные не бывают без ошибок. И всегда встает вопрос, в каких пределах эти ошибки допустимы.

В нашем случае это означает, что даже при самом тщательном подборе суждений всегда найдутся респонденты, для которых они не будут упорядочены предполагаемым нами образом (в подтвер-" ждение того, что ошибки всегда будут, напомним, как уже мы говорили, что человек, ответивший положительно на третий воп­рос, почти наверняка, но не наверняка (!) даст положительный ответ на четвертый и пятый). То есть наша матрица хотя бы в малой мере, но практически всегда не будет точно диагональной. Необходимо, как всегда в подобных случаях, установить предел допустимых ошибок (напомним, что мы так же поступили, на­пример, когда говорили о возможных нарушениях транзитивно­сти в матрицах парных сравнений). В ситуации, когда этот предел не будет превышен, считать, что матрица диагональна, и, следо­вательно, наши условия, обеспечивающие возможность исполь­зования тестовой традиции, выполняются. Если ошибки превы-


 

 
 

сят допустимый предел, то будем полагать, что матрицу нельзя привести к диагональному виду и, стало быть, нельзя описан­ным образом измерять латентную переменную.

Ошибки будут проявляться в том, что даже в самом хорошем варианте у нас в области плюсов будут одиночные минусы, и наоборот. Оценим количество таких смешений. Их ниже мы и называем ошибками. Введем критерий:

 

R = 1 — (количество ошибок)/(количество клеток в таблице).

 

Будем полагать, что мы привели матрицу к диагональному виду, если R < 0,9. Теперь на примере покажем, в чем состоит алгоритм Гуттмана и как можно оценить качество его работы.

Итак, пусть исходная матрица данных имеет вид (табл. 7.4).

 

 

Таблица 7.4. Фрагмент гипотетической матрицы данных, полученных с помощью шкалы Гуттмана

 

 

 

Респонденты Суждения Значение латентной переменной
со
+ - - - + +
см + + + - - - со
со - - - - - -
+ + + + + -
СП - - - - - +
+ + - - + +
- - - + + +
+ + + - + -

 

 

В соответствии с упомянутым алгоритмом сначала надо таким образом переставить строки, чтобы соответствующие им значе­ния измеряемой переменной расположились по убыванию (табл. 7.5).

Не зря мы ввели в таблицу еще одну строку. Теперь надо пере­ставить столбцы таблицы таким образом, чтобы возрастали ран­ги, стоящие в ее нижней, как бы маргинальной, строке (табл. 7.6).


 


Строго диагонального (ступенчато-диагонального) вида у нас не получилось. Теперь требуется оценить, можно ли все же счи­тать, что полученная матрица достаточно близка к диагонально­му виду.

R = I - (6 + 3)/ 48 = 0,81

 

(6 — количество плюсов, "заблудившихся" в минусовой облас­ти; 3 — количество минусов, находящихся в плюсовой области). Если такое значение критерия представляется неприемлемым (19% "неправильных" клеток в таблице), то приходим к выво­ду, что наша гипотеза о наличии латентной переменной, прояв­ляющейся в рассматриваемых наблюдаемых признаках, не верна.

Итак, наша работа начинается с того (имеется в виду этап ра­боты после предварительного формирования анкеты), что мы проводим пробное исследование, собираем данные и переставля­ем столбцы и строки полученной матрицы до тех пор, пока она либо приобретет диагональный вид, либо мы убедимся в том, что это сделать невозможно. В первом случае мы полагаем, что одномерная латентная переменная существует, признаки и спо­соб выражения через них латентной переменной выбраны удач­но, и переходим к основному исследованию. Во втором — вооб­ще говоря, отказываемся от построения одномерной шкалы. Од­нако в отдельных случаях исправить положение можно с помо­щью некоторой корректировки данных. Скажем, может оказать­ся, что привести матрицу к диагональному виду нам мешает ка­кой-то ее столбец. Тогда выбросим из рассмотрения соответ­ствующее суждение: оно не укладывается в наше упорядочение (может быть, не так понимается респондентами, как мы рассчи­тывали, и т.д.). Затем перейдем к основному исследованию. В при­веденном выше примере таким суждением можно считать шестое (правда, убрав его, мы уменьшим долю "неправильных" клеток не до 10%, а только до 12% (стало быть, R будет равно 0,88).

В основе шкалирования по Гуттману лежит схема ответов, допускающая следующие операции:
1. Балл установки респондента равен сумме положительных реакций (числу знаков «+») на высказывания.
2. Балл установки позволяет воспроизвести реакции на отдельные суждения.
Годными для шкалирования признаются лишь те суждения, которые дают монотонную последовательность ответов.
Методика Гуттмана состоит из восьми этапов.
^ Первый этап. Подбор суждений. Исследователь априори выбирает суждения, относящиеся к установке людей на изучаемый объект или явление. В состоянии ли эти суждения образовать шкалу решается экспертной проверкой. Требования к суждениям следующие:
наличие двух альтернативных ответов — только «да» или «нет»;
нацеленность на изучение какой-то одной специфической области;
расположение по кумулятивной (накопительной) шкале, т.е. если респондент дал положительный ответ на первое суждение, то существует большая вероятность того, что и на последующие он даст положительные ответы. Гуттман считает, что реакции на суждения образуют одномерный континуум.
Можно привести следующий пример анкеты, построенной согласно процедуре Гуттмана:
Новая общественная система, сложившаяся в России после 1991 года, несомненно, способствует повышению производительности труда.
Согласен Не согласен
Если брать в целом, эта система лучше той, что была раньше.
Согласен Не согласен
Некоторые стороны новой общественной системы плохо продуманы.
Согласен Не согласен
Как и любая другая система организации общественной жизни, новая система имеет немало минусов.
Согласен Не согласен
Новая система удачно сочетает материальное и моральное стимулирование работников
Согласен Не согласен
Аргументы в пользу новой системы очень убедительны
Согласен Не согласен
В прежней системе было немало хорошего, что утрачено в новой системе
Согласен Не согласен
Преимущества новой системы организации жизни общества совершенно не ясны.
Согласен Не согласен
Согласие с суждениями 1, 2, 5, 6 и несогласие с суждениями 3, 4, 7, 8 означает благоприятное отношение к новой общественной системе. Идеальная шкалограмма предполагает, что ответ на один из вопросов должен повлечь за собой определенный ответ на следующий за ним по нисходящей ветви. Главная задача исследователя состоит в том, чтобы выяснить, действительно ли ответы на эти вопросы образуют одномерный континуум.
^ Второй этап. Подбор экспертов.
Третий этап. Экспертная оценка предложенных суждений.
Четвертый этап. Процедура обработки данных. Данные опроса экспертов заносятся в таблицу так, чтобы упорядочить опрошенных по схеме: от суждений, выражающих благожелательное отношение к объекту оценивания, до суждений, выражающих неблагоприятное отношение. Составляется первичная таблица плюсов и минусов. Каждый столбец представляет суждение, каждая строка — ответы экспертов. Из этой таблицы необходимо построить шкалограмму. Шкалограмма — это такая картина, когда люди и их ответы ранжированы. То есть расположены так, что первый человек отвечает положительно на все вопросы (первая строка состоит из одних плюсов), второй человек отвечает положительно на все вопросы, кроме последнего, третий — на все, кроме последних двух и т.д.
В шкалограмме нужно провести наклонную прямую, отсекающую плюсы от минусов. Но практически так никогда не получается. Представляя строки и столбцы, можно составить только приблизительную шкалограмму, где наклонная прямая не рассекает таблицу на часть с плюсами и часть с минусами, а представляет лестницу.
Например, мы опросили 12 экспертов и получили следующую шкалограмм
Шкалограмма

№ эксперта Балл эксперта Суждения
7 5 1 8 2 4 6 3
5 8 + + + + + + + +
7 7 + + + + + + +
8 6 + + + + + +
10 6 + + + + + +
2 5 + + + + +
1 4 + + + +
6 4 + + + +
11 4 + + + +
4 3 + + +
12 3 + + +
3 2 + +
9 1 +

 

Балл эксперта высчитывается по схеме: при ответе «согласен» на 1, 2, 5, 6 суждения нашего примера эксперту присваивается 1 балл, при ответе «не согласен» на 3, 4, 7, 8 суждения также 1 балл. На противоположные ответы на эти суждения присваивается 0 баллов. Таким образом, максимально эксперт может набрать 8 баллов.
^ Пятый этап. Проверка шкалы на воспроизводимость. По коэффициенту воспроизводимости определяют возможность воспроизведения ответов экспертов на выборке респондентов. Коэффициент воспроизводимости определяет возможное число отклонений от идеальной шкалы:

где ^ V — коэффициент воспроизводимости;
n — число ошибочных ответов;
K — число пунктов шкалы, по которым следует дать ответ (в нашем примере 8);
N — число экспертов.
Для нашего примера:

0,85. Он характеризует степень приближенности к идеальной шкалограмме, в которой коэффициент воспроизводимости равен 1,00.³Суждения считаются пригодными для шкалирования, если коэффициент воспроизводимости
^ Шестой этап. Отбор надежных суждений. Если коэффициент воспроизводимости меньше 0,85, тогда отбрасываются суждения, дающие много ошибочных ответов. Строится новая шкалограмма и высчитывается новый коэффициент воспроизводимости. Эта процедура повторяется до тех пор, пока не будут отобраны надежные и значимые суждения. Шкала с коэффициентом воспроизводимости не менее 0,85 готова.
^ Седьмой этап. Проведение опроса респондентов. При массовом опросе все суждения тасуются в беспорядке.
Восьмой этап. Математическая обработка полученных данных. Ранг каждого респондента определяется по сумме набранных им баллов. Затем высчитывается среднеарифметический ранг данной категории обследованных. Сравнивается с рангами других категорий. Можно сравнить, например, ранги представителей различных профессий, демографических, этнических и прочих групп, провести корреляционный, факторный анализы и прочее. Среднестатистический ранг категории показывает общую установку этой группы людей на изучаемый объект или явление.