Принимали ли Вы участие в последних выборах главы городско­го самоуправления?

1 —да;

2 — нет;

3 — не помню.

При обработке данных опроса нам для проверки гипотезы необходимо сопоставить значения независимой переменной (возраст) с соответствующими им значениями зависимой пере­менной (участие или неучастие в выборах). С целью такого сопоставления мы после соответствующей обработки данных (вручную или с помощью компьютерного пакета SPSS) состав­ляем табл. 4.14.

Таблица 4.14

Участие в выборах избирателей различных возрастов

 

 

Возраст, годы Участие в голосовании Всего
нет ответа да нет не помнят
18-24
Процент построке 34,8 58,7 6,5 9,2
Процентпо столбцу 5,3 17,4 7,9  
25-29
Процентпостроке 54,5 32,7 12,7 11,0
Процент по столбцу 10,0 11,6 18,4  
30-39
Процент по строке 3,1 59,8 27,8 9,3 19,4
Процент по столбцу 50,0 19,3 17,4 23,7  
40—49
Процент по строке 0,9 65,2 27,8 6,1 23,0
Процент по столбцу 16,7 24,9 20,6 18,4  
50-59
Процент по строке 64,9 27,0 8,1 14,8
Процент по столбцу 15,9 12,9 15,8  
60-70
Процент по строке 70,0 25,7 4,3 14,0
Процентпостолбцу 16,3 11,6 7,9  
Старше 70
Процент по строке 4,7 58,1 30,2 7,0 8,6
Процентпо столбцу 33,3 8,3 8,4 7,9  
Всего
Процент 1,2 60,2 31,0 7,6 100,0

 

Такая таблица называется «кросстаб»20, а процесс ее созда­ния — «кросстабуляция». Это один из основных способов ана­лиза, используемых для того, чтобы увидеть, какую связь пе­ременные имеют друг с другом. Вообще говоря, категории не­зависимой переменной могут размещаться как по строкам, так и по столбцам (или, что то же самое, — графам) кросстаба. Обычно независимую переменную помещают в верхней части кросстаба, формируя таким образом столбцы из значений зави­симой переменной. Однако на практике — чаще всего из сооб­ражений удобства — для наглядности и для того, чтобы умес­тить кросстаб на одной странице, его иногда конструируют так, чтобы сверху вниз шла переменная с большим числом категорий (т.е. значений, которые может принимать переменная). Реаль­но, конечно, не имеет значения, как будет сконструирован кросстаб: имея независимую переменную в верхней части таб­лицы (по горизонтали) или сверху вниз (по вертикали). Глав­ное — соблюсти правило: когда выбор сделан, процентные от­ношения в таблице должны вычисляться таким образом, что­бы проверить наличие связи. Давайте на примере кросстаба 17 посмотрим, как производится чтение таблицы — процесс, в ходе которого и выявляется наличие или отсутствие связи между переменными и ее параметры.

Прежде всего обратим внимание на крайний правый столбец и две нижние строки. Здесь сведены контрольные суммы. Смысл приведенных цифр таков: число в верхней правой ячейке гово- рит о том, что общее число опрошенных в возрасте от 18 до 24 лет составляет 46 человек; цифра в ячейке ниже сообщает, что это составляет 9,2% общей численности выборочного массива, (500 человек, которые и принимаются за 100%, — данные в клет-1 ках в правом нижнем углу таблицы); общее число опрошенных в возрасте от 25 до 29 лет — 55 человек, это составляет 11,0% общей численности выборочного массива и т.д. В самой нижней строке приведены контрольные суммы количества тех, кто дал различные ответы об участии в голосовании по всем возрастным группам. Так, общее число принимавших участие в голосовании («да») — 301 человек, что составляет 60,2% общего объема выбо­рочного массива; тех, кто не принимал участие («нет»), было в выборочном массиве 155, или Ъ\%,\\ т.д. Две ячейки в нижнем правом углу указывают на общую численность участников опро-

са, которая принимается за 100% для обеих исследуемых пере­менных. Контрольные суммы позволяют убедиться, что в про­цессе обработки были учтены ответы всех без исключения кате­горий респондентов.

Отметим также, что в этой таблице мы привели для макси­мальной полноты распределение по возрастам и тех, кто вообще не дал в анкете ответа на данный вопрос (столбец под заголов­ком «нет ответа»), а также тех, кто не смог точно вспомнить факта своего участия или неучастия (столбец «не помнят»). Во­обще говоря, содержимое этих столбцов не очень информатив­но, и в итоговом отчете их можно опустить (здесь они нужны скорее для того, чтобы убедиться, что сошлись контрольные сум­мы). Хотя порой знание о том, какое число (и какой процент) респондентов не дали ответа или в той или иной форме уклони­лись от него, бывает достаточно полезным — например, при ана­лизе осведомленности респондентов или степени заинтересован­ности их в какой-то проблеме. Кроме того, следовало бы под­вергнуть особому анализу обе категории (тех, кто не дал ответа, и тех, кто не помнит), если бы численность их оказалась стати­стически значимой.

Анализ проводят, отслеживая изменения значений зависи­мой переменной при переходе ее от одного значения к друго­му. В данном примере в качестве независимой переменной вы­ступает возраст респондентов, в качестве зависимой — их элек­торальная активность (выражаемая участием либо неучастием в голосовании). Процедуру отслеживания изменений значения зависимой переменной можно проводить как по строкам, так и столбцам. Двигаясь по строкам, мы начинаем с первого зна­чения независимой переменной (возраст) — 18—24 года. Мы видим, что здесь число принимавших участие в выборах замет­но — более чем в 1,5 раза — меньше числа тех, кто не участво­вал. Перейдя к следующей строке — 25—29 лет, мы убеждаем­ся, что в этой возрастной категории соотношение между чис­лом участвовавших и не участвовавших противоположное: первых уже более чем в 2 раза больше. Это соотношение еще более возрастает при переходе к следующим возрастным кате­гориям, хотя и несколько снижается для самой старшей груп­пы избирателей (старше 70 лет). Это позволяет нам сделать вы­воды: 1) о наличии связи между независимой (возраст) и зави­симой (участие в выборах) переменными; 2) о направлении этой связи, которая в данном случае является прямой или положи­тельной, поскольку ее можно выразить следующим простым описанием: чем больше значения независимой переменной (воз-212

 

раст), тем больше значения зависимой переменной (процент участия в выборах).

Фактически, как мы видим, непосредственному анализу здесь подвергались далеко не все цифры, а лишь некоторые из них — те, которые можно было бы свести в сокращенном варианте в виде табл. 4.14а.

Таблица 4.14а

Соотношения участия в выборах и абсентеизма21 в различных возрастных группах

Возраст, годы Участвовали Не участвовали
18-24 34,8 58,7
25-29 54,5 32,7
30-39 59,8 27,8
40-49 65,2 27,8
50-59 64,9 27,0
60-70 70,0 25,7
Старше 70 58,1 30,2

Данные, приведенные в табл. 4.14 и 4.14а и отраженные в виде графика на рис. 4.3, позволяют нам сделать следующие основные выводы: 1) существует отчетливо выраженная связь между воз­растом избирателей и их электоральной активностью; 2) эта связь в основном положительная — чем больше возраст, тем выше про­цент участия представителей этой возрастной группы в голосов вании; исключение составляет лишь самая верхняя возрастная группа, где электоральная активность по вполне понятным при­чинам снижается. Второй из указанных выводов основан на пра­виле, определяющем направление связи: когда низкие значения одной переменной ассоциируются с низкими значениями дру-гой переменной (и наоборот), имеет место положительная связь; например, «чем выше уровень образования у кого-то, тем выше уровень его политического интереса». Когда низкие значения одной переменной ассоциируются с высокими значениями дру­гой, между двумя переменными существует отрицательная связь; например, «чем выше чей-то доход, тем менее он либерален».

Мы могли бы построить графическое отображение и несколь­ко иным способом — в виде распределения, нормированного на 213

100%, где в столбцах диаграммы отражена доля каждой из кате­горий в общей сумме (рис. 4.4).

 

Иногда для большей наглядности и убедительности анализа используют различные индексы. Это специально создаваемые по­казатели, с помощью которых связь между переменнными прояв­ляется более зримо и отчетливо. Здесь должны прийти на помощь 214

воображение и опыт. Мы могли бы, например, сконструировать по данным табл. 4.14а «индекс электорального участия», равный частному от деления числа принимавших участие в каждой из возрастных групп на число тех, кто не голосовал. Результаты от­ражены в табл. 4.146 и на рис. 4.5.

Таблица 4.146 | Индекс электорального участия в различных возрастных группах

Возраст, годы Индекс участия
18-24 0,592845
25-29 1,666667
30-39 2,151079
40-49 2,345324
50-59 2,403704
60-70 2,723735
Старше 70 1,923841

Нетрудно убедиться, что формы кривых на рис. 4.3 и 4.5 со­вершенно идентичны (та же зависимость), хотя значения на оси ординат иные. Мы могли бы построить индекс иначе (скажем, не разделив, а вычтя одно из другого) и убедиться, что результат был бы таким же.

 

Теперь представим себе, что данные опроса были бы принци­пиально иными, такими, например, как это представлено в гипо­тетической табл. 4.14в.

Вывод, который мы могли бы сделать из такого рода данных, сомнения не вызывает: связи между возрастом и электоральной активностью не наблюдается. При этом мы опираемся на прави-ло, сформулированное в предыдущей главе: нет изменения — нет связи.

Глава 4. Анализ эмпирических данных 215

Понятие силы связи имеет отношение к тому, насколько суще­ственно различаются наблюдаемые значения зависимой переменной при изменении значений независимой переменной. Если, предполо­жим, характер голосования одной категории избирателей (к при­меру, мужчин) значительно отличается от характера голосования другой категории (женщин), тогда мы можем утверждать, что имеет место сильная связь между двумя переменными. Если сте­пень различия в характере их голосования мала, имеет место сла­бая связь.

Таблица 4.14в

Соотношения участия в выборах и абсентеизма в различных возрастных группах (в процентах к численности каждой возрастной группы)

Возраст, годы Участвовали Не участвовали
18-24 59,8 27,8
25-29 59,8 27,8
30-39 59,8 27,8
40-49 59,8 27,8
50-59 59,8 27,8
60-70 59,8 27,8
Старше 70 59,8 27,8

Источник: Гипотетические данные.

Наиболее сильная из возможных связей между двумя перемен­ными — это такая связь, при которой значение зависимой пере­менной для каждого случая в одной категории независимой пе­ременной отличается от каждого из случаев в другой категории. Такую связь называют совершенной, потому что зависимая пере­менная абсолютно ассоциируется с независимой переменной, не допуская никаких исключений. Совершенная связь между неза­висимой и зависимой переменными дает исследователю возмож­ность точно предсказать значение любого из случаев зависимой переменной, если известно значение независимой. Пример совер­шенной связи для гипотетического случая различий в голосова­нии приведен в табл. 4.14г. Между переменными может существо­вать как совершенная положительная, так и совершенная отрица­тельная связь, поскольку направление и сила — это разные свойства связи.

Строго говоря, в реальных распределениях социологических дан­ных крайне редко встречаются как совершенная связь, так и абсо­лютно полное отсутствие связи. Фактически отсутствие связи выра­жается в слабости связи. Слабой можно было бы считать такую связь, при которой различия наблюдаемых значений зависимой перемен-216

ной для различных категорий независимой переменной незначитель­ны. Фактически наиболее слабая связь — это такая, в которой рас­пределение было бы идентично для всех категорий независимой пе­ременной — другими словами, связь просто отсутствует.

Таблица 4.14г

Различия в голосовании за различных кандидатов в зависимости от пола избирателей

 

Кандидат Голосование(%)
Мужчины Женщины
Иванов
Петрова
Всего

Источник: Гипотетические данные.

Пример из социологической практики.Американские социологи Раймонд Уолфингер и Стивен Розенстоун в своем анализе причин, J. по которым люди голосуют, использовали анализ кросстаба для про- ■ верки гипотезы, что чем выше уровень образования индивида, тем сбольшей вероятностью он примет участие в голосовании. Табл. 4.15 позволяет прийти к следующим выводам: 1) связь между образова- .; нием и явкой избирателя на выборы реально существует; 2) направ­ление ее таково, как определяет гипотеза; 3) связь довольно сильная. Это хороший пример кросстаба с независимой переменной, разме- * щенной сверху вниз таблицы, поскольку она включает много кате- i горий. В этом случае процентные отношения размешаются по стро- \ кам, а сравнение проводится вниз по столбцам.

Таблица 4.15

Связь между образованием иявкой на выборы

 

Число лет образования (независимая переменная) Явка на выборы (зависимая переменная)
Голосовали{%) Не голосовали(%) Общая доля в выборке (%)
0-4 года
5-7лет
8 лет
9-11 лет
12 лет
1-3 года колледжа
4 года колледжа
Sлетколледжа

Довольно часто используемым показателем силы связи выступа­ют различные коэффициенты корреляции22. Корреляция указывает на степень статистической взаимосвязи признаков. Одним из индек­сов такого рода при использовании порядковой шкалы измерения выступает коэффициент ранговой корреляции Спирмена, названный так по имени американского психолога Чарльза Спирмена, который использовал его в своих исследованиях вместо обычных коэффици­ентов корреляции. Формула расчета его имеет следующий вид:

где dj — разность рангов; /— общее число сопоставляемых пар.

Понятно, что коэффициент ранговой корреляции Спирмена будет равен +1 (абсолютная положительная связь), если ответы рес­пондентов анализируемых групп будут в точности совпадать; он будет равен -1 (абсолютная отрицательная связь), если ответы всех респондентов обеих анализируемых групп будут прямо противопо­ложны; если rs = 0, то это означает полное отсутствие всякой связи.

Строго говоря, коэффициент ранговой корреляции показы­вает, насколько одинаковыми или различными оказываются от­веты на один и тот же вопрос со стороны двух сравниваемых между собою групп респондентов. Рассмотрим процедуру рас­чета rs на примере данных исследования о стереотипах сексу­ального поведения. Респондентов просили высказать степень своего согласия (выразив это в баллах от 5 — «полностью согла­сен», до 1 — «совершенно не согласен») с целым рядом сужде­ний, связанных с теми или иными сторонами интимной жиз­ни. После расчетов среднего значения были получены следую­щие результаты(табл. 4.16).

После ранжировки по степени согласия с тем или иным сужде­нием таблица приобретет несколько иной вид (табл. 4.16а). Рассчи­тав величину для каждого из значений, возведя ее в квадрат, а за­тем сложив, мы можем проделать в соответствии с формулой (4.2) следующую процедуру для расчета коэффициента корреляции:

 

Таблица 4.16 Степень согласия с суждениями (в средних значениях по 5-балльной шкале)
Суждение Мужчины Женщины
Инициатива в интимных отношениях должна принадлежать юношам 3,42 3,55
Если девушка в 18—20 лет невинна, то, скорее всего, она никому не нужна 1,58 1,57
Без секса жизнь неинтересна 3,77 3,03
Любовь бывает исключительно в книгах, в фильмах, а в жизни—только секс 2,12 1,76
Верю, что в жизни у меня будет (есть) настоящая любовь 3,88 3,91
Девушка, ведущая беспорядочную половую жизнь, останется несчастной и одинокой 3,04 3,03
Курение и алкоголь — злейшие враги сексуальности 3,42 3,79
Прежде чем вступить в брак, надо проверить, подходитлитебе человек в сексуальном отношении 4,19 3,33
Без любви не стоит заниматься сексом 2,75 3,45
Наличие денег играет большую роль в выборе сексуального партнера 2,37 2,64
Интимная близость — это соединение, в первую очередь, не половых органов, а любящих душ 3,62 4,22
Таблица 4.16а
Суждение Мужчины Женщины d d*
Интимная близость — это соединение, в первую очередь, не половых органов, а любящих душ
Верю, что в жизни у меня будет (есть) настоящая любовь
Курение и алкоголь — злейшие враги сексуальности
Инициатива в интимных отношениях должна принадлежать юношам
Без любви не стоит заниматься сексом
Прежде чем вступить в брак, надо проверить, подходитлитебе человек в сексуальном отношении -5
Без секса жизнь неинтересна
Девушка, ведущая беспорядочную половую жизнь, останется несчастной и одинокой -1
Наличие денег играет большую роль в выборе сексуального партнера
Любовь бывает исключительно в книгах, в фильмах, а в жизни — только секс
Если девушка в 18-20 лет невинна, то, скорее всего, она никому не нужна
           

Это довольно высокий уровень корреляции, указывающий на относительную близость взглядов мужчин и женщин по всему комплексу приведенных суждений (несмотря на существенные расхождения по отдельным позициям).

 

Глава 5. ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ1

Таблицы и графики — одно из самых гениальных изобретений человеческой мысли, стремившейся выразить через образный ви­деоряд сухие колонки цифр и фактов. Во всех странах мира таб­лица считается наиболее наглядной и компактной формой пред­ставления статистического материала.

Табличное и графическое оформление социологических дан­ных — это всегда завершающий этап эмпирического исследования. Закончена полевая стадия, в ходе опроса (или наблюдения, ана­лиза документов) вы использовали анкеты, бланки, карточки, про­верили правильность их заполнений. Теперь собранные сведения надо проанализировать. Инструментальная фаза позади, а впере­ди — аналитическая. Сейчас вам предстоят еще три важных и от­ветственных этапа — обработка данных, их анализ2 и составление итогового аналитического отчета.