Увеличение числа независимых переменных при построении таблиц кросс-табуляции

Таблицы кросс-табуляции можно строить, фиксируя значения нескольких независимых переменных.

При этом возможны четыре ситуации [30].

Во-первых, иногда добавление еще одной независимой переменной проясняет механизм действия выявленной ранее зависимости. Так, рассчитав таблицу кросс-табуляции между семейным положением (независимая переменная) и уровнем приобретения модной одежды (табл. 12.13), можно подумать, что многие мужчины и женщины после замужества или женитьбы теряют интерес к покупке модной одежды.

Таблица 12.13. Распределение лиц с разным семейным положением по количеству приобретаемой ими модной одежды, %

Приобретают модную одежду

Семейное положение

Все опрошенные

женат (замужем)

неженат (не замужем)

Много

31

52

37

Мало

69

48

63

Всего

100 (700)

100 (300)

100 (1000)

Однако включение в анализ еще одной независимой переменной - пола респондента (табл. 12.14), показывает, что такая закономерность проявляется лишь у женщин, причем она выражена более резко, чем у респондентов в целом.

Таблица 12.14. Распределение лиц разного пола и с разным семейным положением по количеству приобретаемой ими модной одежды, %

Приобретают

модную одежду

Пол

Все

опрошенные

мужчины

женщины

Семейное положение

Семейное положение

женат

неженат

замужем

не замужем

Много

35

40

25

60

37

Мало

65

60

75

40

63

Всего

100 (400)

100 (120)

100 (300)

100 (180)

100 (1000)

Во-вторых, иногда оказывается, что ранее наблюдавшаяся зависимость была иллюзорной, так называемой ложной корреляцией; что на самом деле существует другой фактор, вариацией которого и объяснялись наблюдавшиеся эффекты. Так, просмотр табл. 12.15 создает впечатление, что люди с более высоким образованием чаще приобретают дорогие марки автомобилей.

Таблица 12.15. Наличие автомобиля дорогой марки у лиц с разным образованием, %

Наличие дорогого автомобиля

Образование

Все

опрошенные

высшее

не высшее

Есть

32

21

24

Нет

68

79

76

Всего

100 (250)

100 (750)

100 (1000)

Включение в анализ еще одной независимой переменной - дохода респондента (табл. 12.16) - показывает, что образование само по себе не влияет на вероятность приобретения дорогого автомобиля; истинной причиной наблюдавшихся различий является уровень дохода, который у лиц с высшим образованием, как правило, выше.

Таблица 12.16. Наличие автомобиля дорогой марки у лиц с разным доходом и образованием, %

Наличие

дорогого

автомобиля

Доход

Все опрошенные

низкий

высокий

Образование

Образование

высшее

не высшее

высшее

не высшее

Есть

20

20

40

40

Нет

80

80

60

60

Всего

100

100

100

100

100

(100)

(700)

(150)

(50)

(1000)

В-третьих, иногда добавление еще одной или нескольких независимых переменных позволяет выявить ранее скрытую зависимость. Например, попытка выявить предполагавшуюся связь между возрастом и заинтересованностью в путешествиях за границу окончилась неудачей (табл. 12.17).

Таблица 12.17. Заинтересованность в заграничном туризме у лиц разного возраста, %

Заинтересованность в заграничном туризме

Возраст

Все

опрошенные

до 45 лет

45 лет и старше

Заинтересованы

50

50

50

Не заинтересованы

50

50

50

Всего

100 (500)

100 (500)

100 (1000)

Разделив же респондентов еще и по полу (табл. 12.18), исследователи обнаружили искомую зависимость, которая у мужчин и женщин оказалась разнонаправленной.

Таблица 12.18. Заинтересованность в заграничном туризме у лиц разного пола и возраста, %

Заинтересованность в заграничном туризме

Пол

Все опрошенные

мужчины

женщины

Возраст

Возраст

до 45 лет

45 лет и старше

до 45 лет

45 лет и старше

Заинтересованы

60

40

35

65

50

Не заинтересованы

40

60

65

35

50

Всего

100

(300)

100

(300)

100

(200)

100

(200)

100

(1000)

Наконец, в-четвертых, не исключено, что включение в анализ независимых переменных ничего не меняет в отношении ранее выявленной или, наоборот, не выявленной парной закономерности.

В целом же увеличение числа независимых переменных при построении таблиц кросс-табуляции бывает полезным. Но не следует этим злоупотреблять. Нельзя допускать формирования при анализе настолько малых групп по строкам и по столбцам, чтобы нарушалось условие fe ≥ 5, где fe - ожидаемое число респондентов в клетке таблицы кросс-табуляции в предположении о независимости ее строк и столбцов.