Понятие дисперсионного анализа

Дисперсионный анализ - это анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов. В зарубеж­ной литературе дисперсионный анализ часто обозначается как ANOVA, что переводится как анализ вариативности (Analysis of Variance). Авто­ром метода является Р. А. Фишер (Fisher R.A., 1918, 1938).

Задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака вычленить вариативность троякого рода:

а) вариативность, обусловленную действием каждой из исследуемых независимых переменных;

б) вариативность, обусловленную взаимодействием исследуемых неза­висимых переменных;

в) случайную вариативность, обусловленную всеми другими неизвест­ными переменными.

Вариативность, обусловленная действием исследуемых перемен­ных и их взаимодействием, соотносится со случайной вариативностью. Показателем этого соотношения является критерий F Фишера1.

В формулу расчета критерия F входят оценки дисперсий, то есть параметров распределения признака, поэтому критерий F является па­раметрическим критерием.

___________________

1 Критерии F Фишера и метод углового преобразования Фишера, дающий нам критерий φ*, - это совершенно различные методы, имеющие разное предназначе­ние и разные способы вычисления.

 

Чем в большей степени вариативность признака обусловлена ис­следуемыми переменными (факторами) или их взаимодействием, тем выше эмпирические значения критерия F.

В дисперсионном анализе исследователь исходит из предположе­ния, что одни переменные могут рассматриваться как причины, а другие - как следствия. Переменные первого рода считаются факторами, а пере­менные второго рода - результативными признаками. В этом отличие дисперсионного анализа от прямолинейного корреляционного анализа, в котором мы исходим из предположения, что изменения одного признака просто сопровождаются определенными изменениями другого.

В дисперсионном анализе возможны два принципиальных пути разделения всех исследуемых переменных на независимые переменные (факторы) и зависимые переменные (результативные признаки).

Первый путь состоит в том, что мы совершаем какие-либо воз­действия на испытуемых или учитываем какие-либо не зависящие от нас воздействия на них, и именно эти воздействия считаем независи­мыми переменными, или факторами, а исследуемые признаки рассмат­риваем как зависимые переменные, или результативные признаки. На­пример, возраст испытуемых или способ предъявления им информации считаем факторами, а обучаемость или эффективность выполнения за­дания - результативными признаками.

Второй путь предполагает, что мы, не совершая никаких воздей­ствий, считаем, что при разных уровнях развития одних психологиче­ских признаков другие проявляются тоже по-разному. По тем или иным причинам мы решаем, что одни признаки могут рассматриваться скорее как факторы, а другие - как результат действия этих факторов. Например, уровень интеллекта или мотивации достижения начинаем считать факторами, а профессиональную компетентность или социомет­рический статус - результативными признаками.

Второй путь весьма уязвим для критики. Допустим, мы предпо­ложили, что настойчивость - значимый фактор учебной успешности студентов. Мы принимаем настойчивость за воздействующую перемен­ную (фактор), а учебную успешность - за результативный признак. Против этого могут быть выдвинуты сразу же два возражения. Во-первых, успех может стимулировать настойчивость; во-вторых, как, собственно, измерялась настойчивость? Если она измерялась с помо­щью метода экспертных оценок, а экспертами были соученики или пре­подаватели, которым известна учебная успешность испытуемых, то не исключено, что это оценка настойчивости будет зависеть от известных экспертам показателей успешности, а не наоборот.

Допустим, что в другом исследовании мы исходим из предполо­жения, что фактор социальной смелости (фактор Н) из 16-факторного личностного опросника Р.Б. Кеттелла - это та независимая переменная, которая определяет объем заключенных торговым представителем дого­воров на поставку косметических товаров. Но если объем договоров определялся по какому-то периоду работы, скажем трехмесячному, а личностное обследование проводилось в конце этого периода или даже после его истечения, то мы не можем со всей уверенностью отделить здесь причину от следствия. Есть очень сильное направление в психо­логии и психотерапии, которое утверждает, что личностные изменения начинаются с действий и поступков: "Начни действовать, и постепенно станешь таким, как твои поступки". Таким образом, психолог, пред­ставляющий это направление, возможно, стал бы утверждать, что при­чиной должен считаться достигнутый объем договорных поставок, а результатом - повышение социальной смелости.

Только наше исследовательское чутье может подсказать нам, что должно рассматриваться как причина, а что - как результат. Однако не всегда эти ощущения у разных исследователей совпадают, поэтому нужно быть готовым к тому, что наши выводы могут быть оспорены другими специалистами, которые рассматривают данный предмет с иной точки зрения и видят в нем иные перспективы. Впрочем, спорность выводов - постоянный спутник психологического исследования.

Постараемся быть оптимистичными и представим себе, что суще­ствует все же какое-то совпадение взглядов на психологические причи­ны и следствия. На Рис. 7.1 представлены два варианта рассеивания показателей учебной успешности в зависимости от уровня развития кратковременной памяти. Из Рис. 7.1(а) мы видим, что при низком уровне развития кратковременной памяти оценки по английскому языку, похоже, несколько ниже, чем при среднем, а при высоком уровне вы­ше, чем при среднем. Похоже, что кратковременная память может рас­сматриваться как фактор успешности овладения английским языком. С другой стороны, Рис. 7.1(6) свидетельствует о том, что успешность в чистописании вряд ли так же определенно зависит от уровня развития кратковременной памяти.

О том, верны ли наши предположения, мы сможем судить только после вычисления эмпирических значений критерия F.

 

Рис. 7.1. Рассеивание индивидуальных средних оценок по английскому языку (а) и чистописа­нию (б) у учеников с низким, средним и высоким уровнями развития кратковременной памяти

 

Низкий, средний и высокий уровни развития кратковременной памя­ти можно рассматривать как градации фактора кратковременной памяти.

Нулевая гипотеза в дисперсионном анализе будет гласить, что средние величины исследуемого результативного признака во всех гра­дациях одинаковы.

Альтернативная гипотеза будет утверждать, что средние вели­чины результативного признака в разных градациях исследуемого фак­тора различны.

В зарубежных руководствах чаще говорят о переменных, дейст­вующих в разных условиях, а не о факторах и их градациях (Greene J., D'Olivera M, 1982, р. 91-93).

Дело в том, что градация подразумевает ступень, стадию, уро­вень развития. Говоря о градациях фактора, мы явно или неявно подра­зумеваем, что сила его возрастает при переходе от градации к градации. Между тем, схема дисперсионного анализа применима и в тех случаях, когда градации фактора представляют собой номинативную шкалу, то есть отличаются лишь качественно. Например, градациями фактора могут быть: параллельные формы экспериментальных заданий; цвет окраски стимулов; жанр музыкальных произведений, сопровождающих процесс работы; традиционные или специально подобранные православ­ные тексты в сеансах аутогенной тренировки; разные формы заболева­ния; разные экспериментаторы; разные психотерапевты и т. д.

Если градации фактора различаются лишь качественно, их лучше называть условиями действия фактора или переменной. Например, дей­ствие аутогенной тренировки при условии использования текстов право­славных молитв или эффективность психокоррёкционных воздействий при разных формах хронических заболеваний у детей3.

Экспериментальные данные, представленные по градациям фак­тора, называются дисперсионным комплексом. Данные, относящиеся к отдельным градациям - ячейками комплекса.

Дисперсионный анализ позволяет нам констатировать изменение признака, но при этом не указывает направление этих изменений. Нам необходимо специально графически представлять полученные данные по градациям фактора, чтобы получить наглядное представление о направ­лении изменений.

Подобного рода задачи, как мы помним, позволяют решать непа­раметрические методы сравнения выборок или условий измерения, а именно критерий Н. Крускала-Уоллиса и критерий χ2r Фридмана (см. параграфы 2.4 и 3.4). Однако это касается только тех задач, в кото­рых исследуется действие одного фактора, или одной переменной. За­дачи однофакторного дисперсионного анализа, действительно, могут эффективным образом решаться с помощью непараметрических методов. Метод дисперсионного анализа становится незаменимым только когда мы исследуем одновременное действие двух (или более) факторов, по­скольку он позволяет выявить взаимодействие факторов в их влиянии на один и тот же результативный признак. Именно эти возможности двухфакторного дисперсионного анализа послужили причиной, по кото­рой изложение этого метода включено в настоящее руководство.

Несмотря на то, что нас интересует прежде всего двухфакторный дисперсионный анализ, который нельзя заменить другими методами, начнем рассмотрение мы с однофакторного дисперсионного анализа: во-первых, для того, чтобы выдержать определенную последовательность и логику в изложении; во-вторых, для того, чтобы на реальном примере продемонстрировать возможность замены этого метода непараметриче­скими методами.

См. исследование Е. Б. Кулевой, 1991. См. исследование Н.В.Корольковой, 1994.

Итак, начнем рассмотрение дисперсионного анализа с простей­шего случая, когда исследуется действие только одной переменной (одного фактора). Исследователя интересует, как изменяется опреде­ленный признак в разных условиях действия этой переменной. Напри­мер, как изменяется время решения задачи при разных условиях моти­вации испытуемых (низкой, средней, высокой) или при разных спосо­бах предъявления задачи (устно, письменно, в виде текста с графиками и иллюстрациями), в разных условиях работы с задачей (в одиночестве, в одной комнате с экспериментатором, в одной комнате с эксперимен­татором и другими испытуемыми) и т.п. В первом случае переменной, влияние которой исследуется, является мотивация, во втором - степень наглядности, в третьем - фактор публичности.

Преимущество однофакторного дисперсионного анализа по срав­нению с непараметрическими методами Н Крускала-Уоллиса и χ2r Фридмана - неограниченность в объемах выборок. Ограничения дис­персионного анализа достаточно условны. Например, требование нор­мальности распределения признака можно обойти по крайней мере дву­мя путями: при слишком скошенном, островершинном или плосковер­шинном распределении можно, во-первых, нормализовать данные, а во-вторых... просто вообще по этому поводу "не волноваться", как советуют, например, А.К. Kurtz и S.T. Мауо (1979, р.417).