Двухфакторный дисперсионный анализ

Итак, мы увидели, что двухфакторный план позволяет исследовать три эффекта независимых переменных: два основных эффекта факторов и одно взаимодействие между этими двумя независимыми переменными. Кроме того, в двухфакторном межгрупповом плане присутствует эффект статистической (экспериментальной) ошибки, который определяет внутригрупповые различия между испытуемыми одной и той же группы. Эти различия никак не связаны с исследуемыми экспериментальными эффектами.

Таким образом, вся дисперсия, наблюдаемая в экспериментах рассматриваемого типа, может быть разложена на две аддитивные части: 1) дисперсия, определяющая вариативность данных между группами испытуемых, и 2) дисперсия, отражающая вариативность данных внутри самих экспериментальных групп. Дисперсия данных между группами испытуемых, в свою очередь, может быть разложена еще на три аддитивные части: дисперсия, источником которой является каждый из экспериментальных факторов в отдельности, и дисперсия, заданная их взаимодействием. Наглядно эти рассуждения представлены на рис. 5.1.

Рис. 5.1. Источники дисперсии в межгрупповом двухфакторном плане

Пусть

Тогда, сохраняя принятые в параграфе 5.1 соглашения о средних значениях на каждом уровне независимых переменных и общем среднем, дисперсии (средние квадраты) основных эффектов независимых переменных, очевидно, можно оценить следующим образом:

Средний квадрат взаимодействия факторов А и В оценим по следующей формуле:

Наконец, эффект статистической ошибки, отражающий внутригрупповые вариации данных, можно оценить так:

Как обычно, для того, чтобы оценить статистическую надежность экспериментальных эффектов, необходимо правильно построить F-отношение. Однако применительно к факторным планам построение такой статистики оказывается неоднозначным. Дело в том, что правила построения F-отношения разнятся в зависимости от выбранной структурной модели, а она, в свою очередь, среди прочего определяется тем, каким образом трактуются в эксперименте независимые переменные (факторы) – как случайные или как фиксированные.

Структурные модели двухфакторного дисперсионного анализа

Вспомним, что фиксированными называют такие независимые переменные, которые в эксперименте принимают все возможные значения. Это наиболее распространенный случай, и, как правило, статистические пакеты, используемые для обработки данных, по умолчанию настроены именно на обработку таких данных. Бывает, однако, что исследователь не может в эксперименте объять все возможные значения факторов. Например, исследователя могут интересовать процессы идентификации слов, и сами слова рассматриваются как уровни независимой переменной. Понятно, что исследователь в эксперименте всегда ограничен в выборе слов естественного языка вследствие их чрезвычайной многочисленности. В этом случае он случайным образом выбирает из словаря ограниченный набор слов, которые и будут представлять собой случайную выборку уровней соответствующего фактора. Такая независимая переменная будет случайной.

В зависимости от того, какие факторы двухфакторного экспериментального плана будут рассматриваться как фиксированные или случайные, можно выделить три возможные структурные модели (табл. 5.2):

• полностью фиксированная модель, в которой обе независимые переменные оказываются фиксированными (модель I);

• смешанная модель, в которой один из экспериментальных факторов оказывается фиксированным, а второй – случайным (модель II);

• полностью случайная модель, где оба фактора рассматриваются исследователем как случайные (модель III).

Поскольку оба экспериментальных фактора, эффекты которых на зависимую переменную исследуются в эксперименте, равноценны с точки зрения организации и планирования этого эксперимента, в дальнейшим условимся считать, что в смешанной модели фактор А оказывается случайным, а фактор В – фиксированным.

Структурные модели двухфакторного ANOVA для межгруппового плана

Факторы

А фиксирован

А случаен

В фиксирован

Модель I

Модель II

В случаен

Модель II

Модель III

Будем предполагать, что всякое значение зависимой переменной включает в себя пять аддитивных параметров:

• популяционную среднюю μ, постоянную для всей генеральной совокупности;

• эффект фактора А – α;

• эффект фактора В – β;

• эффект взаимодействия факторов А и В – αβ;

• эффект экспериментальной ошибки – ε.

Иными словами, будем считать, что произвольно выбранный результат испытуемого k в группе ij может быть разложен на следующие составные части:

Как видим, мы снова встречаемся с приложением в экспериментальной работе общих линейных моделей, теперь еще более сложных.

Обозначим прописной латинской буквой число уровней фактора в генеральной совокупности, а строчной – в выборке. Таким образом, Р будет обозначать число уровней фактора А в бесконечном эксперименте, или, что то же самое, генеральной совокупности. Соответственно, буква Q будет обозначать число уровней фактора В в таком же бесконечном эксперименте, где исследователь может перебрать предельно возможное число уровней этого фактора. Тогда строчные буквы р и q будут обозначать то число уровней факторов А и В, которое исследуется в реальном эксперименте, т.е. выборочные значения уровней независимой переменной.

Теоретически доказано, что средние квадраты, дисперсии, основных экспериментальных эффектов факторов А и В должны описываться следующими соотношениями:

В случае, когда переменные А и В оказываются фиксированными, т.е. когда р = Р и q = Q, эти соотношения, очевидно, должны быть переписаны следующим образом:

Если же значения факторов А и В, которые будут исследоваться в эксперименте, случайным образом выбираются из бесконечного числа их возможных значений в генеральной совокупности, логично утверждать, что выборочное число уровней независимой оказывается значительно меньшим, чем бесконечно большое число их значений в генеральной совокупности. Тогда можно заключить, что отношения выборочных значений числа уровней независимых переменных к их популяционным значениям пренебрежимо мало отличается от нуля. Таким образом, средние квадраты основных эффектов в случае случайности независимых переменных теоретически должны описываться следующими уравнениями:

Что касается дисперсии взаимодействия, то ее оцениваемая в эксперименте величина, должна описываться следующим соотношением:

Наконец, ожидаемое значение экспериментальной ошибки будет выражаться так:

Таблица 5.3

Теоретически ожидаемые значения средних квадратов основных эффектов независимых переменных, их взаимодействия и экспериментальной ошибки в двухфакторном межгрупповом эксперименте

Средний квадрат

Модель

фиксированная (модель I)

смешанная (модель II)

случайная (модель II)

В табл. 5.3 отражены ожидаемые значения оцениваемой дисперсии основных эффектов, их взаимодействия и экспериментальной ошибки для трех возможных структурных моделей двухфакторного дисперсионного анализа применительно к межгрупповому плану. Еще раз отметим, что в данном случае смешанная модель подразумевает случайность фактора А и фиксированность фактора В.

Теперь можно обозначить статистические гипотезы, которые проверяются в двухфакторном эксперименте. Понятно, что они касаются основных эффектов факторов А и В и их взаимодействия. Если предположить равенство этих эффектов на всех уровнях независимых переменных, то нулевые гипотезы будут выглядеть следующим образом:

Очевидно, что каждая из этих гипотез предполагает нулевое значение эффекта каждого из экспериментальных факторов и их взаимодействия, хотя сами значения α, β и αβ могут отличаться от нулевых. Иными словами,

Альтернативные гипотезы, утверждающие неравенство основных эффектов независимых переменных и их взаимодействия на разных уровнях этих переменных, будут выглядеть так:

Тогда для оценки статистической надежности обнаруживаемых в эксперименте эффектов, руководствуясь теоретическими предположениями структурных моделей, отраженными в табл. 5.3, можно сформулировать следующие правила построения F-отношения.

• Фиксированная модель (модель I). Все эффекты (средние квадраты) оцениваются относительно внутригрупповой дисперсии, представляющей собой ничто иное, как дисперсию экспериментальной ошибки

• Смешанная модель (модель 11). Эффект случайного фактора оценивается относительно его взаимодействия с фиксированным фактором, а эффект фиксированного фактора и взаимодействие независимых переменных оцениваются относительно внутригрупповой дисперсии.

• Случайная модель (модель III). Основные эффекты оцениваются относительно их взаимодействия, а само взаимодействие независимых переменных оценивается относительно внутригрупповой дисперсии.

Эти правила можно сформулировать и по-другому: все эффекты в двухфакторном межгрупповом плане необходимо оценивать относительно внутригрупповой дисперсии, за исключением случая, когда оценивается эффект случайной переменной; в этом исключительном случае статистическая надежность определяется относительно взаимодействия случайной переменной с другой независимой переменной.

Следует особо отметить, что оценка эффектов случайных переменных относительно среднего квадрата для взаимодействия имеет смысл только в том случае, когда сам эффект взаимодействия оказывается достаточно выраженным. Если он выражен слабо, необходимо предварительно провести оценку статистической надежности этого эффекта. Если эта оценка дает отрицательный результат, в оценке эффекта случайной переменной необходимо действовать точно так же, как и при оценке эффектов фиксированной переменной.

Как и в случае однофакторных планов, построенное F-отношение в случае верности нулевой гипотезы теоретически должно быть равным единице. А сама статистика должна описываться законом F-распределения. Если верна альтернативная гипотеза, значение F-статистики должно быть больше единицы. Насколько статистически надежным оказывается это превышение в ситуации практической обработки данных, как обычно, можно оценить с помощью функции F-распределения. При "ручных" вычислениях для этого можно воспользоваться статистическими таблицами (см. приложение 4). В очередной раз обратим внимание также на тот факт, что ни одна структурная модель не предполагает значение F-статистики, которое оказывается меньшим единицы. Если на практике такое происходит, это означает автоматическое и безусловное принятие нулевой гипотезы. Статистическая надежность такого результата не исследуется и в экспериментальном отчете не констатируется. Такие действия будут бессмысленными с точки зрения исследуемых структурных моделей.