Д.А. с повторными измерениями

Дисперсионный анализ

Дисперсионный анализ исследования влияния одной или нескольких качественных переменных (факторов) на однуависимую количественную переменную.

В основе дисперсионного анализа лежит предположение о том, что одни переменные могутрассматриваться как причины (факторы, независимые переменные), а другие как следствия зависимые переменные). Таким образом, исходя из этого, при описании результатов мы будем говорить о наличие зависимости между зависимой и независимой переменной.

Основной целью является исследование значимости различия между средними с помощью сравнения дисперсий. Разделение общей дисперсии на несколько источников, позволяет сравнить дисперсию, вызванную различием между группами, с дисперсией, вызванной внутригрупповой изменчивостью. Сравнивая компоненты дисперсии друг с другом посредством F-критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов.

Исходя из вышесказанного, целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, то принимается гипотеза о существовании различия между средними.

Исходным материалом для дисперсионного анализа служат данные исследования трех и более выборок, которые могут быть как равными, так и неравными по численности, как связными, так и несвязными.

Типичная схема эксперимента сводится к изучению влияния независимой переменной (одной или нескольких) на зависимую переменную.

Обязательным условием является то, чтоб зависимая переменная была представлена в шкале отношений, интервалов или порядка, а влияющие (независимые) переменные имели бы нечисловую природу (номинальная или категориальная шкала). Зависимая переменная рассматривается как изменяющаяся под влиянием независимых переменных. Независимая переменная представляет собой качественно определенный (номинальный) признак, имеющий две и более градаций. Каждой градации независимой переменной соответствует выборка объектов, для которых определены значения зависимой переменной.

Выделяют однофакторный д.а. , многофакторный д.а , д.а с повторными

измерениями и многомерный д.а.

Однофакторный д.а.

Этот вид дисперсионного анализа позволяет проверить гипотезу о существовании влиянияизучаемого фактора на зависимую переменную.

Математическая модель однофакторного д.а предполагает выделение в общей изменчивости зависимой переменной двух ее составляющих: межгрупповая составляющая изменчивости обусловлена различием средних значений под влиянием фактора; внутригрупповая составляющая изменчивости обусловлена влиянием неучтенных причин.

Соотношение этих двух составляющих изменчивости и есть основной показатель, определяющий статистическую значимость влияния фактора. При выявлении уровня ошибки выше или равно 5% (т.е. р0,05), подтверждается гипотеза о равенстве средних значений. А при уровне ошибки меньше 5% (т.е. р<0,05) подтверждается гипотеза о различие по крайней мере двух средних значений.

Ограничения метода: 1) дисперсии выборок должны быть однородны; для этого смотрят на результаты критерия Ливена, направленный на выявление однородности дисперсий (т.е. если при проведении теста Ливена p0,05, значит Вы можете смело применять для своих данных дисперсионный анализ); 2) формально численность выборок не должно быть меньше двух объектов.

Альтернатива – сравнение независимых выборок по критерию H-Краскела-Уоллеса. Основным показателем для принятия решения является F-критерий Фишера и, конечно же, его уровень достоверности.

Если Ваш фактор состоит из более 2-х градаций, то Вам необходимо дополнительно проводить множественные сравнения средних значений, чтобы можно было сделать вывод о том, как различаются друг от друга средние значения для разных градаций фактора. Это касается не только однофакторного д.а., но и других видов дисперсионного анализа, если Ваш фактор имеет более 2-х градаций.

Одним из актуальных вопросов на этапе множественных сравнений становится выбор критерия.

Многофакторный д.а.

Данный дисперсионный анализ предназначен для изучения влияния нескольких независимых факторов (переменных) на зависимую переменную. Отличительной особенностью многофакторного д.а. от однофакторного является возможность оценить не только влияние каждой независимой переменной в отдельности, но и взаимодействие факторов – зависимость влияния одних факторов от уровней других факторов.

Таким образом, в результате мы получаем влияние 1-ой независимой переменной, влияние 2-ой независимой переменной, …., взаимовлияние независимых переменных.

При использовании многофакторного анализа порой получаются достаточно интересные результаты, которые невозможно было бы получить с помощью предыдущего дисперсионного анализа.

Ограничениями метода выступают однородность дисперсий и выборки не должны заметно различаться по численности.

Д.А. с повторными измерениями

Данный вид дисперсионного анализа используется, когда разным градациям фактора соответствует одна и та же выборка (зависимые выборки). С другой стороны, эти выборки можно рассматривать как независимые и применить обычный вариант ANOVA, но д.а с повторными измерениями имеет преимущество – он позволяет исключить из общей дисперсии данных ту ее часть, которая обусловлена индивидуальными различиями в уровне зависимой переменной, т.е. из остаточной внутригрупповой изменчивости вычитается компонент, обусловленный индивидуальными различиями. Это позволяет данному варианту дисперсионного анализа быть более чувствительным к влиянию изучаемых факторов, за счет уменьшения дисперсии ошибки факторной модели.

Существует два типа моделей д.а. с повторными измерениями:

1) Одномерная модель основана на предположении, что каждому уровню внутригруппового фактора соответствует повторное измерение одной и той же зависимой переменной (следовательно, эти изменения положительно коррелируют). Данный одномерный подход основан на применении F-отношений, но имеет ограничения по допущению о сферичности ковариационно-дисперсионной матрицы, т.е. дисперсии зависимой переменной для разных уровней внутригруппового фактора не различаются и корреляции между повторными измерениями есть и они положительны. Данное предположение проверяется с помощью теста сферичности ковариационно-дисперсионной матрицы Моучли. В программе Statistica если Вы не выберете зависимые переменные для проверки внутригрупповых эффектов, то Вам будет недоступна проверка на сферичность с помощью теста Моучли.

2) Многомерная модель свободна от допущения о коррелированности измерений зависимой переменной (т.е. о сферичности). В этом случае применяется не F-критерий, а многомерные тесты, такие как «След Пиллая» (Pillai's Trace) и «-Вилкса» (Wilks' Lambda). При использовании межгрупповых факторов дополнительно проверяется допущение об идентичности ковариационно-дисперсионных матриц, соответствующих разным уровням межгрупповых факторов. Для проверки идентичности используется в данном виде д.а.используют М-тест Бокса (Box's M-test).

Многомерный д.а.

Применяется для изучения эффектов влияния факторов не на одну, а на несколько переменных (многомерную зависимую переменную). Таким образом, для каждого объекта имеются несколько зависимых переменных, которые подвергаются дисперсионному анализу.

Итак, м.д.а. позволяет проверить не только гипотезы о влиянии факторов на каждуюзависимую переменную в отдельности, но и гипотезу о влиянии факторов на всю совокупность зависимых переменных, как на одну многомерную переменную, или как я ее называю модель.

М.д.а. может применяться как альтернатива о.д.а с повторными измерениями в случае, если не выполняется ее основное допущение о сферичности ковариационно-дисперсионной матрицы. Однако следует учитывать, что MANOVA является менее мощной, но более сложной процедурой, особенно для выборок небольшой численности.