Краткие теоретические сведения

При дисперсионном анализе одновременно обрабатывают данные нескольких выборок (вариантов), составляющих единый статистический комплекс, оформленный в виде специальной рабочей таблицы. Структура статистического комплекса и его последующий анализ определяются схемой и методикой эксперимента.

Сущностью дисперсионного анализа является расчленение общей суммы квадратов отклонений и общего числа степеней свободы
на части – компоненты, соответствующие структуре эксперимента, и оценка значимости действия и взаимодействия изучаемых факторов по F–критерию.

Если обрабатывают однофакторные статистические комплексы, состоящие из нескольких независимых выборок, например
l – вариантов в вегетационном опыте, то общая изменчивость результативного признака, измеряемая общей суммой квадратов СY, расчленяется на два компонента: варьирование между выборками (вариантами) СV и внутри выборок Cz. Следовательно, в общей форме изменчивость признака может быть представлена выражением:

.

Здесь вариация между выборками (вариантами) представляет ту часть общей дисперсии, которая обусловлена действием изучаемых факторов, а дисперсия внутри выборок характеризует случайное варьирование изучаемого признака, т. е. ошибку эксперимента.

Общее число степеней свободы (N – l) также расчленяется на две части – степени свободы для вариантов (l – 1) и для случайного варьирования (N – l).

Суммы квадратов отклонений по данным эксперимента – статистического комплекса с l-вариантами – обычно находят в такой последовательности. При общем числе наблюдений N определяются суммы по вариантам V и общая сумма всех наблюдений Х. Затем вычисляются:

- корректирующий фактор (поправка) ;

- общая сумма квадратов ;

- сумма квадратов для вариантов ;

- сумма квадратов для ошибки (остаток) .

Две последние суммы квадратов СY и CZ делятся на соответствующие им степени свободы, т. е. приводятся к сравниваемому виду – одной степени свободы вариации. В результате получают два средних
квадрата:

- вариантов ;

- ошибки .

Эти средние квадраты и используют в дисперсионном анализе для оценки значимости действия изучаемых факторов. Оценка проводится путем сравнения дисперсии вариантов с дисперсией ошибки по критерию Фишера:

.

Таким образом, за базу – единицу сравнения принимают средний квадрат случайной дисперсии, которая определяет случайную ошибку эксперимента. При этом проверяемой нулевой гипотезой служит предположение: все выборочные средние являются оценками одной генеральной средней и, следовательно, различия между ними несущественны. Если Fфакт < Fтеop, то нулевая гипотеза Но: d = 0 не отвергается; между всеми выборочными средними нет существенных различий и на этом проверка заканчивается. Нулевая гипотеза отвергается, когда Fфакт Fтеop.

В этом случае дополнительно проводят оценку, между какими средними имеются значимые различия.

Проведение анализа

При испытании снотворного средства изучалось его действие для двух факторов: однократная доза (группа а) и двойная доза (группа b).
В каждой группе находилось по 10 подопытных объектов. Результативным признаком является продолжительность сна
(в часах).

Исходные данные для выполнения однофакторного дисперсионного анализа представлены в таблице 11.1.

Таблица 11.1 – Исходные данные

a b

 

Шаг 1. Откройте модуль Анализ данныхивыберитеопцию Однофакторный дисперсионный анализ, после чего щелкните мышкой OK.

Шаг 2. В появившемся окне выполнить операции и установки, как показано на рисунке 11.1.

 

Рисунок 11.1 – Стартовая панель

Шаг 3. Щелкните мышкой OK. Результат обработки появится в указанном поле (выходной интервал $D$1, таблицы 11.2, 11.3).

Таблица 11.2 – Статистические параметры

Группы Счет Сумма Среднее Дисперсия
a 3,7 2,68
b 6,3 3,12

Таблица 11.3 – Результаты дисперсионного анализа

Источник вариации SS df MS F P-значение F критическое Сила влияния, %
Между группами 33,8 33,8 11,7 0,003 4,4 39,3
Внутри групп 52,2 2,9       60,7
Итого        

 

В рассмотренном примере эмпирический F-критерий (критерий Фишера) показывает, что различие между средними статистически значимо (значимо на уровне p=0,003, то есть меньше, чем критическое значение 0,05). Поскольку различие между средними значениями значимо, нулевая гипотеза о равенстве средних отвергается и принимается альтернативная гипотеза о существовании различия между средними.

Таким образом, действие снотворного в однократной и двойной дозах статистически достоверно отличаются.

Задания для выполнения

1 Введите в таблицу MS Excel исходные данные из Приложения Д (таблица Д1).

2 Выполните расчетные процедуры в соответствии с порядком операций, выполненных в настоящем разделе.

Получите результат и сделайте заключение.

 

Лабораторная работа 12
Однофакторный дисперсионный анализ
(однофакторный комплекс в Statistica 6)

Цель работы: научиться выполнять однофакторный дисперсионный анализ в программном продукте Statistica 6.