Сущность и метод дисперсионного анализа

Сущность дисперсионного анализа заключается в изучении статистического влияния одного или нескольких факторов на результативный признак.

Результативный признак

Результативный признак (Y) – это элементарное качество или свойство объектов, изучаемое как результат влияния факторов: организованных в исследовании (X) и всех остальных, неорганизованных в данном исследовании (Z).

Результативными признаками могут быть:

- точно измеряемые особенности объектов: длина, ширина, рост, обхват, сила, резвость, шерстность, обильномолочность, содержание гемоглобина в крови, артериальное давление и т. д.;

- неточно измеряемые признаки: густота спермы в баллах, конституциональная крепость, умственные способности и т. д.;

- комбинированные признаки: отношение размеров тела, индексы продуктивности, средние из нескольких данных для одного объекта (например, средний размер клеток у каждой изучаемой особи) и т. д.;

- качественные признаки: масть, цвет глаз, болезнь, выздоровление, смерть и т. д.

Фактор

Фактор – это любое влияние, воздействие или состояние, разнообразие которых может, так или иначе, отражаться в разнообразии результативного признака.

Факторами могут быть:

- физические влияния: температура, влажность, радиационное излучение;

- химические влияния: питание, стимуляторы, мутагены, алкоголь;

- биологические влияния: здоровье и болезни, биостимуляторы, наследственность, талантливость, идиотизм;

- возраст, пол, сорт, порода, национальность;

- ареал обитания, условия жизни;

- отдельные признаки, принимаемые за аргумент при изучении других признаков – функций. Например, длина ног рысака как один из факторов, определяющих его резвость.

Градации факторов

Градации факторов – это степень их действия (нулевое действие в контрольной группе), или состояние объектов изучения (пол, возраст, обученность и т. д.).

Градациями факторов могут быть:

- разная температура, влажность, разные дозы облучения, разная продолжительность физических, воздействий;

- разные питательность и состав корма, разные дозы стимуляторов и химических мутагенов, разные стадии опьянения;

- разные периоды болезни, степени таланта, разные отцы или классы отцов, разные матери или классы матерей;

- разные возраст, пол, сорт, порода;

- разные ареалы и условия жизни;

- разная величина признака, принятого за аргумент.

Градации комплекса

Градации комплекса – это опытные группы исследования. Каждая градация комплекса соответствует одной градации фактора и включает те объекты (с их данными), которые подвергались одной степени действия фактора или находились в одном из изучаемых состояний.

Организация градаций комплекса может осуществляться разными способами: подбор опытных и контрольных групп, привлечение материалов ранее проведенных наблюдений и опытов, систематизация записей производственной отчетности.

Подбор объектов в градации из ранее намеченных генеральных совокупностей (соответствующих каждой градации) производится рендомизированно, т. е. по принципу случайной выборки, без учета развития изучаемого признака (перед отбором).

Дисперсионный комплекс

Дисперсионный комплекс – это совокупность градаций с привлеченными для исследования данными и средними из данных по каждой градации (частные средние) и по всему комплексу (общая средняя).

Если изучается действие одного фактора, комплекс называется однофакторным, двух факторов – двухфакторным, трех и более факторов – многофакторным.

Если во все градации подбирается одинаковое число данных, комплекс называется равномерным, неодинаковое число данных – неравномерным. Если градации двух и многофакторных комплексов заполнены неодинаковым числом данных, но так, что данные по градациям одного фактора находятся в одинаковом отношении в градациях всех остальных факторов, такой комплекс называется пропорциональным.

Комплексы, составленные по принципу случайной выборки, называются рендомизированными.

При изучении количественных признаков в градации комплекса заносятся данные – числовые результаты измерения изучаемого признака у каждого отдельного объекта.

Статистические влияния

Статистическое влияние – это отражение в разнообразии результативного признака того разнообразия фактора (его градаций), которое организовано в исследовании.

Для оценки влияния фактора необходимо выявить разнообразие его действия, т. е. установить, насколько различно действуют его градации на результативный признак.

Например, для изучения влияния радиационного облучения на мутационный процесс требуется организовать минимум две градации фактора (облучения нет, облучение есть) и установить, велико ли различие в частоте мутаций при разных градациях облучения.

Если разнообразие результативного признака большое, т. е. если частота мутаций при облучении значительно отличается от частоты без облучения, значит влияние данного облучения велико; если такого различия нет или оно мало, значит, изучаемый фактор действует слабо, конечно, при данных дозах и условиях.

Оценка влияния фактора по разнообразию действия его градаций есть основной принцип дисперсионного анализа.

Если нет разнообразия результативного, признака по градациям фактора, нет и статистического влияния, хотя физиологическое влияние этого фактора может быть сильным.

Например, стимулятор мог сильно повышать плодовитость, но одинаково при всех дозах, организованных в данном исследовании (сильный эффект при любой не нулевой дозе). Тогда при сильном физиологическом влиянии этот стимулятор показал бы очень малое статистическое влияние, конечно, только при организации комплекса без нулевой градации.

При проведении дисперсионного анализа изучаются три основных вида статистических влияний: факториальное, случайное и общее.

Факториальное влияние

Факториальное влияние – это простое или комбинированное статистическое влияние изучаемых факторов.

В однофакторных комплексах изучается простое влияние одного фактора при определенных организованных в опыте градациях и при определенных общих условиях.

Этого не следует забывать при интерпретации результатов анализа. Например, если действие температуры оказалось сильным при градациях 10°–15°–20°, это не значит, что столь же сильное статистическое влияние проявится и при любых других градациях фактора, например при 20°–25°–30°. Точно так же, если влияние температуры изучалось при нормальной влажности и естественном освещении, нельзя ожидать такой же степени влияния температуры при повышенной (пониженной) влажности и при искусственном освещении.

При анализе двухфакторных дисперсионных комплексов изучаются четыре факториальных влияния.

- Влияние первого фактора при усредненном влиянии второго.

- Влияние второго фактора при усредненном влиянии первого.

- Влияние сочетания градаций обоих факторов.

- Суммарное действие обоих организованных факторов.

При анализе влияний первого и второго факторов действуют те же ограничения, какие необходимо иметь в виду при анализе однофакторных комплексов: выявляется степень влияния только при данных градациях каждого фактора и при данных условиях.

Кроме того, следует помнить, что действие каждого фактора в двухфакторном комплексе изучается при усредненном влиянии другого фактора и усредненном действии всех остальных, неорганизованных в данном комплексе факторов. Например, если изучается степень проявления в данных условиях влияния отцов (первый фактор) и матерей (второй фактор), то сила отцовского влияния (при данном составе матерей и при определенных условиях) изучается при усредненной реализации влияния матерей, а сила материнского влияния – при усредненном влиянии отцов, участвовавших в проведенных скрещиваниях.

Третье влияние, или влияние сочетания градаций обоих факторов, возникает вследствие того, что второй фактор часто действует различно при разных градациях первого. То же можно наблюдать и в отношении первого фактора: его действие часто проявляется неодинаково при различных градациях второго фактора. Например, если изучается действие стимулятора линьки (две градации второго фактора – контроль, опыт) на самцов и самок (две градации первого фактора), то может случиться так, что введение стимулятора даст большой эффект только для самок, а для самцов – незначительный.

Такое разнообразие действий одного фактора при разных градациях другого создает дополнительное статистическое влияние (сверх изолированных влияний каждого фактора), которое учитывается как особый вид факториальных влияний.

Суммарное действие факторов (четвертое влияние) включает в себя изолированные влияния каждого из факторов и влияние сочетаний их градаций. Это суммарный представитель всех факториальных влияний в двухфакторном дисперсионном комплексе.

Случайное влияние

Случайное влияние – это действие тех многих факторов, которые не организованы в изучаемом дисперсионном комплексе и составляют общий фон, на котором действуют организованные факторы. Так как неорганизованных факторов много и действуют они в разных направлениях, их влияние рассматривается как случайное, т. е. не вытекающее из закономерности действия организованных факторов.

Во всех дисперсионных комплексах случайные влияния выявляются и измеряются единообразно и для одной и той же очень важной цели: для определения той базы, с которой, как с эталоном, сравниваются факториальные влияния при определении их достоверности.

Чем больше факториальное влияние отличается от случайного, тем большая достоверность приписывается этому факториальному влиянию.

Это правило в дисперсионном анализе не имеет исключений. При определении достоверности факториальных влияний за базу сравнения можно принимать только случайные влияния.

Общее влияние

Общее влияние – это влияние всех организованных и неорганизованных факторов, определивших такое развитие признака, которое наблюдалось в дисперсионном комплексе. Общее влияние служит базой для определения доли влияний – факториальных и, случайных.