Оценка точности выравнивания

 

Убедившись в том, что полученные регрессионные уравнения вычислены правильно, можно приступить к оценке точности их «работы», которая может быть выполнена с учетом величины меры выравнивая (гi).

Показатель меры выравнивания (гi) по М.Л. Дворецкому вычисляется по формуле

Из анализа формулы видно, что чем выше абсолютное значение г, тем точнее «работает» конкретное уравнение регрессии. Если гi > 0,95, можно считать, что уравнение аппроксимирует опытные данные достаточно точно (надежно).

Для вычисления гi, необходимо, прежде всего, получить, среднеарифметическое (Мy) из имеющихся опытных значений Y, используя нижеприведенную формулу:

 

где N-число наблюдений; Y-опытные данные отдельных наблюдений, Мy - среднеарифметическое значение из всех опытных данных.

Затем следует вычислить отклонение ( ) опытных данных от их среднеарифметического:

где Мy - среднеарифметическое значение из всех опытных данных; Y - опытные данные.

Таблица 4.4

Вспомогательные расчеты для получения меры выравнивания (ri) опытных данных по уравнению прямой линии

Высоты, м Отклонения, м
Y (опытные) yв (теорети- ческие) (Y- My) a Y – yв a2
УРАВНЕНИЕ 1
16,00 16,00 -6,34 40,20 -0,60 0,36
18,00 18,00 -4,34 18,84 0,00 0,00
20,15 19,40 -2,19 4,80 +0,75 0,56
22,14 20,80 -0,20 0,40 +1,34 1,80
23,48 22,20 1,14 1,30 +1,28 1,64
23,65 23,60 1,31 1,72 +0,05 0,00
24,62 25,00 2,28 5,20 -0,38 0,14
26,00 26,40 3,66 13,40 -0,40 0,16
27,00 27,80 4,66 21,72 -0,80 0,64
201,04     107,22   5,30
My = 201,4/9=22,34 >0,95 Вывод: уравнение аппроксимирует опытные данные достаточно точно
УРАВНЕНИЕ II
16,00 17,06 -6,34 40,20 -1,06 1,12
18,00 18,38 -4,34 18,84 -0,38 0,14
20,15 19,70 -2,19 4,80 +0,45 0,20
22,14 21,02 -0,20 0,40 +1,12 1,26
23,48 22,34 1,14 1,30 +1,14 1,30
23,65 23,66 1,31 1,72 -1,01 0,00
24,62 24,98 2,28 5,20 -0,36 0,13
26,00 26,40 3,66 13,40 -0,40 0,16
27,00 27,62 4,66 21,72 -0,62 0,39
201,04     107,22   4,70
My = 201,4/9=22,34 >0,95 Вывод: уравнение аппроксимирует опытные данные достаточно точно
                 

После этого необходимо определить величину попарных отклонений (а) опытных и теоретических значений по формуле

a = Y – yв

где yв - теоретические данные по уравнению регрессии.

Результаты расчетов отклонений показаны в табл. 4.4 для уравнения прямой линии.

Так как во всех случаях r>0.95, то все четыре анализируемых функции аппроксимируют исследуемую взаимосвязь Д/Н достаточно надежно.

Как и следовало ожидать, более трудоемкий и точный и способ наименьших квадратов, показал более высокую точность выравнивания.

 

ДИСПЕРСИОННЫЙ АНАЛИЗ

 

В силу длительности периода выращивания леса наблюдение долгое время оставалось практически единственным способом познания у лесоводов. Однако решение проблемы повышения продуктивности лесов и улучшения их качественного состава потребовало более активного вмешательства в жизнь леса. Сейчас в лесном деле широко применяются селекция и генетика, внесение удобрении, химические и биологические методы защиты леса от вредителей и болезней.

Для внедрения в лесохозяйственное производство новых видов или сортов требуется экспериментально доказать их преимущества в продуктивности, морозоустойчивости или фитоустойчивости.

Таким образом, в современном лесоводстве наряду с наблюдением используется более совершенный метод, характеризующий более высокую ступень познания - эксперимент или опыт. Дисперсионный анализ и представляет собой наиболее совершенный метод статистической обработки опытного материала.

 

Условия метода

 

Опыт в лесу не может повторяться много раз, так как на это уйдет слишком много времени; в то же время размеры опытных участков невелики по сравнению с площадями, на которых результаты опыта могут быть распространены. Результаты опыта представляют, как правило, несколькими (более двух) малыми выборками с числом наблюдений до двух-трех десятков. Специфика малых выборок и их особое сочетание в опыте потребовало создание новых методов обработки экспериментального материала.

Методика обработки малой выборки впервые была применена в агробиологических исследованиях (Д. Снедекор, Р. Фишер, Б. Доспехов) и оттуда заимствована лесоводами.

Проведение опыта требует тщательного планирования исследования, методической разработки отдельных этапов и изучения окружающих условий. Планирование эксперимента включает выбор темы, определение задачи и объекта исследования, изучение и анализ состояния вопроса, создание рабочей гипотезы, составление программы и методики.

При постановке эксперимента наряду с многочисленными причинами, определяющими варьирование (разнообразие) результатов опыта, действует такой фактор, изучение которого является основной задачей исследователя. Анализируя это, Р. Фишер пришел к идее выделить варьирование, создаваемое изучаемым фактором, и оценить результаты не по средним значениям, а путем более глубокого анализа показателей варьирования (разнообразия). Для этого пользуются или суммой квадратов отклонений или средним квадратом отклонений, названным Р. Фишером дисперсией.

Дисперсией называется сумма квадратов отклонений (или средний квадрат отклонений) отдельных вариант (v) от средней арифметической величины (Мср). Дисперсия латин. (dispersus- рассеяние), как и основное отклонение, характеризует степень разнообразия (варьирования) отдельных вариантов ряда вокруг среднего значения. Основное отклонение (σ) определяется по формуле

 

где ,

n- частота соответствующего класса.

N - объем всего ряда. Если ряд не объединен в классы, то ,

где v - значения отдельных вариант и

- есть сумма квадратов отклонений, называемая дисперсией (Д)

 

или

Для малой выборки отсюда , значит ,

a , называют вариансой.

Таким образом, дисперсия, варианса и основное отклонение являются показателями изменчивости признака и находятся в тесной взаимосвязи друг с другом.

Признаки, изменяющиеся под действием тех или иных причин, называются результативными. Действующие на результативный признак причины называют факторами. Результативные признаки: высота и диаметр стволов, прирост, вес семян, объем и т.д. Действующие факторы: температура воздуха, влажность и богатство почвы, различная интенсивность изреживания древостоя, удобрения и т.д.

При планировании эксперимента - факторы делят на контролируемые (организованные) и неконтролируемые (не организованные) исследователем. Регулируемый фактор (один или несколько) представлен в опыте различными степенями воздействия, называемыми градациями или вариантами опыта.

Например: I) выясняется влияние предпосевного намачивания желудей на их всхожесть в течение: 0 час (контроль), 2 часа, 12 часов, 24 часа, 72 часа.

0, 2, 12, 24, 72 часа - градация фактора или варианты опыта.

2) в лаборатории изучают действие t° на сроки окукливания дубовой листовертки:

16°, 18°, 20°, 22°, 24° - есть градация действующего фактора (варианты опыта).

3) Исследуется влияние условий местопроизрастания на прирост и высоту 2-летних сеянцев сосны. Градациями фактора будут:

А1 А2 В2 С2

сухой бор св.бор св.суборь св.сложн.суборъ

В процессе обработки данных обязательно следует учитывать градации фактора. Под действием фактора различной силы в эксперименте организуются отдельные группы исследования (варианты опыта). Последние своим действием образуют градации результативного признака. Кроме того, при постоянной степени воздействия регулируемого фактора, возможно наличие повторностей результативного признака в опыте. Например, при одной и той же дозе удобрения спелых сосновых лесов - 200 кг/га, прирост на I га составил в одном случае -6,8 м3/га, в другом - 6,1 м3/га, в третьем - 7,4 м3/га.

В результате осуществления эксперимента и наблюдения за ним для обработки результатов строится дисперсионный комплекс, где учтены варианты и повторности.

Дисперсионный комплекс обычно представлен особой таблицей, где выборочная совокупность сформирована для изучения эффективности действия организованных факторов на результативный признак по вариантам. При изучении действия одного фактора комплекс называется однофакторным; двух факторов - двухфакторным, а трех и более - многофакторным. Если во всех градациях подбирается одинаковое число вариант, дисперсионный комплекс называется равномерным, а при неодинаковом числе - неравномерным.

 

5.2. Сущность метода и его задачи

 

Результаты опыта, представленные в дисперсионном комплексе, характеризуются разнообразием (варьированием) под влиянием многих причин. Величина их общей вариации может быть измерена суммой квадратов отклонений отдельных вариант от средней арифметической величины, т.е. дисперсией. Общее варьирование можно разложить на две части. Одна часть отражает изменчивость, вызываемую действием учитываемого в опыте фактора, а другая является следствием совокупности случайных, не учитываемых причин. Эти две составляющие образуют общую меру изменчивости. Если варьирование характеризовать дисперсиями, то будем иметь:

 

До= Дф + Дс, где

До - общее варьирование или общая дисперсия; Дф - варьирование, вызываемое регулируемым в опыте фактором или факториальная дисперсия; Дс - случайное варьирование - следствие множества причин (не учитываемых) - случайная дисперсия.

Сущность дисперсионного анализа заключается в установлении статистического влияния регулируемых факторов на изучаемый признак путем разложения общей дисперсии (До) на составляющие части (Дф и Дс). Дисперсионный анализ позволяет определить силу влияния и достоверность действия изучаемого фактора в опыте.

 

5.3. Дисперсионный анализ однофакторного комплекса

 

Схему проведения дисперсионного анализа разберем на конкретном примере. В лабораторных условиях был заложен опыт по определению влияния снегования семян лиственницы европейской на появление всходов на 15 день после посева.

Действующий фактор: снегование различной продолжительности; результативный признак: % всходов лиственницы на 15 день после посева.

Число повторностей от 3 до 5 вегетационных сосудов по отдельным вариантам опыта. Во всех вариантах строго выравнены почвенные условия, происхождение и способ хранения семян, сроки посева и полива, продолжительность светового дня.

В итоге получены следующие результаты:

 

варианты опыта по градациям фактора всхожесть (%) по повторностям опыта
1 без снегования (контроль) 2 2 недели 2, 3, I 4, 3, 6, 3
3 4 недели 4 6 недель 5, 6, 4, 6, 9 9, 7, 6, 6
5 8 недель 3, 6, 5, 6

 

Задача исследования: выявить степень и достоверность влияния снегования на всхожесть семян лиственницы европейской на 15 день после посева.

С учетом градаций вариантов, прежде всего, строится таблица дисперсионного комплекса и проводятся необходимые расчеты (табл. 5.1). Подсчитаем число вариант по повторностям опыта (n), общее число вариант комплекса (N), сумму % всхожести по градациям ( ) и общую сумму всех вариант ( ). Общая средняя арифметическая комплекса (Мо) равна:

Средние по градациям (Мг - т.н. групповые средние) соответственно равны:

Теперь можно приступать к анализу различных типов варьирования в комплексе.

Таблица 5.I

Дисперсионный комплекс по изучению снегования лиственницы европейской на появление всходов на 15 день посева

Повторности опыта Всхожесть, % по градациям фактора (варианты)
1 контроль 2 3 4 5 Итого
-
- - - -
Число повторностей по отдельным градациям (n) N=20
Сумма % всхожести по градациям(ΣV) ΣΣV=100
Групповые средние (Mr) MО=5

 

Ниже излагается способ расчета дисперсий. Прежде всего, производятся вспомогательные расчеты.

1. Сумма всех вариант комплекса (ΣΣV) =100.

2. Число вариант в комплексе (N) =20.

3. Средний квадрат суммы всех вариант ряда (S) равен

4. Сумма средних квадратов сумм вариант по градациям комплекса равна:

и т. д. - средние квадраты суммы вариант комплекса по соответствующим градациям.

 

 

Отсюда: ∑S = 12+64+180+196+100=552

5. Сумма квадратов всех вариант по всему комплексу равна:

Σ(V2)= V12+V22+V32+….+Vn2

Σ(V2)=22+32+12+42+32+62+32+52+62+42+62+92+92+72+62+62+32+62+52+62=586

Расчет дисперсий и ее достоверность приводится ниже:

 

 

 

На основании произведенных расчетов можно сформулировать ряд следствий:

1) До - общая дисперсия равна разности между суммой квадратов вариант всего комплекса и средним квадратом их суммы.

2) Дф - факториалъная дисперсия равна разности между суммой средних квадратов вариант по градациям и средним квадратом суммы всех вариант комплекса.

3) Дс - случайная дисперсия равна разности между суммой квадратов всех вариант комплекса и суммой средних квадратов по градациям.

Эти следствия используются для облегчения счетных работ. Показатель степени (силы) влияния ( ).

Сила влияния регулируемого фактора определяется по формуле

- определяет долю общей дисперсии, которая приходится на факториальную дисперсию, т.е. долю влияния изучаемого фактора в общей сумме влияния всех факторов. Для рассматриваемого примера около 61% всех воздействий на появление всходов семян лиственницы составило снегование. Это свидетельствует о целесообразности осуществления подобной предпосевной подготовки семян.

Цель проведения эксперимента состоит в том, чтобы распространить результаты опыта на генеральную, совокупность. Это возможно, если показатель силы влияния является достоверным. В противном случае полученные результаты ( =0,61) справедливы лишь для тех семян, с которыми проведен эксперимент.

Расчет показателя достоверности начинают с вычисления факториальной (σф2)и случайной (σс2)варианс.

 

где

g– число градаций изучаемого фактора.

Достоверность силы влияния (F) равна:

 

где F - эмпирический критерий достоверности силы влияния, который должен сравниваться со стандартными значениями критерия Фишера (Fst) для различных порогов (уровней) вероятности (0,95; 0,99; 0,999).

Для оценки также необходимо знать число степеней свободы для отдельных варианс:

На основании таблиц стандартных значений Фишера (Приложение 2) по числу степеней свободы устанавливается Fst.

Для примера оно равно 3,1. Поскольку опытный критерий F = 5,7, превышает Fst.=3,1, для вероятности 0,95, т.е. (F >Fst), делается вывод, что влияние снегования, обнаруженное в выборочном комплексе, свойственно всем генеральным совокупностям. Следовательно, всем лесхозам, занимающимся выращиванием сеянцев лиственницы европейской, нужно рекомендовать перед, посевом производить снегование семян. Если F < Fst,то данная рекомендация справедлива лишь для обследованной партии семян.

В статистике всякий показатель определяется с ошибкой. Ошибка показателя силы влияния определяется по формуле

Зная ошибку показателя, можно установить доверительные границы показателя силы влияния для генеральной ( )совокупности

C вероятностью 0,95 доверительные границы генерального параметра равны:

Следовательно, для всех случаев снегования семян лиственницы влияние его может составлять не менее 28%от общей суммы факторов.

 

5.4 Расчет оптимальной величины действующего фактора путем сравнения групповых средних (Мr)

 

Сформулированные выше выводы охватывают весь дисперсионный комплекс. По ним не представляется возможным оценить какая степень воздействия фактора из исследованных в наибольшей степени эффективна. Последнее может быть установлено через существенность различий между средними арифметическими величинами по градациям действующего фактора в дисперсионном комплексе.

Для этих целей в эксперименте обычно предусматривают контрольные варианты, на которых действие изучаемого фактора не распространяется. Оценка существенности различий между результатами на контроле и результатами, полученными при различной дозе фактора, позволяют установить наиболее эффективную градацию изучаемого фактора.

На рис. 5.1 отображена всхожесть семян (%) в зависимости от продолжительности их снегования. При этом увеличение всхожести с возрастанием продолжительности снегования четко не просматривается. Более определенно направление изменения всхожести отражают групповые средние (Мr), через которые проведена линия на графике: сначала заметно увеличение всхожести семян, а затем – снижение.

Рис. 5.1 Зависимость всхожести семян лиственницы от продолжительности снегования

 

Это обстоятельство свидетельствует о наличии оптимума в изучаемом явлении. Дисперсионный анализ позволяет довольно точно установить этот оптимум путем оценки разности между групповыми средними (табл. 5.2).

 

Таблица 5.2

Разности групповых средних.

Градации фактора
Число повторностей (n)
Групповые средние (Mr)
Разность между средней по контролю и групповыми средними (d) (2-2) (4-2) (6-2) (7-2) (5-2)

Оценку разности между средними произведем c помощью критерия достоверности (t):

 

где d – разность между средними;

md – ошибка разности средних

где σс2 – случайная варианса, n1 и n2- количество вариант в сравниваемых группах.

Сначала вычислим ошибку разности средних контроля и двухнедельного снегования семян, а затем показатель достоверности этой разности:

Сопоставим фактическое значение показателя достоверности со стандартным значением критерия Стъюдента (Приложение 1). Число степеней свободы случайной вариансы нам известно:

Отсюда: стандартное значение критерия Стьюдента при вероятности 0,95 равно:

т. е. <

Следовательно, различие между сравниваемыми средними не существенно, и исследуемый фактор не оказывает влияния на результативный признак .

Теперь сопоставим среднюю всхожесть семян контроля и семян четырехнедельного снегования.

> различие между средними существенно, но лишь с вероятностью 0,95.

Таким же образом необходимо установить достоверность различий групповых средних при шести- и восьминедельном снеговании.

– различие существенно

– различие существенно

Делая вывод, можно сказать, что максимальный эффект наблюдается при продолжительности снегования в 6 недель. При снеговании 4 и 8 недель снегование влияет на всхожесть, но в меньшей степени. А при двухнедельном снеговании влияние вообще отсутствует.

Итоговая запись окончательных результатов дисперсионного анализа проводится по нижеследующей форме (табл. 5.3)

Таблица 5.3