Кроме этого, определить степень тесноты зависимости между

Интенсивностью полива и уровнем урожайности. Для уста-

новления наличия связи между признакам x и y использует-

ся критерий χ2. Для этого сначала по формуле (10.52) найдем

теоретические клеточные частоты и поместим их в табл. 10.11,

например:

Затем по формуле (10.51) определим расчетное значение

критерия χ2:

Таблица 10.11

Полив (x)

Урожайность (y)

Высокая средняя низкая сумма

Обильный μ11 = 80

= 59,45

μ12 = 25

= 30,45

μ13 = 40

= 55,1

Средний μ21 = 85

= 71,75

μ22 = 30

= 36,75

μ23 = 60

= 66,5

Слабый μ31 = 40

= 73,8

μ32 = 50

= 37,8

μ33 = 90

= 68,4

Сумма 205 105 190 500

Число степеней свободы в нашем примере равно:

v = (к1 − 1) ⋅ (к2 − 1) = (3 − 1) ⋅ (3 − 1) = 4, так как к1 = к2 = 3.

Принимаем 5%-ный уровень значимости, т. е. α = 0,05.

Далее по таблице значений критерия χ2 (приложение 6) оп-

Ределяем .

Так как χ2 > (42,78 > 9,49), то делаем вывод о том, что

распределение, помещенное в табл. 10.11, неслучайно. Поэтому

можно говорить о наличии связи между признаками x и y.

Для определения тесноты связи определим коэффициен-

Ты взаимной сопряженности Пирсона и Чупрова. Сначала по

Формуле (10.53) находим коэффициент взаимной сопряжен-

ности Пирсона:

.

Затем по формуле (10.54) определяем коэффициенты вза-

имной сопряженности Чупрова:

.

Полученные значения коэффициентов КПвз и КЧвз говорят

О том, что зависимость уровня урожайности от степени поли-

Ва ниже средней. Заметим, что исходные данные примера 10.11

Условные.

Многофакторный линейный корреляционный

И регрессионный анализ

В подразд. 10.2 была рассмотрена однофакторная линей-

Ная модель. Но чаще всего изучаемые нами природные и об-

Щественные явления зависят не от одного, а от целого ряда

Факторов. Корреляционная зависимость результативного

Признака от нескольких факторных признаков называется

Уравнением множественной регрессии. Рассмотрим линейную

Многофакторную модель, к ней часто можно свести криволи-

Нейные модели.

Главные задачи, которые стоят при построении уравнения

множественной регрессии таковы:

Надо отобрать те факторные признаки, которые оказы-

Вают наибольшее влияние на признак следствия;

Правильно выбрать регрессионную модель.

Если данные пункты выполнены правильно, то все осталь-

Ное дело техники. Мы рассматриваем пока линейную много-

Факторную регрессию, поэтому задача выбора модели перед

Нами не стоит, нужно только определиться с количеством фак-

Торных признаков, влияющих на признак следствие. Решение

Первой задачи основано на рассмотрении матрицы парных ко-

Эффициентов корреляции (о ней будет сказано ниже). Прини-

Маются во внимание и частные коэффициенты детерминации

Для каждого факторного признака. Их значения говорят об

Объясняющей способности каждого из факторных признаков.

Заметим, что уравнение многофакторной регрессии должно

Быть как можно проще. Чем проще тип уравнения, тем оче-

Виднее интерпретация параметров, входящих в него, и лучше

Его использование с целью анализа и прогноза. Поэтому чаще

Всего используют линейное уравнение множественной рег-

Рессии, которое имеет вид

. (10.55)

Параметры a1, a2, …, am, b уравнения множественной

Регрессии (10.55) можно находить по МНК. Затем с помощью

Корреляционного анализа делают проверку адекватности по-

Лученной модели и, если модель адекватна, делают ее интер-

Претацию. Так поступают в том случае, если заранее извест-

Но, например на основании предшествующих исследований,

Что все основные признаки-факторы, оказывающие влияние

На результативный признак, учтены (мы не говорим о выборе

Типа модели, так как пока рассматриваем только линейную

Модель).

Если мы не уверены в том, что учтены все факторные при-

Знаки, или, наоборот, учтены лишние, сначала проводим корре-

Ляционный анализ (находим парные коэффициенты корреляции,

Частные коэффициенты корреляции, совокупный коэффициент

Множественной корреляции), а потом, уточнив модель, строим

Уравнение множественной линейной регрессии по МНК.

Покажем, как находятся параметры a1, a2, …, am, b урав-

Нения регрессии (10.55) по МНК. Условие МНК в этом случае

Имеет вид

. (10.56)