Проверка значимости уравнения линейной множественной регрессии с помощью критериев Фишера и Стьюдента

Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью -критерия Фишера:

(4.30)

где – факторная сумма квадратов на одну степень свободы; – остаточная сумма квадратов на одну степень свободы; – коэффициент (индекс) множественной детерминации; m – число оцениваемых параметров уравнения регрессии; n – число наблюдений.

Оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный -критерий, т.е. .

Частный -критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом. В общем виде для фактора частный -критерий определится как

(4.31)

где – коэффициент множественной детерминации для модели с полным набором факторов, – тот же показатель, но без включения в модель фактора , n – число наблюдений, m – число параметров в модели.

Фактическое значение частного -критерия сравнивается с табличным при уровне значимости α и числе степеней свободы: 1 и . Если фактическое значение превышает , то дополнительное включение фактора в модель статистически оправданно и коэффициент чистой регрессии при факторе статистически значим. Если же фактическое значение меньше табличного, то дополнительное включение в модель фактора не увеличивает существенно долю объясненной вариации признака , следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.

Для двухфакторного уравнения частные -критерии имеют вид:

(4.32)

С помощью частного -критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор вводился в уравнение множественной регрессии последним.

Частный -критерий оценивает значимость коэффициентов чистой регрессии. Зная величину , можно определить и -критерий для коэффициента регрессии при -м факторе, , а именно:

. (4.33)

Оценка значимости коэффициентов чистой регрессии по -критерию Стьюдента может быть проведена и без расчета частных -критериев. В этом случае, как и в парной регрессии, для каждого фактора используется формула:

, (4.34)

где – коэффициент чистой регрессии при факторе , – среднее квадратическое (стандартное) отклонение коэффициента регрессии .

Для уравнения множественной регрессии среднее квадратическое отклонение коэффициента регрессии может быть определено по следующей формуле:

, (4.35)

где – среднее квадратическое отклонение для признака , – среднее квадратическое отклонение для признака , – коэффициент детерминации для уравнения множественной регрессии, – коэффициент детерминации для зависимости фактора со всеми другими факторами уравнения множественной регрессии; – число степеней свободы для остаточной суммы квадратов отклонений.

Как видим, чтобы воспользоваться данной формулой, необходимы матрица межфакторной корреляции и расчет по ней соответствующих коэффициентов детерминации . Так, для уравнения оценка значимости коэффициентов регрессии , , предполагает расчет трех межфакторных коэффициентов детерминации: , , .

Взаимосвязь показателей частного коэффициента корреляции, частного -критерия и -критерия Стьюдента для коэффициентов чистой регрессии может использоваться в процедуре отбора факторов.