ИНТЕРВАЛЫ ПРОГНОЗА ПО ЛИНЕЙНОМУ УРАВНЕНИЮ РЕГРЕССИИ

В прогнозных расчетах по уравнению регрессии определяется предсказываемое значение как точечный прогноз при , т. е. путем подстановки в уравнение регрессии соответствующего значения х. Однако точечный прогноз явно не реален. Поэтому он дополняется расчетом стандартной ошибки , т. е. , и соответственно интервальной оценкой прогнозного значения .

Чтобы понять, как строится формула для определения величин стандартной ошибки ,обратимся к уравнению линейной регрессии: . Подставим в это уравнение выражение параметра :

,

тогда уравнение регрессии примет вид:

.

Отсюда вытекает, что стандартная ошибка зависит от ошибки и ошибки коэффициента регрессии , т.е.

Из теории выборки известно, что . Используя в качестве оценки остаточную дисперсию на одну степень свободы ,получим формулу расчета ошибки среднего значения переменной :

 

= 3,34.

Ошибка коэффициента регрессии, как уже было показано, определяется формулой

.

Считая, что прогнозное значение фактора ,получим следующую формулу расчета стандартной ошибки предсказываемого по линии регрессии значения, т. е. :

Соответственно имеет выражение

Рассмотренная формула стандартной ошибки предсказываемого среднего значения при заданном значении характеризует ошибку положения линии регрессии. Величина стандартной ошибки , как видно из формулы, достигает минимума при и возрастает по мере того, как «удаляется» от в любом направлении. Иными словами, чем больше разность между и , тем больше ошибка , с которой предсказывается среднее значение для заданного значения . Можно ожидать наилучшие результаты прогноза, если признак-фактор находится в центре области наблюдений ,и нельзя ожидать хороших результатов прогноза при удалении от . Если же значение оказывается за пределами наблюдаемых значений , используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько отклоняется от области наблюдаемых значений фактора .

На графике доверительные границы для представляют собой гиперболы, расположенные по обе стороны от линии регрессии.

Однако ошибка предсказываемого индивидуального значения у должна включать не только стандартную ошибку , но и случайную ошибку S.

Средняя ошибка прогнозируемого индивидуального значения составит:

При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной ошибки индивидуального значения у, но и от точности прогноза значения фактора . Его величина может задаваться на основе анализа других моделей исходя из конкретной ситуации, а также из анализа динамики данного фактора.

Рассмотренная формула средней ошибки индивидуального значения признака может быть использована также для оценки существенности различия предсказываемого значения исходя из регрессионной модели и выдвинутой гипотезы развития событий.