Экстраполяция: регрессия и авторегрессия
Регрессионные однофакторные и многофакторные модели широко применяются при прогнозировании тренда. При этом для проведения прогноза фактор времени в правой части уравнения берется на уровне (t + T), где Т – глубина прогноза, прогнозируемый период. Например, для линейной модели прогноз имеет вид
Наиболее распространенными являются следующие модели[1]: линейная, полиномиальная и чаще всего квадратичная, степенная , логарифмическая , гиперболическая , экспоненциальная , модифицированная показательная кривая , которая при а < 0 и b < 1 имеет насыщение на уровне k.
Для моделирования процессов, которые сначала растут медленно, затем ускоряются, а далее замедляются, стремясь к некоторому пределу, используют так называемые S-образные кривые роста – кривую Гомперца в виде "многоэтажного" выражения и логистическую кривую (см. подразд. 19.3).
Не надо забывать, что для оценки точности прогноза па основе линейной и линеаризуемой регрессионных моделей следует проводить интервальную оценку прогноза, метод проведения которой является неотъемлемой частью регрессионного анализа и изложен в литературе по математической статистике. На практике часто дается только точечное прогнозирование, что не позволяет называть такие результаты достаточно достоверными.
Регрессионный анализ в Excel
Надо отметить, что прогнозирование на основе экстраполяции по регрессионной модели может быть легко осуществлено средствами мастера диаграмм в Excel, о чем не все начинающие исследователи догадываются. Рассматривается пять моделей: линейная, логарифмическая, полиномиальная (до шестой степени), степенная, экспоненциальная. Вычисляется коэффициент множественной корреляции "R-квадрат". Прогноз может быть сделан на любое число периодов, правда доверительный интервал для прогноза отсутствует, что не позволяет судить о точности прогноза, но это может быть сделано другими средствами, например с помощью пакета Statistica.
Сначала в электронную таблицу вносятся данные. Последовательность работы такая: мастер диаграмм – график (рис. 21.2, а). Когда график построен, щелчком правой клавиши мыши на линии графика открывается меню "добавить линию тренда..." (рис. 21.2, б).
Выбрав линию (закладка "Тип"), рекомендуется перейти на закладку "Параметры", где можно выбрать период
Рис. 21.2. Экстраполяция средствами Excel
прогноза, а также поместить на график уравнение и значение статистики "R-квадрат".
Авторегрессия
Часто зависимость Y(t), полученная на основе регрессионного анализа, не проходит требуемые статистические проверки, в частности остатки содержат оставшуюся неслучайную составляющую, что означает несовершенство модели и ограничивает ее практическую ценность. В такой ситуации целесообразно попробовать использование так называемой авторегрессионной модели, когда прогноз выражается в виде линейной комбинации показателей прошлых периодов. В зависимости от числа переменных модель может иметь порядок от 1 до п (см. первые две строки в табл. 21.5).
Для оценки параметров применяется аппарат линейного регрессионного анализа[2].
Таблица 21.5
Модель авторегрессии и прогноз по ней
Модель |
Аналитическая зависимость |
1. Первого порядка |
|
2. Порядка п |
|
3. Прогноз на два шага в модели порядка п |
|
Обозначения: – фактическое и расчетное (прогноз) значение соответственно; – оцениваемые параметры; t – текущий момент времени; п – порядок модели. |
Матрица исходных данных для расчета авторегрессии первого порядка получается из исходного динамического ряда следующим образом. Данными для переменной являются п – 1 членов временного ряда с номерами от 2 до t, а данными для переменной – члены ряда с первого до t – 1. В модели n-го порядка данными для переменной являются t – п членов временного ряда с номерами от п + 1 до t, для – от и до t – 1 и т.д. каждый раз со сдвигом к началу временного ряда на один член этого ряда.
Расчет параметров модели с необходимыми статистическими проверками может быть выполнен средствами Excel, как при проведении регрессионного анализа. Авторегрессия реализована в пакетах статистического анализа и прогнозирования Statistica и SPSS.
Авторегрессия позволяет дать прогноз более чем на один шаг. Прогноз на один шаг (период) вперед может быть получен исключительно по значениям исходного временного ряда. При получении прогноза на два шага исходный ряд дополняется прогнозом на один шаг. Для прогноза на три шага требуется прогноз на предыдущие два шага и т.д. Другими словами, прогноз по авторегрессионной модели порядка п на момент t + 1 рассчитывается через члены временного ряда с номерами от t – п + 1 до t, а прогноз на момент t + 2 – через и через члены временного ряда с номерами от t – п + 2 до t (см. третью строку в табл. 21.5). Важно обратить внимание, что форма графика прогноза имеет общий вид. Это означает, что прогноз не ограничен какой-либо простой зависимостью, как это имело место в ранее рассмотренных методах экстраполяции.