Простейшие методы

Чтобы дать интервальный прогноз исследуемого показателя, используя среднюю величину, достаточно рассчитать его дисперсию:

(9.3)

где для получения несмещенной оценки дисперсия Y рассчитывается путем деления не па количество наблюдений, а на число степеней свободы (которое в случае с простой средней арифметической равно T – 1) по формуле (3.21).

При выполнении базовых условий мы можем предполагать, что дисперсия уt на несколько шагов вперед не будет зависеть от значений на предыдущих шагах. При этом на первом шаге для интервального прогноза мы можем использовать просто дисперсию D(уt), а для того, чтобы оценить значение дисперсии на втором шаге, нам нужно учесть, что на первом шаге уже была получена случайная величина с той же дисперсией D(уt):

Продолжая рассуждения таким же образом для h шагов, можем в общем случае записать:

(9.4)

Теперь, подставляя значение (9.4) в формулу (9.2), получим следующий интервальный прогноз для средней величины:

(9.5)

Как видим, в формуле (9.5) под корнем стоят не только дисперсия yt и число наблюдений, но и номер шага, на который делается прогноз. В результате интервальный прогноз будет иметь колоколообразную форму.

Для условного примера, который мы рассматривали в параграфе 5.2, получим интервальный прогноз, изображенный на рис. 9.2.

В данном случае мы строили 95%-ный интервал, в расчете средней использовалось пять наблюдений (T = 5). В связи с тем что в модели рассчитывается фактически лишь один коэффициент (само среднее значение), число степеней свободы составило df = 5 – 1=4. Из-за малого числа степеней свободы прогнозный интервал оказался достаточно широким.

Рис. 9.2. Условный ряд данных (сплошная линия с точками), точечный (сплошная линия с крестиками) и интервальный (пунктирные линии) прогнозы по нему методом средней величины

В связи с тем что мы применили метод расчета средней величины для явно нестационарного процесса, просто исключив из рассмотрения бо́льшую часть наблюдений, мы получили, возможно, не самую точную оценку. Однако в данном конкретном случае сложившаяся на последних наблюдениях тенденция продолжилась, в результате чего таким простым методом был получен не самый плохой по точности интервальный прогноз (рис. 9.3).

Рис. 9.3. Условный ряд данных (сплошная линия с точками), точечный (сплошная линия с крестиками) и интервальный (пунктирные линии) прогнозы по нему

Как видим по рис. 9.3, все пять фактических значений попали в построенный нами прогнозный интервал. В целом, это достаточно хороший результат, учитывая простоту использованного метода прогнозирования.

Рассмотрим теперь, как можно построить интервальный прогноз для методов Naive и сезонный Naive.

В данном случае нам уже нужно оценить, какой будет случайная величина на шаге Т + 1. Используя формулу (5.23), можно записать:

(9.6)

Используя ту же методику построения параметрических прогнозных интервалов, найдем дисперсию выражения (9.6). Однако стоит иметь в виду, что в данном случае мы уже имеем дано с отклонениями не от средней, а от расчетного значения по модели, т.е. не с безусловной, а с условной дисперсией:

(9.7)

так как в соответствии с базовыми условиями мы предполагаем, что yt не зависит от ошибки εt+1, то дисперсию суммы в (9.7) мы можем переписать в виде суммы дисперсий:

(9.8)

В связи с тем что прогноз на шаг Т+ 1 зависит от фактического значения на шаге Т, уT уже перестает носить случайный характер, а значит, и дисперсия его будет равна нулю. Кроме того, можно заметить, что в соответствии с теми же базовыми условиями мы предполагаем, что ошибки не коррелируют друг с другом, а значит, (9.8) в итоге может быть переписано в виде

(9.9)

Чтобы сделать прогноз на h шагов вперед, мы так же, как и в случае со средней, предполагаем независимость дисперсий, что из тех же рассуждений, что и в (9.4), приводит нас к

(9.10)

Дисперсию ошибки в (9.10) так же стоит рассчитать с учетом степеней свободы в модели. В связи с тем что фактически единственным параметром в модели Naive является коэффициент перед фактическим значением (который равен 1), df=T- 1:

Соединяя теперь (9.2) и (9.10), получим

(9.11)

Для нашего условного примера мы получим следующий прогнозный интервал (рис. 9.4).

Рис. 9.4. Условный ряд данных (сплошная линия с точками), точечный (сплошная линия с крестиками) и интервальный (пунктирные линии) прогнозы по нему методом Naive

Как видим, из-за высокой дисперсии ошибки мы получили очень широкий интервал, который помимо прочего еще и захватывает отрицательные значения (что, конечно же, обычно не имеет смысла). В случаях, когда нижняя граница оказывается отрицательной, но мы точно знаем, что исследуемый показатель (например, объем продаж) быть отрицательным не может, нижнюю границу имеет смысл заменить просто на нуль.

Логика построения интервальных прогнозов по сезонному Naive идентична описанной выше. Можно показать, что итоговый прогнозный интервал в этом случае будет аналогичен интервалу (9.11). Стоит, однако, отметить, что в нашем случае из-за появления лага сезонности прогноз на s шагов вперед будет базироваться на основе имеющихся фактических значений. Таким образом, интервал для s первых наблюдений не должен расширяться. В результате этого условная дисперсия на h шагов вперед может быть представлена в виде

(9.12)

где означает округление х в большую сторону.

Кроме того, в качестве задаваемых значений в модели используется s первых фактических наблюдений, что дает df =Т – s число степеней свободы.

Итоговая формула для расчета прогнозного интервала будет иметь вид

(9.13)

Покажем, как будет выглядеть интервальный прогноз по методу сезонного Naive на примере ряда № 1100 (рис. 9.5).

Рис. 95. Ряд данных № 1100 (сплошная линия с точками), точечный (сплошная линия с крестиками) и интервальный (пунктирные линии) прогнозы по нему методом сезонного Naive

Как видим, прогнозный интервал для ряда № 1100 по методу сезонный Naive все так же с каждым наблюдением становится все шире, повторяя при этом динамику точечного прогноза. В самом ряде № 1100 тренд и сезонность незначительно меняются во времени, поэтому и прогноз но модели оказался достаточно точным. В таком случае можно было бы построить и более узкий интервал.

Для построения прогнозных интервалов методами дрейфа и средних отрезков лучше воспользоваться непараметрическими методами. Вычисление дисперсии напрямую в них затруднено.