Сезонный Naive
В случае с сезонными рядами данных простейшим можно признать метод прогнозирования, аналогичный методу Naive. Если в простом Naive главным предположением выступало то, что лучшим прогнозом па ближайшую перспективу является последнее фактическое значение, то в сезонном Naive считается, что лучший прогноз на следующее наблюдение – фактическое значение, полученное сезон назад. Например, если перед аналитиком стоит задача дать прогноз по ежемесячным продажам горных лыж на год вперед, то он, очевидно, столкнется с сезонным рядом данных (зимой продажи лыж явно выше, чем летом, а каждый декабрь можно ожидать всплеск продаж) и лучшим прогнозом, например, на январь 2015 г., по методу сезонного Naive в таком случае является значение за январь 2014 г.
Записать модель сезонного Naive можно следующим образом:
(5.24)
где s – лаг сезонности. Например, для ежемесячных данных s=12.
Очевидно, что метод будет хорошо работать только в случае с рядами данных без тенденций к росту либо снижению. Кроме того, в прогнозе по данному методу никак не используются старые данные, что в случае со стационарными процессами некорректно.
На рис. 5.11 приведен пример сезонного ряда данных без сильных тенденций к росту либо снижению (ряд № 1100 из базы М3) и прогноз для этого ряда данных по сезонному Naive.
Как видим по рис. 5.11, в приведенном примере простой прогноз по модели сезонного Naive оказался достаточно точным – он повторяет динамику исходного ряда и позволяет в целом прогнозировать сезонные всплески. Однако из-за того, что в прогнозе на 1991 и 1992 гг. использовались лишь значения за 1990 г„ прогноз вобрал в себя случайные отклонения в этом году и оказался несколько завышенным. Если бы в расчете сезонных значений мы учитывали и более старые данные, то в данном случае, скорее всего, получили бы более точный прогноз. Однако это потребовало бы значительно большей вычислительной работы.
Рис. 5.11. Ряд данных № 1100 из базы М3 (сплошная линия с точками), прогноз по ряду по сезонному Naive (сплошная толстая линия)
Метод дрейфа
В случае, если в ряде данных наблюдаются некоторые тенденции к росту либо снижению, исследователь может воспользоваться методом дрейфа (в иностранной литературе он носит название "Drift"), суть которого сводится к проведению прямой линии через две выбранные исследователем точки. Чтобы сделать это, рассчитывается угол наклона прямой линии между этими двумя точками по формуле
(5.25)
где t – номер второго из выбранных наблюдений; k – число наблюдений между выбранными точками.
Получив таким образом оценку угла наклона прямой линии, можно построить прогноз по методу дрейфа:
(5.26)
где h – горизонт прогнозирования.
Исследователь волен сам выбирать точки, через которые провести прямую линию, что является преимуществом метода, однако иногда выбор этих двух точек сам по себе является нетривиальной задачей – при выборе разных значений прогноз может различаться разительно.
В качестве примера на рис. 5.12 приведен ряд данных № 677 на базы М3 и три прогноза, полученных по методу дрейфа:
1. "Drift 1" – линия проведена через первую и последнюю точки ряда данных.
2. "Drift 2" – линия проведена через точки в октябре 1990 г. и октябре 1994 г. Выбор пал на эти точки в связи с тем, что, начиная с октября 1990 г., в ряде данных наблюдается незначительное изменение тенденции – меняется угол наклона.
3. "Drift 3" – линия проведена через точки в январе 1991 г. и январе 1993 г. Выбор точек обусловлен тем, что они позволяют получить прямую линию, проходящую примерно посередине ряда после изменения тенденций.
Рис. 5.12. Ряд данных № 677 из базы временных рядов М3 (сплошная линия с точками) и три точечных прогноза по методу дрейфа:
сплошная линия – "Drift 1"; пунктирная линия – "Drift 2"; сплошная линия с крестиками – "Drift 3"
Можно заметить, что из-за происходящих изменений в ряде данных прогноз "Drift 1" к концу ряда данных оказывается заниженным. Похожая участь постигла и прогноз "Drift 2", в котором из-за выбора точек прямая линия прошла по низу ряда данных. Такие прогнозы могут быть использованы лишь для обозначения нижней границы, ниже которой, скорее всего, показатель не опустится. Прогноз "Drift 3" оказался ближе к последним полученным значениям и, возможно, окажется ближе к истине и на прогнозируемом промежутке.
Метод дрейфа обладает еще одним преимуществом перед классическими методами построения трендов: он не требует практически никаких априорных предположений о протекающих в исследуемом объекте процессах. Однако, как видим, метод в значительной степени опирается на экспертное мнение прогнозиста, которое, очевидно, может оказаться неправильным, что, в свою очередь, может привести к неточным прогнозам.