Экспоненциальное сглаживание с учетом тренда (метод Хольта)

 

Простое экспоненциальное сглаживание временных рядов, содержащих устойчивый тренд, приводит к систематической ошибке, связанной с отставанием сглаженных значений от фактических уровней временного ряда. Для учета тренда в нестационарных рядах применяется специальное двухпараметрическое линейное экспоненциальное сглаживание. В отличие от простого экспоненциального сглаживания с одной сглажива­ющей константой (параметром) данная процедура сглаживает одновременно случайные возмущения и тренд с использова­нием двух различных констант (параметров).

Процедура прогнозирования начинается с того, что сгла­женная величина S1 полагается равной у1. Возникает проблема определения начального значения тренда а1. Рассмотрим два способа оценки а1.

Способ 1. Положим а1=0. Такой подход хорошо работает в случае длинного исходного временного ряда. Тогда сглажен­ный тренд за небольшое число периодов приблизится к факти­ческому значению тренда.

Способ 2. Можно получить более точную оценку а1 исполь­зуя первые, пять (или более) наблюдений временного ряда. На их основе по методу наименьших квадратов решается уравне­ние =а0+а1×tt. Величина а1 берется в качестве начального значе­ния тренда.

Для решения проблемы первым способом необходимо в окне Seasonal and Non-Seasonal Exponential smoothing установить галочку в опции User-def. initial value (Установка значение пользователем) и указать значение первого уровня ряда y1=1259,1. Далее выделим Initial trend (Установки тренда) и в появившемся поле указать а1=0.

Для реализации второго способа необходимо воспользоваться возможностями модуля Multiple Regression (Множественная регрессия).

Шаг 1. Образуем дополнительную переменную t (см. главу 5).

Шаг 2.Проведем оценку тренда по первым 8 уровням (1999-2000гг.) для этого в модуле в окне Multiple Linear Regression (Множественная линейная регрессия) выбрать кнопку Select cases (Выбор значений).

Шаг 3. В появившемся окне (рисунок 6.7) Analysis/Graph Case Selection Conditions (Выбор наблюдений для анализа и построения графиков), установим галочку в опции Enable Selection Conditions®Specific, selected by: в поле By Expression: необходимо указать какие значения используются для оценки модели (в нашем случае 1-8 наблюдение).

 

 

Рисунок 6.7 – Выбор наблюдений для оценки линейного тренда (приведена часть исходного окна)

 

После проведения процедуры получаем следующие результаты:

 

Таблица 6.2 – Результаты оценивания линейного тренда ряда среднедушевых денежных доходов населения

 

  Beta Std.Err. of Beta B Std.Err. of B t(6) p-level
Intercept     1148,007 134,123 8,559 0,000
t 0,923 0,157 156,418 26,560 5,889 0,001

 

Определив значение параметра а1 линейного тренда вернемся в модуль Exponential smoothing & forecasting и внесем начальный уровень, т.е. выберем опцию Initial trend и укажем значение параметра a1=156,418.

Помимо озвученной проблемы остается острой проблема выбора оптимальных констант, при этом задача усложняется в виду увеличение числа констант до двух. Решить данную проблему, призвана процедура Perform grid search (Поиск на сетке решений), позволяющая на основе перебора всех возможных вариантов выбрать модель с оптимальными константами.

Для запуска данной процедуры в окне Seasonal and Non-Seasonal Exponential smoothing выбрем вкладку Grid search (Поиск решений) (рисунок 6.7). При этом выполним данную процедуру в двух вариантах, при а1=0 и при а1=156,418. полученные результаты представим в таблице 6.3 и 6.4.

 

Рисунок 6.7 – Установки процедуры поиска оптимальных вариантов констант (приведена часть исходного окна)

 

Таблица 6.3 - Варианты поиска для модели Хольта ряда среднедушевых денежных доходов населения на сетке решений при а1 = 0 и y1=1259,1 (приведена часть исходной таблицы)

 

  Alpha Gamma Mean Error Mean Abs Error Sums of Squares Mean Squares Mean % Error Mean Abs Error
0,1 0,9 161,153 378,617 232674,3 5,294 9,348
0,2 0,9 80,756 354,800 238328,4 2,368 8,133

 

Таблица 6.4 - Варианты поиска для модели Хольта ряда среднедушевых денежных доходов населения на сетке решений при а1 = 156,418 и y1=1259,1 приведена часть исходной таблицы)

 

  Alpha Gamma Mean Error Mean Abs Error Sums of Squares Mean Squares Mean % Error Mean Abs Error
0,1 0,9 91,834 344,725 214004,0 1,188 7,711
0,1 0,8 100,869 344,618 215162,0 1,370 7,752
0,2 0,7 65,909 345,908 230436,2 0,584 7,556
0,2 0,8 58,892 348,233 232832,7 0,451 7,619

 

где: Mean Error - Средняя ошибка

Mean Abs Error - Абсолютная средняя ошибка

Sums of Squares - Сумма квадратов отклонения

Mean Squares - Средние квадраты

Mean % Error - Процент средней ошибки

Mean Abs Error - Процент абсолютная средняя ошибка

Опишем некоторые особенности приведенных показателей:

Средняя ошибка (Mean error) вычисляется простым усреднением ошибок на каждом шаге.

(6.1)

Очевидным недостатком этой меры является то, что положительные и отрицательные ошибки аннулируют друг друга, поэтому она не является хорошим индикатором качества прогноза.

Средняя абсолютная ошибка (Mean absolute error) вычисляется как среднее абсолютных ошибок.

(6.2)

Если она равна 0 (нулю), то имеем совершенную подгонку (прогноз). В сравнении со средней квадратической ошибкой, эта мера «не придает слишком большого значения» выбросам.

Сумма квадратов ошибок (Sum of squared error (SSE), Mean squared error.), среднеквадратическая ошибка. Эти величины вычисляются как сумма (или среднее) квадратов ошибок.

Это наиболее часто используемые индексы качества подгонки.

Относительная ошибка (Percentage error (PE)). Во всех предыдущих мерах использовались действительные значения ошибок. Представляется естественным выразить индексы качества подгонки в терминах относительных ошибок. Например, при прогнозе месячных продаж, которые могут сильно флуктуировать (например, по сезонам) из месяца в месяц, вы можете быть вполне удовлетворены прогнозом, если он имеет точность 10%. Иными словами, при прогнозировании абсолютная ошибка может быть не так интересна как относительная. Чтобы учесть относительную ошибку, было предложено несколько различных индексов. В первом относительная ошибка вычисляется как:

(6.3)

где: yt - наблюдаемое значение в момент времени t,

yt - прогноз (сглаженное значение).

Средняя относительная ошибка (Mean percentage error (MPE)). Это значение вычисляется как среднее относительных ошибок

(6.4)

Средняя абсолютная относительная ошибка (Mean absolute percentage error (MAPE)). Как и в случае с обычной средней ошибкой отрицательные и положительные относительные ошибки будут подавлять друг друга. Поэтому для оценки качества подгонки в целом (для всего ряда) лучше использовать среднюю абсолютную относительную ошибку.

(6.5)

Данный показатель является относительным показателем точности прогноза и не отражает размерность изучаемых признаков, выражается в процентах и на практике используется для сравнения точности прогнозов полученных как по различным моделям, так и по различным объектам. Интерпретация оценки точности прогноза на основе данного показателя представлена в следующей таблице:

< 10 10 – 20 20 – 50 > 50 Высокая точность Хорошая точность Удовлетворительная точность Не удовлетворительная точность

Как видим из приведенных в таблице 6.3 результатов приемлемыми являются модели 9 и 18 (с параметрами Alpha=0,1 и Gamma=0,9; Alpha=0,2 и Gamma=0,9). Из таблицы 6.4, выбираем модели с номером 9, 8, 16 и 17.

Для определения наилучшей модели построим прогноз по всем выбранным моделям (6 моделей).

 

Таблица 6.5 – Прогнозные значения по экспоненциальным моделям среднедушевых денежных доходов населения

 

Варианты моделей I/2006 II/2006 III/2006 IV/2006 % средней относительной ошибки
Фактические значения 7873,0 9575,8 9988,2 - -
Alpha=0,1 Gamma=0,9 (а1 = 0 и y1=1259,1) 8718,19 9179,22 9640,26 10101,29 5,85
Alpha=0,2 Gamma=0,9 (а1 = 0 и y1=1259,1) 9033,69 9604,47 10175,25 10746,03 2,91
Alpha=0,1 Gamma=0,9 (а1 = 156,418 и y1=1259,1) 8784,57 9223,70 9662,84 10101,97 1,49
Alpha=0,1 Gamma=0,8 (а1 = 156,418 и y1=1259,1) 8808,39 9241,52 9674,64 10107,77 1,70
Alpha=0,2 Gamma=0,7 (а1 = 156,418 и y1=1259,1) 8964,61 9486,17 10007,72 10529,27 0,85
Alpha=0,2 Gamma=0,8 (а1 = 156,418 и y1=1259,1) 9000,21 9550,73 10101,24 10651,75 0,83

 

Как видим из приведенных в таблице 6.5 данных, наиболее приближенным к фактическим данным является прогноз по модели с параметрами Alpha=0,1 и Gamma=0,9, при этом и среднеквадратическое отклонение получено минимальным.

Согласно полученным значениям, наиболее приемлемыми являются прогнозы по модели Alpha=0,1 и Gamma=0,9 (а1 = 0 и y1=1259,1), так как прогнозные значения ближе к фактическим данным. Но при этом процент средней относительной ошибки (таблица 6.5) получен высоким. Если выбирать прогнозную модель по на основе данного показателя, то наилучшей стоит признать модели - Alpha=0,2 и Gamma=0,8 (а1 = 156,418 и y1=1259,1).