Подборка модели вида ARIMA (p,k,q) для ряда А

 

1.1 В первую очередь, протестируем ряд А на стационарность. Рассмотрим график временного ряда А:

 

Уже на основании графика можем заключить, что исходный ряд не является стационарным. В качестве дополнительного подтверждения этой гипотезы, проведем расширенный тест Дики-Фуллера ряда А. Пусть порядок лага будет определен пакетом Gretl автоматически, пусть будет учтена константа и тренд. В результате получим следующее:

 

Тест Дики-Фуллера для A

объем выборки 99

нулевая гипотеза единичного корня: a = 1

 

тест с константой

модель: (1-L)y = b0 + (a-1)*y(-1) + e

коэф. автокорреляции 1-го порядка для e: 0,068

оценка для (a - 1): 0,0202285

тестовая статистика: tau_c(1) = 30,1664

P-значение 1

 

с константой и трендом

модель: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e

коэф. автокорреляции 1-го порядка для e: -0,009

лаг для разностей: F(9, 78) = 0,685 [0,7202]

оценка для (a - 1): 0,0225823

тестовая статистика: tau_ct(1) = 3,38825

асимпт. р-значение 1

 

Поскольку P-value = 1 превышает любой разумный уровень значимости, делаем вывод, что гипотеза Но теста Дики-Фуллера (гипотеза о нестационарности ряда) принимается, и ряд А не является стационарным.

 

Перейдем к первым разностям ряда и рассмотрим новый временной ряд d_A. График этого временного ряда имеет вид:

 

На основании этого графика также можем сделать вывод о том, что процесс d_A не является стационарным. Для подтверждения этого вывода, снова проведем тест Дики-Фуллера и получим следующее:

 

Расширенный тест Дики-Фуллера для d_A

включая 6 лага(-ов) для (1-L)d_A (максимальное значение равно 12)

объем выборки 92

нулевая гипотеза единичного корня: a = 1

 

тест с константой

модель: (1-L)y = b0 + (a-1)*y(-1) + ... + e

коэф. автокорреляции 1-го порядка для e: 0,005

лаг для разностей: F(6, 84) = 9,077 [0,0000]

оценка для (a - 1): 0,0618306

тестовая статистика: tau_c(1) = 1,49658

асимпт. р-значение 0,9993

 

с константой и трендом

модель: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e

коэф. автокорреляции 1-го порядка для e: -0,056

лаг для разностей: F(5, 85) = 1,698 [0,1440]

оценка для (a - 1): -0,319884

тестовая статистика: tau_ct(1) = -1,76781

асимпт. р-значение 0,7205

 

P-value по прежнему превышает любой разумный уровень значимости, и гипотеза Но теста Дики-Фуллера снова принимается: ряд d_A не является стационарным. Поэтому, перейдем ко вторым разностям ряда А, рассмотрим новый временной ряд d_d_A. Рассмотрим график ряда d_d_A:

 

На основании представленного графика можем сделать первичное предположение о том, что ряд является стационарным. Подтвердим данное предположение результатами теста Дики-Фуллера для временного ряда d_d_A:

 

Расширенный тест Дики-Фуллера для d_d_A

включая 4 лага(-ов) для (1-L)d_d_A (максимальное значение равно 12)

объем выборки 93

нулевая гипотеза единичного корня: a = 1

 

тест с константой

модель: (1-L)y = b0 + (a-1)*y(-1) + ... + e

коэф. автокорреляции 1-го порядка для e: -0,049

лаг для разностей: F(4, 87) = 7,583 [0,0000]

оценка для (a - 1): -3,40646

тестовая статистика: tau_c(1) = -7,17745

асимпт. р-значение 1,088e-010

 

с константой и трендом

модель: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e

коэф. автокорреляции 1-го порядка для e: 0,005

лаг для разностей: F(5, 84) = 7,100 [0,0000]

оценка для (a - 1): -4,19552

тестовая статистика: tau_ct(1) = -6,92063

асимпт. р-значение 4,208e-009

 

Поскольку в данном случае P-value = 1,088e-10 < 0,01 (а также меньше любого другого разумного уровня значимости), делаем вывод, что гипотеза Но теста Дики-Фуллера о нестационарности ряда отклоняется, и ряд d_d_A является стационарным.

 

Нестационарный процесс А удалось свести к стационарному процессу d_d_A, и именно с этим процессом мы продолжим работу в следующих пунктах.

 

1.2. Сделаем первые предположения о виде ряда на основании его коррелограммы. Коррелограмма ряда d_d_A (пусть максимальное число лагов составит 20) имеет следующий вид:

 

 

 

 

Вид ACF ряда наводит на мысль о том, что ряд d_d_A является МА процессом первого порядка (поскольку есть только одно, первое, значение функции ACF, статистически значимо отличное от нуля).

 

1.3. Попробуем непосредственно построить модель. В первую очередь проверим предположение того, что ряд А описывается моделью ARIMA (0,2,1), или ряд d_d_A описывается моделью ARIMA (0,0,1) = MA (1):


Модель 1: ARMA, использованы наблюдения 1980:3-2004:4 (T = 98)

Зависимая переменная: d_d_A

Стандартные ошибки рассчитаны на основе Гессиана

 

Коэффициент Ст. ошибка z P-значение  
const 0,118343 0,0217786 5,4339 <0,00001 ***
theta_1 -0,825297 0,0582614 -14,1654 <0,00001 ***

 

Среднее зав. перемен 0,124087   Ст. откл. зав. перемен 1,484416
Среднее инноваций -0,014903   Ст. откл. инноваций 1,170854
Лог. правдоподобие -155,0853   Крит. Акаике 316,1706
Крит. Шварца 323,9255   Крит. Хеннана-Куинна 319,3073

 

    Действительная часть Мнимая часть Модуль Частота
MA Корень 1 1,2117 0,0000 1,2117 0,0000

 

 

Обратим внимание на то, что в полученной модель характеризуется приемлемыми значениями критерия каике и Шварца, а также хороша значимостью константы и первого лага МА-составляющей модели.

На построение именно этой модели нас натолкнул вид коллерограммы ряда d_d_A. Чтобы убедиться, что полученная модель хороша, обратим внимание на то, что добавление лагов AR-составляющей и дополнительных лагов MA-составляющей модели не улучшает ее характеристик. Например, попробуем описать ряд d_d_A моделью ARMA (2,0,2):


 

Модель 2: ARMA, использованы наблюдения 1980:3-2004:4 (T = 98)

Зависимая переменная: d_d_A

Стандартные ошибки рассчитаны на основе Гессиана

 

Коэффициент Ст. ошибка z P-значение  
const 0,118738 0,0232806 5,1003 <0,00001 ***
phi_1 0,356885 0,64692 0,5517 0,58118  
phi_2 -0,177353 0,123524 -1,4358 0,15107  
theta_1 -1,12246 0,652809 -1,7194 0,08554 *
theta_2 0,279339 0,554187 0,5041 0,61423  

 

Среднее зав. перемен 0,124087   Ст. откл. зав. перемен 1,484416
Среднее инноваций -0,011494   Ст. откл. инноваций 1,157414
Лог. правдоподобие -153,9798   Крит. Акаике 319,9595
Крит. Шварца 335,4693   Крит. Хеннана-Куинна 326,2329

 

    Действительная часть Мнимая часть Модуль Частота
AR Корень 1 1,0061 -2,1508 2,3745 -0,1804
  Корень 2 1,0061 2,1508 2,3745 0,1804
MA Корень 1 1,3333 0,0000 1,3333 0,0000
  Корень 2 2,6850 0,0000 2,6850 0,0000

 

Модель (2) уступает модели (1) по всем показателям качества: во-первых, критерии Шварца и Акаике здесь выше, во-вторых, в модели появилось несколько незначимых лагов. Поэтому, будем отдавать предпочтение модели (1).

Попробуем улучшить модель (1), прибегая к учету сезонности. Добавим первую разность сезонной компоненты и первый порядок МА. Получим модель (3):

Модель 3: ARIMA, использованы наблюдения 1981:3-2004:4 (T = 94)

Зависимая переменная: (1-Ls) d_d_A

Стандартные ошибки рассчитаны на основе Гессиана

 

Коэффициент Ст. ошибка z P-значение  
const 0,00731114 0,00119846 6,1004 <0,00001 ***
theta_1 -1 0,0532804 -18,7686 <0,00001 ***
Theta_1 -0,999986 0,216516 -4,6185 <0,00001 ***

 

Среднее зав. перемен 0,038700   Ст. откл. зав. перемен 1,995767
Среднее инноваций 0,019520   Ст. откл. инноваций 1,087806
Лог. правдоподобие -151,9717   Крит. Акаике 311,9435
Крит. Шварца 322,1166   Крит. Хеннана-Куинна 316,0527

 

    Действительная часть Мнимая часть Модуль Частота
MA Корень 1 1,0000 0,0000 1,0000 0,0000
MA (сезонные) Корень 1 1,0000 0,0000 1,0000 0,0000

 

 

При переходе к модели (3) критерии Шварца и Акаике дополнительно снизились в сравнении с моделью (1), к тому же, дополнительно учтенная сезонная компонента оказался значимой на 1%м уровне. Останавливаясь на модели (3), обратим также внимание на график коррелограммы остатков (при рассмотрении 20 лагов):

 

 

 

Все представленные остатки статистически незначимо отличаются от нуля, а значит, остатки данной модели описываются процессом белого шума, как и должно быть. Будем считать, что модель (3), модель ARIMA (0,2,1) для ряда А, является наиболее удачной. Ряд А будет описываться регрессией следующего вида: