Пример решения задачи 1 с использованием программного продукта Minitab

1 Представить описательную статистику, характеризующую данные

1.1 Ввести данные в Minitab for Windows

1.2 На панели меню выбрать команду (Рис.1)

StatàBasic Statistics à Display Descriptive Statistics

Рис.1 Выбор инструмента анализа

1.3 На экране раскроется диалоговое окно Display Descriptive Statistics, представленное на рис.2.

Рис.2 Диалоговое окно Display Descriptive Statistics приложения Minitab

- в поле Variables выбрать значение Profit (C1)

- щелкнуть на кнопке Graphs, и на экране раскроется диалоговое окно Display Descriptive Statistics- Graphs

- выбрать в списке значений Graphical Summary и щелкнуть на кнопке OK

- щелкнуть на кнопке OK в диалоговом окне Display Descriptive Statistics, и на экран будут выведены результаты расчета (рис.3).

Рис. 3. Результаты расчета описательных статистик

1.4 По рис.3 можно получить следующие данные, представленные в таб. 1.

Таблица 1 - Результаты расчета описательных статистик

Сокращение в Minitab Расшифровка сокращения
Mean Среднее значение
StDev Стандартное отклонение
Skewness Асимметрия, если значение стремится к нулю - данные симметричны, больше нуля - положительное несимметричное распределение, меньше нуля – отрицательное несимметричное распределение
Kurtosis Эксцесс - уровень, в котором набор данных является пиковым. Для нормального распределения эксцесс равен нулю, распределение с более острым пиком будет иметь положительное значение эксцесса, распределение с более плоским пиком - отрицательное значение эксцесса.
Minimum Минимальное значение
Median Медиана
Maximum Максимальное значение
1st Quartile Первый квартиль. 25 % данных меньше или равны этому значению
3rd Quartile Третий квартиль (Q3). 75 % данных меньше или равны этому значению.
95% confidence interval for Mu 95% доверительный интервал для средней
95% confidence interval for Sigma 95% доверительный интервал для стандартного отклонения
95% confidence interval for Median 95% доверительный интервал для медианы

1.5 По полученным данным сделать выводы.

2 Определить тип исходных данных

2.1 На панели меню выбрать команду GraphàTime Series Plot и ввести соответствующие данные. Результат построения для представлен на рис.4.

Рис.4 Прибыль предприятия А

2.2 На панели меню выбрать команду StatàTime Series à Autocorrelation. На экране раскроется диалоговое окно Autocorrelation Function, представленное на рис.5.

Рис.5 Диалоговое окно Autocorrelation Function приложения Minitab

- в поле Series выбрать значения (C1)

- отметить Store ACF, Store t statistics и Store Ljung-Box Q Statistics

щелкнуть на кнопке OK в диалоговом окне Autocorrelation Function, и на экран будут выведены результаты расчета, представленные на рис.6 и в таблице 5.

В таблице 5 приняты следующие обозначения

- Lag – период запаздывания;

- ACF1 – коэффициенты автокорреляции

- TSTA1 – результаты t-статистики;

- LBQ1 – результат Q-статистики.

-

Рис. 6. Результаты расчета автокорреляции (коррелограмма)

Таблица 5 – Результаты автокорреляционного

Lag ACF1 TSTA1 LBQ1
0,35720483 2,369428777 6,005880595
0,11732431 0,694639567 6,669222215
0,2401706 1,406630878 9,516739219
0,68599833 3,848422097 33,32878062
0,06785047 0,294265165 33,56770013
-0,2190849 -0,948299259 36,1242353
-0,1196512 -0,50763371 36,90738126
0,28073742 1,184145494 41,33845126
-0,2148486 -0,878658885 44,00781379
-0,419388 -1,685831281 54,47822112
-0,2919431 -1,104369035 59,70571017

С помощью механизма автокорреляции могут изучаться наборы данных имеющих тренд и сезонность. Коэффициенты автокорреляции для различных значений запаздывания величин во времени используются для отождествления моделей поведения данных, присутствующих во временных рядах.

Если ряд случаен, то коэффициенты автокорреляции между Yt и Yt-k близки к нулю, т.е. последовательные значения временного ряда не связаны друг с другом.

Если у ряда существует тренд, значения Yt и Yt-k имеют сильную корреляцию, причём коэффициенты существенно отличны от нуля, для нескольких первых периодов запаздывания, а с увеличением периода постепенно убывают до нуля.

Если ряд имеет сезонную компоненту, значительный коэффициент автокорреляции будет наблюдаться для периодов, равных сезонному периоду или кратных ему.

Если ряд является случайным, практически все коэффициенты автокорреляции должны находиться внутри интервала, содержащего нуль, плюс или минус определённое количество число стандартных ошибок, т.е. при заданном уровне значимости ряд может считаться случайным, если вычисленные коэффициенты автокорреляции находятся внутри интервала, ограниченного выражением

Автокорреляция для первых периодов запаздывания таблицы 5 существенно отличны от нуля и затем убывают. Для периода запаздывания 11 коэффициент LBQ = 59,70571017, что превышает значение равное 19,675 (получено при уровне значимости 0,05). Следовательно данные имеют значительную автокорреляцию и демонстрируют заметный тренд. Кроме того, по полученным данным видно, что прибыль предприятия А носит ярко выраженный сезонный характер с периодом 4 (квартал).

При выборе оптимального метода прогнозирования для конкретной задачи предварительно следует определить: чем обусловлена необходимость прогноза; конкретную сферу применения для результатов прогноза; период прогнозирования; требования к исходным данным; необходимую точность прогноза; стоимость прогноза.

Стационарные методы прогнозирования используются в следующих случаях: воздействия, порождающие ряд, стабилизировались, и окружающая среда, в которой ряд существует, относительно неизменна; в силу недостатка данных либо для упрощения объяснения или реализации прогноза не­обходимо использовать очень простую модель; стабильность может быть достигнута за счет простой корректировки таких факторов, как рост населения или инфляция; ряд можно преобразовать в стабильный; ряд представляет собой множество ошибок прогноза, полученных в результате применения метода прогнозирования, который может считаться неадекватным .

Методы прогнозирования, которые могут применяться по отношению к стационарным рядам, включают в себя наивные методы: методы простого усреднения, скользящие средние, простое экспоненциальное сглаживание и методы авторегрессионого скользящего среднего (методы Бокса-Дженкинса).

Методы прогнозирования для рядов, обладающих трендом, используются в следующих случаях: повышение производительности труда и применение новых технологий ведут к изменению стиля жизни; рост населения вызывает увеличение потребностей в товарах и услугах; покупательная способность валюты за счет инфляции оказывает влияние на общие экономические показатели; возрастает признание продукта на рынке

Аппарат прогнозирования, который должен использоваться для прогнозирования рядов, имеющих тренд, — это метод скользящих средних, метод линейного экспоненци­ального сглаживания Хольта (Holt), простая регрессия, возрастающие кривые, экспо­ненциальные модели и методы авторегрессионых интегрированных скользящих средних (методы Бокса—Дженкинса).

Методы прогнозирования для сезонных данных используются в следующих случаях: на изучаемую величину влияет погода; рассматриваемая величина определяется годичным циклом; .

Методы, которые следует использовать для прогнозирования сезонных рядов, вклю­чают классическое разложение, экспоненциальное сглаживание Вин­тера (Winter), многомерную регрессию временного ряда и методы Бокса-Дженкинса.

Методы прогнозирования для циклических данных используются в следующих случаях: на интересующую величину влияет бизнес-цикл; имеют место изменения в общественных вкусах; возникают изменения в народонаселении; происходят сдвиги в цикле производства продуктов потребления.

Аппарат, который необходимо использовать для прогнозирования циклических ря­дов, включает классическое разложение, экономические индикаторы, эконометрические модели, многомерную регрессию и методы Бокса-Дженкинса.

В итоге можно сделать следующие выводы:

1. Статистически сложные или комплексные методы прогнозирования действительно не приводят в обязательном порядке к получе­нию более точных прогнозов, чем более простые методы.

2. Разные показатели точности (MAD, MSE, МАРЕ), используемые для оценки различных методов прогнозирования, дают согласованные результаты.

3. Комбинирование результатов трех экспоненциальных сглаживающих методов превосходит, в среднем, отдельные комбинируемые методы и дает наилучший эффект в сравнении с другими методами.

4. Эффективность различных методов прогнозирования зависит от отдаленности прогноза во времени и типа (ежегодные, ежеквартальные, ежемесячные) анализи­руемых данных. Одни методы дают большую точность для короткого промежутка времени, в то время как другие больше подходят для составления длительных прогнозов. Некоторые методы хорошо работают с ежегодными данными, а другие более эффективны для ежеквартальных и ежемесячных данных.

По завершении исследования необходимо проверить, насколько каждый метод надежен и применим к рассматриваемой проблеме (табл.6).

3 Определить прогнозные значения с помощью четырехквартального скользящего среднего, простого экспоненциального сглаживания, метода Хольта, метода Винтерса.

3.1 Четырехквартальное скользящее среднее.

При использовании метода простых средних прогнозирование выполняется на основе усреднения всех существующих данных. Однако, часто аналитика больше интересуют самые последние наблюдения. Тогда фиксируется число точек данных, подлежащих усреднению, и ограничиваются только последними наблюдениями. Для описания такой модели используется термин скользящее среднее. Как только новое наблюдение становится доступным, оно включается в усреднение, а наиболее старое соответственно исключается. Вычисленное скользящее среднее используется для создания прогноза на следующий период.


Таблица 6 - Рекомендации по выбору метода прогнозирования*

Метод Модель данных Временная отдаленность Тип модели Минимальные требования к данным
Несезонные Сезонные
Наивный ст, т, с К ВР  
Простые средние ст К ВР  
Скользящие средние ст К ВР 4-20  
Экспоненциальное сглаживание ст к ВР  
Линейное экспоненциальное сглаживание т к ВР  
Квадратичное экспоненциальное сглаживание т к ВР  
Сезонное экспоненциальное сглаживание с к ВР   2хс
Адаптивная фильтрация с к ВР   5хс
Простая регрессия т с к  
Множественная регрессия Ц, С с к 10хВ  
Классическое разложение с к ВР   5хс
Экспоненциальные трендовые модели т с,д ВР  
Модели Гомперца т с,д ВР  
Возрастающие кривые т с,д ВР  
Модели Бокса-Дженкинса ст, т, ц, с к ВР 3хс
Ведущие индикаторы Ц К К  
Эконометрические модели ц К К  
Многомерная регрессия временного ряда Т, С с,д к   6хс

 

Важно, что в методике скользящего среднего используются только последние k наблюдений и число точек, подлежащих усреднению, не меняется со временем. Модель, построенная по данной методике, не очень хорошо учитывает тренд и сезонные вариации, хотя делает это лучше, чем метод простого среднего.

Для анализа данных с помощью четырехквартального скользящего среднего:

- На панели меню выбрать команду StatàTime Series à Moving Average

- В открывшемся диалоговом окне (рисунок 7) выбрать ряд С1

- Для выбора четырехквартального скользящего среднего в поле MA Length ввести значение 4.

- Установить флажок Generate Forecasts и ввести значение 1 в поле Number of forecasts.

Рис. 7 Диалоговое окно Moving Average приложения Minitab for Windows

- Нажать ОК.

Результат анализа представлен на рисунке 8.

Рис. 8 Результат четырехквартального скользящего среднего

3.2 Простое экспоненциальное сглаживание

По сравнению с методами скользящих средних в методе простого экспоненциального сглаживания применяется взвешенное (экспоненциально) скользящее усреднение всех данных предыдущих наблюдений. Эта модель чаще всего применяется к данным, о которых заранее не известно, имеют ли они тренд.

Экспоненциальное сглаживание предусматривает постоянное обновление модели за счет наиболее свежих данных. Этот метод основывается на усреднении временных рядов прошлых наблюдений в нисходящем (экспоненциально) направлении. Т.е. более поздним событиям присваивается больший вес. Вес присваивается следующим образом: для последнего наблюдения весом будет величина ( ), для предпоследнего – (1- ), для того, которое было перед ним, - (1- )2 и т.д.

В сглаженном виде новый прогноз будет определяться как взвешенное среднее последнего наблюдения величины в момент времени t и ее прежнего прогноза на этот же период:

где - прогнозируемое значение на следующий период;

- постоянная сглаживания;

- наблюдение величины за текущий период t;

- прежний сглаженный прогноз этой величины на период t.

Если требуется, чтобы спрогнозированные величины были стабильны и случайные отклонения сглаживались, необходимо выбирать малое значение . Большее значение постоянной имеет смысл в том случае, если нужна быстрая реакция на изменения в спектре наблюдений. Для оценки оптимального значения можно минимизировать среднеквадратическую ошибку:

При использовании основного уравнения простого экспоненциального сглаживания необходимо оговорить начальное сглаженное значение. Часто первая оценка устанавливается равной первому наблюдению. Иногда, в качестве начального используется среднее значение первых пяти или шести наблюдений.

Следует отметить, что в методике экспоненциального сглаживания предполагается, что данные колеблются около уровня, который меняется нечасто. Когда же в данных присутствует значительный тренд, простое экспоненциальное сглаживание постоянно отстает от реальных наблюдений. Тогда необходимо использовать другие методы сглаживания, представленные ниже.

Для анализа данных с помощью простого экспоненциального сглаживания:

- На панели меню выбрать команду StatàTime Series à Single Exp Smoothing

- В открывшемся диалоговом окне (рисунок 9) выбрать ряд С1

- В поле Weight to Use in smoothing.выберите значение Optimal Arima.

- Установить флажок Generate Forecasts и ввести значение 1 в поле Number of forecasts.

- Нажать ОК.

Результат анализа представлен на рисунке 10.

3.3 Метод Хольта

В случае наличия тренда в исходных данных необходима функция прогнозирования линейного тренда. В 1957 году Хольт разработал метод экспоненциального сглаживания, получивший название двухпараметрического метода Хольта. В этом методе учитывается локальный линейный тренд, присутствующий во временных рядах.

 

Рис. 9 Диалоговое окно Single Exponential Smoothing приложения Minitab for Windows

Рис. 10 Результат простого экспоненциального сглаживания

Если во временных рядах имеется тенденция к росту, то вместе с оценкой текущего уровня необходима и оценка наклона. В методике Хольта значения уровня и наклона сглаживаются непосредственно, при этом используются различные постоянные сглаживания для каждого из них. Эти постоянные сглаживания позволяют оценить текущий уровень и наклон, уточняя их всякий раз, когда появляются новые наблюдения. Одним из преимуществ методики Хольта является ее гибкость, позволяющая выбирать соотношение, в котором отслеживаются уровень и наклон.

Ниже приведены три уравнения, составляющие метод Хольта.

1 Экспоненциально сглаженный ряд или оценка текущего уровня:

где - новая сглаженная величина;

- постоянная сглаживания;

- новое наблюдение или реальное значение ряда в период t;

- собственно оценка тренда;

2 Оценка тренда:

где - постоянная сглаживания ( ).

3 Прогноз на р периодов вперед:

где - прогноз на периодов вперед;

- количество периодов вперед, на которое делается прогноз.

Как и при обычном экспоненциальном сглаживании, постоянные и выбираются субъективно или путем минимизации ошибки прогнозирования. Чем большие значения весов будут взяты, тем более быстрый отклик на происходящие изменения будет иметь место. И наоборот, если веса будут небольшие, то и реакция модели на изменения в данных будет более слабой.

Для минимизации значений MSE нужно создать сетку значений и и выбрать ту комбинацию, которая даст меньшее значение MSE. Особый случай имеет место, когда = , поскольку здесь в одинаковой мере проводится сглаживание как текущего уровня значений, так и тренда. Такой вариант называется двойным экспоненциальным сглаживанием Брауна.

При использовании изложенного алгоритма также необходимо оговорить начальное сглаженное значение. Часто первая оценка устанавливается равной первому наблюдению. При этом тренд будет равен нулю. Иногда, в качестве начального используется среднее значение первых пяти или шести наблюдений.

Для анализа данных с помощью метода Хольта:

- На панели меню выбрать команду StatàTime Series à Double Exp Smoothing

- В открывшемся диалоговом окне (рисунок 11) выбрать ряд С1

 

Рис. 11 Диалоговое окно Double Exponential Smoothing приложения Minitab for Windows

- В поле Weight to Use in smoothing.выберите значение Optimal Arima.

- Установить флажок Generate Forecasts и ввести значение 1 в поле Number of forecasts/

- Нажать ОК.

Результат анализа представлен на рисунке 12.

Рис. 12 Результат метода Хольта для прибыли предприятия А

3.4 Метод Винтерса

Если в структуре данных присутствуют сезонные колебания, то для уменьшения ошибок прогнозирования применяют трехпараметрическую, линейную и сезонную модель экспоненциального сглаживания, предложенную в 1960 году Винтерсом. Этот подход является расширением метода Хольта. Для учета сезонных колебаний здесь задействуется дополнительное уравнение.

Модель Винтерса определяется следующими уравнениями:

1 Экспоненциально сглаженные ряды:

2 Оценка тренда

3 Оценка сезонности:

где - постоянная сглаживания для оценки сезонности.

4 Прогноз на р периодов вперед:

где - длительность периода сезонного колебания.

Как и в предыдущих методах, постоянные , и выбираются субъективно или путем минимизации ошибки прогнозирования.

Метод Винтерса позволяет наиболее просто учесть в модели сезонность, если исходные данные имеют сезонную структуру. В альтернативном способе предлагается сначала исключить сезонную составляющую или, наоборот, учесть сезонность в самих данных.

Для анализа данных с помощью метода Винтерса:

- а) На панели меню выбрать команду StatàTime Series à Winters Method

- б) В открывшемся диалоговом окне (рисунок 13) выбрать ряд С1

- в) В поле Seasonal length ввести значение 4 (период сезонных колебаний)

- г) В поле Weight to Use in smoothing.выберите значения, представленные на рисунке 13.

- д) Установить флажок Generate Forecasts и ввести значение 1 в поле Number of forecasts.

- е) Нажать ОК.

Рис. 13 Диалоговое окно Winters Method приложения Minitab for Windows

Результат анализа представлен на рисунке 14.

4 Декомпозиция временного ряда

Один из методов анализа временных рядов включает попытку определить составляющие факторы, которые влияют на каждое значение временного ряда. Подобная процедура идентификации называется декомпозицией. Каждая компонента идентифицируется отдельно. Затем вклады каждой компоненты комбинируются с целью получения прогнозов будущих значений временных рядов.

Методы декомпозиции используются как для кратковременных, так и для долговременных прогнозов. С их помощью также можно просто отображать рост или спад, лежащий в основе тренда, или корректировать значения ряда, исключая из них одну или несколько компонент.

 

Рис. 14 Результат метода Винтерса для прибыли предприятия А

 

Недостатком данного метода является то, что проекция отдельных компонент на будущее с последующей их комбинацией для получения прогноза значений основного ряда на практике не всегда работает достаточно хорошо. Трудность заключается в том, что сложно дать точный прогноз для отдельных компонент. Разработка более гибких модельных процедур прогнозирования сделала декомпозицию больше инструментом анализа и понимания временных рядов, чем самостоятельным методом прогнозирования.

Временной ряд можно разложить на следующие компоненты:

1 Тренд (Т) – компонента, характеризующая основной рост (или спад) во временном ряду.

2 Цикличность (С) – последовательность волнообразующих флуктуаций или циклы длительностью более одного года. На практике цикл идентифицировать сложно, в этом случае основной рост (или спад) называют трендово-циклическим.

3 Сезонность (S). Сезонные изменения обычно присутствуют в квартальных, месячных или недельных данных. Под сезонными вариациями понимают изменения с более или менее стабильной структурой, имеющие годовую цикличность.

4 Нерегулярность (I). Нерегулярная компонента включает непредсказуемые или случайные флуктуации.

Для изучения компонент временных рядов аналитик должен рассмотреть, как каждая из них связана с реальным рядом. Эта задача решается посредством задания модели, в которой переменная временного ряда Y выражается в терминах его компонент Т, С, S и I.

Двумя простейшими моделями являются:

Аддитивная:

Y=T+C+S+I

Мультипликативная:

Y=T*C*S*I

Модель аддитивных компонент применяется в тех случаях, когда анализируемый временной ряд имеет приблизительно одинаковые изменения на протяжении всей длительности ряда. Иными словами, все значения ряда существенно убывают в пределах полосы постоянной ширины, центрированной на уровне тренда.

Модель мультипликативных компонент эффективнее в тех случаях, когда изменение временной последовательности увеличивается с ростом уровня, т.е. значения ряда расходятся как имеющие тренд, а наблюдаемая последовательность значений напоминает рупор или воронку.

Тренд представляет собой долговременные изменения во временных рядах, которые иногда можно описать с помощью прямой линии или гладкой кривой.

Для деловых и экономических временных рядов следует рассматривать трендовую (трендово-циклическую) компоненту как гладкое изменение во времни. В действительности тренд редко можно описать такой простой функцией как прямая линия.

Кривую тренда временного ряда необходимо сглаживать по двум причинам. Во-первых, это позволяет исследовать основное направление ряда, во-вторых, можно исключить влияние тренда из первоначального ряда с целью получения более отчетливой картины сезонности.

Временное уравнение для тренда может быть применено к данным на основе метода наименьших квадратов.

Сезонная структура имеет место при наличие явлений, повторяющихся из года в год. На годичных данных сезонность никак не отражается, поскольку нет возможности смоделировать внутригодовую структуру данных, значения которых регистрируются лишь один раз в год. Однако во временных рядах, содержащих недельные, месячные или квартальные наблюдения, сезонность проявляется очень часто.

Существует несколько методов для оценки сезонных вариаций. Основная идея всех этих методов заключается в том, что в реальном ряду сначала оценивается и убирается тренд, а потом сглаживается возможная нерегулярная компонента. Можно считать, что оставшиеся данные будут содержать только сезонные вариации. Сезонные величины собираются и суммируются для получения числа (числового индекса) для каждого наблюдаемого интервала года (недели, месяца, квартали и т.д.).

Таким образом, определение сезонной компоненты во временном ряду отличается от анализа тренда в двух отношениях.

1 Тренд определяется непосредственно из начальных данных, а сезонная компонента вычисляется лишь после исключения из набора данных всех остальных компонент, в результате чего в них остается только сезонность.

2 Тренд описывается с помощью одной кривой или одного уравнения, а в случае сезонности отдельное значение рассчитывается для каждого наблюдаемого интервала года и чаще всего имеет вид числового индекса.

Сезонная структура проявляется в сезонных (числовых) индексах. Числовые индексы являются удельными величинами, характеризующими изменения величины во времени.

Для месячных данных, например, сезонный индекс 1.0 для одного месяца означает, что ожидаемое значение для него составляет 1/12 от общего значения для всего года. Значение индекса 1,25 для другого месяца подразумевает, что ожидаемые наблюдения для него превысят на 25% 1/12 годичного целого, и т.д. Числовые индексы указывают на ожидаемые подъемы и спады уровня активности в течение года после того, как трендовая и нерегулярная компонента были удалены.

Чтобы выделить сезонность, нужно в первую очередь оценить и удалить тренд. Тренд можно оценить с помощью одной из кривых тренда или метода скользящих средних.

При использовании модели мультипликативной декомпозиции существует популярный метод оценки сезонных вариаций, называемый отнесение к скользящему среднему. В этом методе тренд оценивается с использованием центрированного скользящего среднего.

Если сезонная структура претерпевает изменения, то оценка сезонной компоненты на полном наборе данных может дать ошибочные результаты. В этом случае для оценки сезонной компоненты лучше использовать либо только самые свежие данные, либо модель временных рядов, допускающую выделение сезонности.

После определения сезонной компоненты ее можно использовать для вычисления данных с устраненными сезонными колебаниями. Для аддитивной декомпозиции такие данные вычисляются путем вычитания сезонной компоненты из исходных значений.

Для мультипликативной декомпозиции данные с устраненными сезонными колебаниями вычисляются путем деления исходных данных на сезонную компоненту.

Выделяют три мотива для выполнения сезонной корректировки данных:

1 Исключение сезонности позволяет достоверно сравнивать значения в различные моменты времени.

2 Соотношение между экономическими переменными легче понять, ели осложняющий фактор сезонности предварительно устранен из данных.

3 Исключение сезонности может быть полезным элементом в получении кратковременных прогнозов будущих значений данных временных рядов.

Циклы – это долговременные волнообразные колебания, которые чаще всего встречаются в макропоказателях экономической деятельности. В тех пределах, в которых они могут быть измерены, циклы обычно не имеют устойчивой структуры. Однако определенное понимание циклического поведения временных рядов может быть получено путем исключения из них трендовой и сезонной компонент с использованием метода мультипликативной декомпозиции:

Для сглаживания нерегулярностей можно использовать скользящее среднее, сохраняя в данных лишь циклическую компоненту. Чтобы исключить проблему центрирования при использовании метода скользящего среднего с четными временными периодами, нерегулярности сглаживаются по методу скользящего среднего с нечетным количеством периодов (для месячных данных 5,7,9,11, для квартальных данных - 3).

Наконец, нерегулярная компонента оценивается с помощью следующего уравнения:

Нерегулярная компонента описывает вариабельность во временных рядах после того, как были удалены все остальные компоненты. Иногда ее также называют остатком или ошибкой. При мультипликативной декомпозиции как циклическая, так и нерегулярная компоненты выражаются индексами.

Единственная причина выполнения декомпозиции временной последовательности состоит в стремлении выделить и рассмотреть отдельные компоненты последовательности. После того как аналитик рассмотрит трендовую, сезонную, циклическую и нерегулярную компоненты по отдельности, можно попытаться проникнуть в суть структуры исходных данных. Кроме того, выделенные компоненты можно заново комбинировать с целью получения прогнозов будущих значений временных рядов.

Одним из путей исследования циклической структуры является изучение деловых показателей. Деловой показатель представляет собой связанный с деловой активностью временной ряд, предназначенный для оценки общего состояния экономики, в частности по отношению к бизнес-циклу.

В прогнозировании сезонных временных рядов используется процесс, обратный декомпозиции. Рослее разбиения ряда на отдельные компоненты для их раздельного изучения, его компоненты собираются для построения прогноза на будущие периоды.

Методы декомпозиции временных рядов имеют длинную историю. В 1920-х и начале 1930-х годов в Федеральном резервном управлении и Национальном комитете экономи­ческих исследований США проводились интенсивные исследования в области сезонных корректировок и методов сглаживания экономических временных рядов. Однако пока компьютерная техника не получила необходимого развития, декомпозиционные вычисления были трудоемкими и практическое применение этих методов было ограничено. В начале 1950-х годов Джулиус Шискин (Julius Shiskin), руководитель группы экономических статистиков в Бюро переписи населения США, разработал масштабную компьютерную программу для декомпозиции временных рядов. Первая компьютерная программа весьма приближенно соответствовала ручному методу, что было пределом возможностей на то время, и поэтому годом позже ее заменили на усовершенствованную програм­му, известную как Method II. Далее последовала серия усовершенствованных вариантов этой программы. Текущий вариант программы декомпозиции временного ряда Бюро пе­реписи населения известен как X-12-ARIMA.

Декомпозиция по методу Census II обычно является мультипликативной, поскольку большинство экономических временных рядов имеет сезонные вариации, которые увеличиваются с ростом уровня ряда. Кроме того, этот метод декомпозиции предполагает использование трех компонент: трендово-циклической, сезонной и нерегулярной.

Метод Census II включает выполнение последовательности этапов, повторяющихся до тех пор, пока компоненты не будут успешно разделены. На большинстве этапов к данным применяется метод взвешенного скользящего среднего, что приводит к неминуемой утрате данных в результате усреднения в начале и в конце последовательности. Программа ARIMA, часть пакета X-12-ARIMA, позволяет расширить при прогнозировании исходный ряд в обоих направлениях, поэтому большинство наблюдений подгоняется с использованием полного взвешенного скользящего среднего.

Этапы, выполняемые на каждой итерации метода Census II, реализованного в программном пакете X-12-ARIMA, описываются ниже. Из-за большого количества этапов метод может показаться слишком сложным. Однако основная его идея очень проста — отделить трендово-циклическую, сезонную и нерегулярную компоненты друг от друга. Наличие множества итераций лишь улучшает оценку каждой компоненты.

Этап 1. Чтобы получить грубую оценку трендово-циклической компоненты, к исходным данным применяется метод s-периодического скользящего среднего. (Для месячных данных s=12, для квартальных данных s = 4 и т.д.)

Этап 2. Отношения исходных данных к этим значениям скользящего среднего вычисляются по методу классической мультипликативной декомпозиции.

Этап 3. Полученные на втором этапе отношения содержат как сезонную компоненту, так и нерегулярную. В них также входят экстремальные значения, являющиеся результатом необычных событий, таких как забастовки или войны. Вычисленные отношения делятся на грубую оценку сезонной компоненты, что в результате дает оценку нерегулярной компоненты. Большие значения нерегулярной компоненты указывают на экстремальные величины в исходных данных. Подобные экстремальные величины выявляются, и полученные на втором этапе отношения соответствующим образом подгоняются. Такой подход эффективно исключает те значения, которые не соответствуют общей структуре всех остальных данных. Недостающие значения в начале и в конце последовательности также заменяются на оценки, полученные на этом этапе.

Этап 4. Отношения, полученные из модифицированных данных (с исключенными экстремальными величинами и оценками для недостающих значений), сглаживаются по методу скользящего среднего с целью исключения нерегулярных изменений. В результате будет получена предварительная оценка сезонной компоненты.

Этап 5. Исходные данные делятся на предварительную оценку сезонной компоненты, полученную на четвертом этапе, что дает предварительные ряды с сезонной коррекцией. Эти ряды с сезонной коррекцией включают трендово-циклическую и нерегулярную компоненты:

Этап 6. Трендово-циклическая компонента оценивается посредством применения метода взвешенного скользящего среднего к предварительному ряду с коррекцией сезонных колебаний. Скользящее среднее устраняет нерегулярные изменения и дает гладкую кривую, которая демонстрирует предварительную оценку трендово-циклической компоненты в данных.

Этап 7. Далее повторяется выполнение второго этапа, но уже с новыми оценками трендово-циклической компоненты. Иными словами, новые отношения, содержащие только сезонную и нерегулярную компоненты, будут получены посредством деления исходных наблюдений на значения трендово-циклической компоненты, рассчитанные на этапе 6. В результате будут получены оконча­тельные значения сезонно-нерегулярных отношений:

Этап 8. Повторяется выполнение третьего этапа, но уже с использованием новых отношений, вычисленных на седьмом этапе.

Этап 9. Повторяется выполнение четвертого этапа, что дает новую оценку сезонной компоненты.

Этап 10. Выполняются действия пятого этапа с использованием оценки сезонной компоненты, полученной на девятом этапе.

Этап 11. Данные с сезонной коррекцией из десятого этапа делятся на значения трендово-циклической компоненты, полученные на шестом этапе, что в результате дает оценку нерегулярной компоненты.

Этап 12. Экстремальные значения нерегулярной компоненты исключаются по методу, описанному на третьем этапе. Ряды модифицированных данных получаются путем перемножения значений трендово-циклической, сезонной и подогнанной нерегулярной компонент. Эти данные соответствуют исходным данным, за исключением удаленных экстремальных значений.

Затем все эти двенадцать этапов повторяются, причем вместо исходных данных используются модифицированные данные из двенадцатого этапа. В некоторых случаях диапазон скользящих средних может быть изменен в зависимости от вариабельности данных.

Окончательный ряд с исключенными сезонными колебаниями определяется посредством деления исходных данных на окончательную сезонную компоненту. Результат содержит только произведение трендово-циклической и нерегулярной компонент.

Значения каждой из финальных компонент распечатываются, и по ним строятся гра­фики. Существует ряд диагностических тестов, с помощью которых можно определить, насколько удачной оказалась выполненная декомпозиция.

Программный пакет X-12-AR1MA включает множество дополнительных возможно­стей, которые не были описаны. Например, можно делать корректировку для различного числа операционных дней в месяцах и для учета эффекта праздников. Можно оценить и добавить недостающие значения ряда, можно до начала декомпозиции удалить нетипичные эффекты, можно смоделировать другие изменения в тренде, такие как эффекты сдвига уровня или временных уклонов.

Для прогнозирования с помощью уравнений тренда:

а) Для запуска процедуры анализа тренда выбрать команду StatàTime SeriesàTrend Analysis

б) На экране раскроется диалоговое окно Trend Analysis (Анализ тренда) (рис.15).

Рис.15 Диалоговое окно Trend Analysis в Minitab for Windows

в) В открывшемся диалоговом окне необходимо выполнить следующее:

- в качестве значения поля Variable (Переменная) указать C1;

- переключатель Model Type (Тип модели) позволяет выбирать тип модели тренда.

- установить флажок опции Generate forecasts (Генерировать прогнозы) и ввести значение 1 в поле Number of forecasts (Количество прогнозов), чтобы сделать прогноз на 1 квартал

- в поле Title (Заголовок) введите заголовок.

- щелкнуть на кнопке ОК, и на экран будет выведен график.

г) Повторить п.в) для прочих моделей тренда.

Для декомпозиции временного ряда:

а) Ввести в столбец С1 сведения о прибыли предприятия. Для расчета декомпозиционной модели выбрать команду StatàTime SeriesàDecomposition.

б) На экране раскроется диалоговое окно Decomposition (Декомпозиция), показанное на рис. 16.

Рис. 16. Диалоговое окно Decomposition приложения Minitab

- в поле Variable (Переменная) ввести значение С1

- поскольку данные являются квартальными, в поле Seasonal Length (Длительность сезонного цикла) ввести значение 4

- переключатель Model Type (Тип модели) установить в положение Multiplicative (Мультипликативная), а переключатель Model Components (Компоненты модели) — в положение Trend plus seasonal (Тренд плюс сезонность)

- в поле Fist obs. is in seasonal period (Сезонный период первого наблюдения) ввести значение 1

- установить флажок опции Generate forecasts и ввести значение 4 в поле Number of forecasts

в) Щелкнуть на кнопке Storage... (Сохранение), и на экране раскроется диалоговое окно Decomposition - Storage, показанное на рис. 17.

Puc. 17. Диалоговое окно Decomposition - Storage приложения Minitab

 

- в группе Storage установить флажки опций Trend Line (Линия тренда), Detrended data (Данные с исключенным трендом), Seasonals (Сезонные колебания), Seasonally adjusted data (Данные с исключенными сезонными колебаниями)

- щелкнуть на кнопке ОК в этом диалоговом окне, а затем в диалоговом окне Decomposition. Результат представлен в табл. 7.

Таблица 7 – Фрагмент мультипликативной декомпозиции данных о квартальной прибыли

Y TREN1 DETR1 SEAS1 DESE1
Фактические данные Оценка тренда Данные с исключенным трендом Сезонные колебания Данные с исключенными сезонными колебаниями
100,5 274,9532 0,365517 0,6769 148,4709
205,5 273,8682 0,750361 1,032843 198,9654
258,8 272,7831 0,948739 1,165822 221,9892
271,6981 0,909097 1,124435 219,666
128,8 270,6131 0,475956 0,6769 190,2792
         
         
294,2 232,6365 1,264634 1,124435 261,6426
188,1 231,5515 0,812346 0,6769 277,8844
241,6 230,4665 1,048309 1,032843 233,9174
229,3814 1,076809 1,165822 211,8676
237,4 228,2964 1,039876 1,124435 211,1283

 

г) На экран будут выведены диалоговые окна и графики, представленные на рис. 18-19.

Time Series Decomposition for Y Fitted Trend Equation   Yt = 276,0 - 1,08504*t   Seasonal Indices Period Index 1 0,67690 2 1,03284 3 1,16582 4 1,12443   Accuracy Measures MAPE 17,36 MAD 41,37 MSD 2674,04   Forecasts Period Forecast 45 153,799 46 233,553 47 262,358 48 251,824

Рис.18 Листинг результатов декомпозиции данных в Minitab for Windows

На левом верхнем графике представлены исходные данные, на правом – данные с исключенным трендом (индекс). На левом нижнем графике представлены данные с устраненными сезонными колебаниями, на правом – данные с устраненным трендом и сезонностью.

 

Рис. 19. Анализ компонент данных

Рис. 20 Сезонный анализ данных о квартальной прибыли предприятия

На рис. 20 представлены следующие сезонные компоненты.

Первый квартал = 0,6769à67,6%

Второй квартал = 1,0328à103,3%

Третий квартал = 1,1658à116,6%

Четвертый квартал = 1,1244à112,4%

Верхняя левая диаграмма на рис. 20 представляет сезонные компоненты, отнесенные к 1,0. Можно видеть, что прибыль в первом квартале на 32,4% ниже средних, во втором квартале она приблизительно такая, как и ожидалось, в третьем квартале прибыль почти на 17% выше средней, а в четвертом квартале почти на 13% превышает обычные значения.

На правом верхнем графике представленные данные с исключенными сезонными колебаниями по периодам (кварталам). В левом нижнем углу представлено процентное отклонение за период сезонности, в правом – остатки за период сезонности.

5 Выбор метода прогнозирования можно осуществить на основе минимальной среднеквадратической ошибки (MSD).