Спектральный (Фурье) анализ

В спектральном анализе исследуются периодические модели данных. Цель анализа - разложить комплексные временные ряды с циклическими компонентами на несколько основных синусоидальных функций с определенной длиной волн. Термин спектральный - своеобразная метафора для описания природы этого анализа. Предположим, Вы изучаете луч белого солнечного света, который, на первый взгляд, кажется хаотически составленным из света с различными длинами волн. Однако, пропуская его через призму, Вы можете отделить волны разной длины или периодов, которые составляют белый свет. Фактически, применяя этот метод, Вы можете теперь распознавать и различать разные источники света. Таким образом, распознавая существенные основные периодические компоненты, Вы узнали что-то об интересующем Вас явлении. В сущности, применение спектрального анализа к временным рядам подобно пропусканию света через призму. В результате успешного анализа можно обнаружить всего несколько повторяющихся циклов различной длины в интересующих Вас временных рядах, которые, на первый взгляд, выглядят как случайный шум.

Наиболее известный пример применения спектрального анализа - циклическая природа солнечных пятен (Шамвэй, 1988 - см. ниже). Оказывается, что активность солнечных пятен имеет 11-ти летний цикл. Другие примеры небесных явлений, изменения погоды, колебания в товарных ценах, экономическая активность и т.д. также часто используются в литературе для демонстрации этого метода. В отличие от АРПСС или метода экспоненциального сглаживания, цель спектрального анализа - распознать сезонные колебания различной длины, в то время как в предшествующих типах анализа, длина сезонных компонент обычно известна (или предполагается) заранее и затем включается в некоторые теоретические модели скользящего среднего или автокорреляции.

Ниже будут рассмотрены основные обозначения и принципы спектрального анализа и кросс-спектрального анализа.

Частота и период

Длина волны функций синуса или косинуса, как правило, выражается числом циклов (периодов) в единицу времени (Частота), часто обозначается греческой буквой ню ( ; в некоторых учебниках также используют f). Например, временной ряд, состоящий из количества писем, обрабатываемых почтой, может иметь 12 циклов в году: первого числа каждого месяца отправляется большое количество корреспонденции (много счетов приходит именно первого числа каждого месяца); затем, к середине месяца, количество корреспонденции уменьшается; и затем вновь возрастает к концу месяца. Поэтому каждый месяц колебания в количестве корреспонденции, обрабатываемой почтовым отделением, будут проходить полный цикл. Таким образом, если единица анализа - один год, то будет равно 12 (поскольку имеется 12 циклов в году). Конечно, могут быть и другие циклы с различными частотами. Например, годичные циклы ( = 1) и, возможно, недельные циклы ( = 52 недели в год).

Общая структура модели

Цель спектрального анализа - разложить ряд на функции синусов и косинусов различных частот, для определения тех, появление которых особенно существенно и значимо. Один из возможных способов сделать это - решить задачу линейной множественной регрессии, где зависимая переменная - наблюдаемый временной ряд, а независимые переменные или регрессоры: функции синусов всех возможных (дискретных) частот. Такая модель линейной множественной регрессии может быть записана как

(для k = 1 до q)

Следующее общее понятие классического гармонического анализа в этом уравнении - (лямбда) - это круговая частота, выраженная в радианах в единицу времени, т.е.

где - константа pi = 3.1416 и .

Здесь важно осознать, что вычислительная задача подгонки функций синусов и косинусов разных длин к данным может быть решена с помощью множественной линейной регрессии. Заметим, что коэффициенты при косинусах и коэффициенты при синусах - это коэффициенты регрессии, показывающие степень, с которой соответствующие функции коррелируют с данными (заметим, что сами синусы и косинусы на различных частотах не коррелированы или, другим языком, ортогональны. Таким образом, мы имеем дело с частным случаем разложения по ортогональным полиномам). Всего существует q различных синусов и косинусов; интуитивно ясно, что число функций синусов и косинусов не может быть больше числа данных в ряде. Не вдаваясь в подробности, отметим, если N - количество данных, то будет N/2+1 функций косинусов и N/2-1 функций синусов. Другими словами, различных синусоидальных волн будет столько же, сколько данных, и вы сможете полностью воспроизвести ряд по основным функциям. (Заметим, если количество данных в ряде нечетно, то последнее наблюдение обычно опускается. Для определения синусоидальной функции нужно иметь, по крайней мере, две точки: высокого и низкого пика).

В итоге, спектральный анализ определяет корреляцию функций синусов и косинусов различной частоты с наблюдаемыми данными. Если найденная корреляция (коэффициент при определенном синусе или косинусе) велика, то можно заключить, что существует строгая периодичность на соответствующей частоте в данных.

Шамвэй предлагает следующий простой пример для объяснения спектрального анализа. Создадим ряд из 16 наблюдений, полученных из уравнения, показанного ниже, а затем посмотрим, каким образом можно извлечь из него информацию. Сначала создадим переменную и определим ее как:

В системе STATISTICA вы можете создать эту переменную, введя формулу как длинную метку переменной. Переменная состоит из двух основных периодичностей: первая с частотой n=0.0625 (или периодом 1/n=16; одно наблюдение составляет 1/16-ю длины полного цикла, или весь цикл содержит каждые 16 наблюдений) и вторая с частотой n=0.2 (или периодом 5). Коэффициент при косинусе (1.0) больше чем коэффициент при синусе (0.75). Итоговая таблица результатов спектрального анализа, вычисленная модулем Временные ряды, показана ниже.

  Спектральный анализ Число наблюд.: 16
t Частота Период Косинус коэфф. Синус коэфф. периодограмма
0.0000 16.00 0.000 0.000 0.000
0.0625 8.00 1.006 0.028 8.095
0.0125 5.33 0.033 0.079 0.059
0.1875 4.00 0.374 0.559 3.617
0.2500 3.20 -0.144 -0.144 0.333
0.3125 2.67 -0.089 -0.060 0.092
0.3750 2.29 -0.075 -0.031 0.053
0.4375 2.00 -0.070 -0.014 0.040
0.5000   -0.068 0.000 0.037

Теперь рассмотрим столбцы таблицы результатов. Ясно, что наибольший коэффициент при косинусах расположен напротив частоты 0.0625. Наибольший коэффициент при синусах соответствует частоте 0.1875. Таким образом, эти две частоты, которые были внесены в данные, отчетливо проявились.