Стаціонарні часові ряди та їх характеристики

Автокореляційна функція

Важливе значення в аналізі часових рядів мають стаціонарні часові ряди, ймовірнісні властивості яких не змінюються в часі. Стаціонарні часові ряди застосовуються, зокрема, при описуванні випадкових складових аналізованих рядів.

Часовий ряд (t = 1,2 ,..., n) називається строго стаціонарним (або стаціонарним у вузькому сенсі), якщо спільний розподіл ймовірностей n спостережень такий самий, як і n спостережень при будь-яких n, t і τ. Тобто, властивості строго стаціонарних рядів не залежать від моменту t, тобто закон розподілу і його числові характеристики не залежать від t. Отже, математичне сподівання , середнє квадратичне відхилення можуть бути оцінені за спостереженнями (t = 1,2 ,..., n) за формулами:

, (8.1)

. (8.2)

Степінь зв'язку між послідовностями спостережень часового ряду і (зсунутих один до одного на τ одиниць, або, як то кажуть, з лагом τ) може бути визначена за допомогою коефіцієнта кореляції

(8.3)

бо

Оскільки коефіцієнт ρ(τ) вимірює кореляцію між членами одного і того самого ряду, його називають коефіцієнтом автокореляції, а залежність ρ(τ) - автокореляційною функцією. Через стаціонарність часового ряду автокореляційна функція ρ(τ) залежить тільки від лага τ, причому ρ( — τ)= ρ(τ), тобто при вивченні ρ(τ) можна обмежитися розглядом тільки додатних значень τ.

Статистичною оцінкою ρ(τ) є вибірковий коефіцієнт автокореляції , що визначається за формулою коефіцієнта кореляції, в якій , а n замінюється на n-τ:

(8.4)

Функцію , називають вибірковою автокореляційною функцією, а її графік — корелограмою.

При розрахунку , слід пам'ятати, що із збільшенням τ число n-τ пар спостережень зменшується, тому лаг τ повинен бути таким, щоб число n-τ було достатнім для визначення . Зазвичай орієнтуються на співвідношення τ< n/4.

 

◄Приклад 8.1. За даними табл. 8.1 для часового ряду , знайти середнє значення, середнє квадратичне відхилення і коефіцієнти автокореляції (для лагів τ =1;2).

Розв’язання. Середнє значення часового ряду знаходимо за формулою (8.1): (од.).

Дисперсію і середнє квадратичне відхилення можна обчислити за формулою (8.2), але в даному випадку простіше використовувати співвідношення

(од.),

де

Знайдемо коефіцієнт автокореляції часового ряду (для лага τ = 1), тобто коефіцієнт кореляції між послідовностями семи пар спостережень i (t = 1,2,...,7):

 

Обчислюємо необхідні суми:

Тепер за формулою (8.4) коефіцієнт автокореляції

(Домашнє завдання: обчислити коефіцієнт автокореляції часового ряду у(t) для лага τ=2, тобто коефіцієнт кореляції між послідовностями шести пар спостережень і ).►

Знання автокореляційної функції може надати істотну допомогу при підборі моделі часового ряду і статистичній оцінці її параметрів.

 

Аналітичне вирівнювання (згладжування)

часового ряду (виділення невипадкової компоненти)

Одним із найважливіших завдань дослідження економічного часового ряду є виявлення основної тенденції досліджуваного процесу, що виражається невипадковою складовою (трендом). Для вирішення цього завдання спочатку необхідно вибрати вид функції . Найбільш часто використовуються наступні функції:

лінійна 

поліноміальна 

експоненціальна 

логістична 

Гомперца  де 0< r < 1.

Це дуже відповідальний етап дослідження. При виборі

відповідної функції використовують змістовний аналіз (який може встановити характер динаміки процесу), візуальні спостереження (на основі графічного зображення часового ряду). При виборі поліноміальної функції може бути застосований метод послідовних різниць (що полягає в обчисленні різниць першого порядку , другого порядку і так далі, і порядок різниць, при якому вони будуть приблизно однаковими, береться за степінь полінома). З двох функцій перевага зазвичай віддається тій, при якій менше сума квадратів відхилень фактичних даних від розрахованих на основі цих функцій. При інших рівних умовах перевагу слід віддавати простішим функціям.

Для виявлення основної тенденції найчастіше використовується метод найменших квадратів, розглянутий в розділі 4. Значення часового ряду або розглядаються як залежна змінна, а час t — як пояснююча:

(8.5)

де — збурення, що задовольняє основним властивостям регресійного аналізу. За методом найменших квадратів параметри прямої знаходяться з системи нормальних рівнянь, в якій в якості беремо t , а : , а параметри параболи — з системи нормальних рівнянь: .

Враховуючи, що значення змінної t = 1,2...,n утворюють натуральний ряд чисел від 1 до n, суми , , , можна виразити

через число членів ряду n по відомим в математиці формулам:

(8.6)

(8.7)

 

Приклад 8.2За даними табл. 8.1 знайти рівняння невипадкової складової (тренда) для часового ряду , вважаючи тренд лінійним.

Розв’язання. За формулою (8.6):

Далі

Система нормальних рівнянь має вигляд:

Звідки і рівняння тренда (див. рис. 8.1), тобто попит щорічно збільшується в середньому на 25,7 ед.

При розв’язанні задачі можна було б не виписувати систему нормальних рівнянь, а представити рівняння регресії у вигляді де а коефіцієнт регресії знайти по формулі: де

Перевіримо значущість отриманого рівняння тренда по

F-критерию на 5%-му рівні значущості. Обчислимо суми квадратів:

а) обумовлену регресією —

б) загальну —

в) залишкову — .

Знайдемо значення статистики (див. розділ 6): .

Оскільки (див. табл. для F - розподілу), то

рівняння тренда значуще.►

При застосуванні методу найменших квадратів для оцінки параметрів експоненціальною, логістичною функціями або функцією Гомперца виникають складності із розв’язанням системи нормальних рівнянь, тому заздалегідь, до отримання відповідної системи, роблять деякі перетворення цих функцій (наприклад, логарифмують та ін.).

Іншим методом вирівнювання (згладжування) часового ряду, тобто виділення невипадковій складовій, є метод ковзаючих середніх. Він заснований на переході від початкових значень членів ряду до їх середніх значень на інтервалі часу, довжина якого визначена заздалегідь. При цьому сам вибраний інтервал часу «ковзає» уздовж ряду.

Отриманий таким чином ряд ковзаючих середніх веде себе гладше, ніж початковий ряд, завдяки усереднюванню відхилень ряду. Дійсно, якщо індивідуальний розкид значень членів часового ряду біля свого середнього (згладженого) значення характеризується дисперсією , то розкид середніх з членів часового ряду біля того ж значення характеризуватиметься істотно меншою величиною дисперсії, що дорівнює . Для усереднювання можуть бути використані середнє арифметичне (просте і з деякими вагами), медіана та ін.

 

◄Приклад 8.3 Провести згладжування часового ряду за даними табл. 8.1 методом ковзаючих середніх, використовуючи просте середнє арифметичне з інтервалом згладжування m = 3 роки.

Розв’язання. Ковзаючі середні знаходимо по формулі:

(8.8)

коли m = (2р-1) — непарне число; то при m = 3 і р = 1.

Наприклад, при t = 2 за формулою (8.8):

(од.);

при t=3

(од.);

В результаті отримаємо згладжений ряд:

t
225,0 257,0 305,7 329,3 343,3 358,0

На рис. 8.1 цей ряд зображений графічно у вигляді пунктирної лінії.►