Временные ряды и прогнозирование
Временным рядом называется ряд наблюдаемых значений изучаемого показателя, расположенных в хронологическом порядке или в порядке возрастания времени.
Отдельно взятый временной ряд можно представить как выборочную совокупность из бесконечного ряда значений показателей во времени.
Уровнями временного ряда называются наблюдения
из которых состоит данный ряд.
Временной ряд называется моментным рядом, если уровень временного ряда фиксирует значение изучаемого показателя на определённый момент времени.
Временной ряд называется интервальным рядом, если уровень временного ряда характеризует значение показателя за определённый период времени.
Временной ряд называется производным рядом, если уровни ряда представлены в виде производных величин (средних или относительных показателей).
Исследование данных, представленных в виде временных рядов, преследует две основные цели:
1) характеристика структуры временного ряда;
2) прогнозирование будущих уровней временного ряда на основании прошлых и настоящих уровней.
Достижение поставленных целей возможно с помощью идентификации модели временного ряда.
Идентификацией модели временного ряда называется процесс выявления основных компонент, которые содержит изучаемый временной ряд.
Временные ряды могут содержать два вида компонент – систематическую и случайную составляющие.
Систематическая составляющая временного ряда является результатом воздействия постоянно действующих факторов.
Выделяют три основных систематических компоненты временного ряда:
1) тренд;
2) сезонность;
3) цикличность.
Трендом называется систематическая линейная или нелинейная компонента, изменяющаяся во времени.
Сезонностью называются периодические колебания уровней временного ряда внутри года.
Цикличностью называются периодические колебания, выходящие за рамки одного года. Промежуток времени между двумя соседними вершинами или впадинами в масштабах года определяют как длину цикла.
Систематические составляющие характеризуются тем, что они могут одновременно присутствовать во временном ряду.
Случайной составляющей называется случайный шум или ошибка, которая воздействует на временной ряд нерегулярно.
К основным причинам, по которым возникает случайный шум, относят факторы резкого и внезапного действия, а также действия текущих факторов.
Катастрофическими колебаниями называется случайный шум, в основе возникновения которого лежат факторы резкого и внезапного действия.
Шум, в основе возникновения которого лежит действие текущих факторов, может быть связан также с ошибками наблюдений.
Отдельный уровень временного ряда обозначается как yt. Его можно представить в виде функции от основных компонент временного ряда следующим образом:
yt=f(T,S,C,ε),
где T – это трендовая компонента,
S – это сезонная компонента,
C – это циклическая компонента,
ε – случайный шум.
Существует несколько основных моделей временных рядов, к которым относятся:
1) аддитивная модель временного ряда, в которой компоненты представляют собой слагаемые:
yt=Tt+St+Ct+εt;
2) мультипликативная модель временного ряда, в которой компоненты представляют собой сомножители:
yt=Tt*St*Ct*εt;
3) комбинированная модель временного ряда:
yt=Tt*St*Ct+εt.
Аналитический вид тренда
Метод аналитического выравнивания с помощью функций времени или кривых роста является основным методом представления тренда в аналитическом виде, используемым в эконометрике. Суть данного метода заключается в аппроксимации временного ряда определённой формой регрессионной кривой. При этом наиболее проблематичным является вопрос о выборе функции тренда.
Выбор выравнивающей кривой может осуществляться на основании заранее заданных критериев, к которым относятся:
1) множественный коэффициент детерминации;
2) сумма квадратов отклонений наблюдаемых значений временного ряда от теоретических значений (рассчитанных с помощью функции тренда).
Методом конечных разностей называется метод, позволяющий подобрать подходящую форму кривой. Его применение возможно в том случае, если временной ряд содержит равностоящие друг от друга уровни.
Конечной разностью первого порядка (разностным оператором первого порядка) называется разность между соседними уровнями временного ряда:
Разностным оператором второго порядка (конечной разностью второго порядка) называется разность между соседними разностными операторами первого порядка:
В общем случае разностным оператором i-го порядка называется разность между соседними разностными операторами (i-1)-го порядка:
Если разностные операторы первого порядка постоянны и равны между собой
а разностные операторы второго порядка равны нулю
то тренд изучаемого временного ряда можно аппроксимировать линейной функцией вида y=a+β*t+ε.
Если разностные операторы второго порядка постоянны и равны между собой
а разностные операторы третьего порядка равны нулю
то тренд изучаемого временного ряда можно аппроксимировать параболической функцией второго порядка вида y=a+β1*t+β2*t2..
Следовательно, порядок разностных операторов, являющихся постоянными для данного временного ряда, определяет степень уравнения тренда:
y=∑βj*tj.
Оценки неизвестных коэффициентов уравнения тренда рассчитываются с помощью классического метода наименьших квадратов.
Если тренд временного ряда можно аппроксимировать линейной функцией, то её коэффициенты можно рассчитать с помощью метода моментов. При этом в модель вводится новая переменная времени T, началом координат которой является середина временного ряда. Таким образом, её сумма по всем элементам равняется нулю.
Для временного ряда, количество уровней которого является нечётным, переменная T=0 соответствует середине данного ряда. Выше нулевого уровня проставляются числа -1, -2, -3,…., а ниже данного уровня – числа +1, +2, +3,…
Для временного ряда, количество уровней которого является чётным, числа -1, -2, -3 и т. д. проставляются до середины ряда, а числа +1, +2, +3 – ставятся после середины ряда.
Линейная модель регрессии с учётом новой переменной принимает вид:
yt=a+β*Tt+εt.
Оценки неизвестных коэффициентов данной модели рассчитываются из системы нормальных уравнений:
Решением данной системы будут оценки коэффициентов уравнения тренда:
Метод экстрополяции
В случае когда необходимо определить какие либо элементы за пределами данного ряда может быть использована экстрополяция.
Экстрополяция - это метод определения количественных характеристик для савокупностей и явлений для которых нет данных.
Определяются эти недостающие данные путём распространения на них результатов полученных из наблюдений над аналогичными савокупностями.
Экстрополяция бывает 2-х типов:
1) перспективная
2) ретроспективная
1) Перспективная- это прогнащирование т.е. распространение (экстрополирование) выявленной тенденции имеющегося ряда
2) Ретроспективная – это определение каких то показателей по данному ряду в прошлом.
Рассмотрим способы экстрополяции:
1) Экстрополирование по средствам среднего цепного индекса
2) Экстрополирование по средствам среднего темпа изменения
Ky= yi-1- yi/yi
Tср=
Необходимо для определения среднего темпа изменения исследуемого показателя рассматриваются только 1-й и последний элементы ряда,
а все колебания внутри ряда ювелируются.
Тср=
Множественная регрессия
Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии. При исследовании зависимостей методами множественной регрессии требуется определить аналитическое выражение связи между результативным признаков (Y) и множеством факторных признаков (x1, x2, x3,…xn).
Построение моделей множественной регрессии включает несколько этапов:
· выбор формы связи (уравнения регрессии);
отбор факторных признаков;
· обеспечение достаточного объема совокупности для получения реальных оценок.
Практика построения многофакторных моделей показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:
· линейная;
· степенная;
· показательная;
· параболическая;
· гиперболическая.
Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности.
Немаловажное значение имеет процедура отбора факторов в уравнение. Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия. Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости.
Если при включении нового фактора в модель, коэффициенты регрессии меняют не только свои значения, но и знаки, а множественный коэффициент корреляции не возрастает, то данный факторный признак признается нецелесообразным для включения в модель связи.
Сложность и взаимно переплетение отдельных факторов, обуславливающих исследуемое экономическое явление, могу проявляться в так называемой мультиколлинеарности. Под мультиколлинеарностью понимается тесная зависимость между факторными признаками, включенными в модель. Одним из индикаторов определения мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8.
При наличии линейной связи между результативным и несколькими факторными признака, а также между парой факторных признаков определяется множественный коэффициент корреляции:
Множественный коэффициент корреляции изменяется в пределах от 0 до 1. Чем ближе R к единице свидетельствует о сильной зависимости между признаками.
Метод интерполяции
Это способ определения неизвестных промежуточных значений динамического ряда.
Эти неизвестные значения определяются либо на основе известных смежных значений либо на основе установленной взаимосвязи искомого значения с другими значениями.
Интерполяция заключается в приближенном отражении внутри определённого отрезка времени.
Коэффициент контингенции
Коэффициент ассоциации можно расcчитать по формуле
Нужно иметь в виду, что для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации.