Линейная модель наблюдений имеет вид

Методические указания к выполнению семестрового задания по дисциплине

«ЭКОНОМЕТРИКА»

Для студентов-магистров заочной формы обучения

 

Введение

В соответствии с учебным планом и рабочей программой по курсу «Эконометрика» каждый студент заочной формы обучения должен выполнить в 1 семестре 1 курса семестровую работу. Изучение этой дисциплины предполагает приобретение студентами опыта построения эконометрических моделей, принятия решения о спецификации и идентификации модели, оценки параметров модели, интерпретации результатов, получения прогнозных оценок.

Семестровая работа содержит 5 заданий, объединённых в рамках единой комплексной задачи. Перед выполнением заданий рекомендуется ознакомиться с соответствующими темами эконометрики:

– линейная модель наблюдений;

– оценка существенности параметров линейной регрессии и корреляции;

– нелинейная связь между переменными;

– интервалы прогноза по линейному уравнению регрессии;

– нелинейная регрессия;

– корреляция для нелинейной регрессии;

– средняя ошибка аппроксимации.

В данных методических указаниях в краткой форме приведены основные понятия перечисленных тем, предложен пример выполнения семестровой работы

В конце методических указаний содержатся варианты заданий и основные статистико-математические таблицы, необходимые для решения задач.

1. Однофакторный регрессионно – корреляционный анализ экономической модели

Уравнение связи двух переменных у и х

называется уравнением парной регрессии (однофакторной моделью). Переменную при этом называют результативным признаком (эндогенной переменной), а переменную хфакторным признаком (экзогенной переменной).

Пусть имеется n значений переменных у и х: уi и хi (i = 1, 2 ,…, n). Разместив на плоскости в прямоугольной системе координат точки (хi, уi) с абсциссами хi и ординатами уi , получим диаграмму регрессии (поле корреляции). Эти точки будут образовывать облако рассеяния, вытянутое в некотором направлении. По виду поля корреляции формулируют гипотезу о форме связи.

Различают линейные и нелинейные регрессии.

Линейная модель наблюдений имеет вид

, (i = 1, 2,…, n).

Нелинейные регрессии делятся на два класса:

– регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам. Например, полиномы разных степеней:

,

,

равносторонние гиперболы

;

– регрессии нелинейные по оцениваемым параметрам. Например,

степенная функция ,

показательная функция ,

экспоненциальная функция .

Построение уравнения регрессии сопровождается оценкой его параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК).

Согласно МНК, среди всех возможных значений параметров a и b, претендующих на роль оценок параметров а и b, следует выбрать такую пару a, b, для которой

.

Иначе говоря, выбирается такая пара параметров a, b, для которой сумма квадратов оказывается наименьшей.

Для линейных и приводимых к линейным нелинейных уравнений, заданное условие приводит к системе нормальных уравнений

,

.

решая которую, имеем

, ,

где

– среднее значение последовательности х1, х2,…, хn,

– среднее значение последовательности у1, у2,…, уn,

выборочная дисперсия,

выборочная ковариация.

 

Для любой точки (хi, уi) на диаграмме рассеяния можно записать

,

где – ордината точки линии регрессии (модели), имеющей абсциссу хi.

Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной.

Возведем обе части последнего представления в квадрат и просуммируем левые и правые части полученных для каждого из i равенств соответственно, получим

.

Рассмотрев сумму более подробно, можно показать, что она в силу системы нормальных уравнений равна нулю.

Тогда

(1)

общая сумма квадратов отклонений TSS сумма квадратов отклонений, объясненная регрессией ESS остаточная сумма квадратов отклонений RSS

Выражение (1) представляет собой разложение полной суммы квадратов на сумму квадратов, объясненную моделью, и остаточную сумму квадратов.

Долю дисперсии, объясняемую регрессией в общей дисперсии результативного признака у, характеризует коэффициент (индекс) детерминации

.

Этот коэффициент изменяется в пределах от 0 (при , т.е. RSS = TSS) до 1 (при RSS = 0). Таким образом,

.

Значение тем выше, чем больше доля объясненной моделью суммы квадратов ESS по отношению к полной сумме квадратов TSS.

Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии ( )

,

где , – средние квадратические ошибки выборки величин х и у,

и индекс корреляции – для нелинейной регрессии ( )

.

Чем ближе значение коэффициента (или индекса) корреляции к единице, тем теснее корреляционная связь.

Заметим, что коэффициент детерминации есть квадрат коэффициента или индекса корреляции.

Средний коэффициент эластичности для рассматриваемой парной модели регрессии рассчитывается по формуле

и показывает, на сколько процентов в среднем по совокупности изменится результативный признак у от своей средней величины при изменении факторного признака х на один процент.

Бета–коэффициент показывает, на какую часть величины своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднего квадратического отклонения и задается формулой

.

После того, как построено уравнение регрессии, необходимо провести оценку значимости как уравнения в целом, так и отдельных его параметров. Оценка значимости уравнения регрессии часто делается с помощью F – критерия Фишера. При этом выдвигается нулевая гипотеза Н0 о том, что коэффициент регрессии равен нулю (b = 0) и тем самым предполагается, что фактор х не оказывает влияния на результат у.

Существует равенство между числом степеней свободы общей и факторной с остаточной суммами квадратов. Имеем два соответствующих друг другу равенства

,

n – 1 = 1 + (n –2).

Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или дисперсию D на одну степень свободы

, , .

Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим F – критерий

.

Разработаны таблицы (см. таблицы в конце пособия) критических значений F – критерия при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Вычисленное значение F – критерия признается достоверным (отличным от единицы), если оно больше табличного (Fфакт>Fтабл,). В этом случае нулевая гипотеза Но об отсутствии связи признаков отвергается.

Если же его величина окажется меньше табличной (Fфакт<Fтабл,), то вероятность нулевой гипотезы Но выше заданного уровня значимости g (например g = 0,05) и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым, Но не отклоняется.

Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (табл. 1).

Таблица 1

  Источники вариации Число степеней свободы Сумма квадратов отклонений Дисперсия на одну степень свободы F – отношение
  факт таблич. при a=0,05
Общая n–1    
Объясненная    
Остаточная n–2    

 

В линейной регрессии обычно оценивается не только уравнение в целом, но и отдельные его параметры. С этой целью по каждому из параметров определяется его стандартная ошибка: mb, ma.

Стандартная ошибка коэффициента регрессии определяется по формуле

,

где – остаточная дисперсия на одну степень свободы

.

Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение t – критерия Стьюдента , которое затем сравнивается с табличным значением (см. таблицу в конце пособия) при определенном уровне значимости g и числе степеней свободы (n – 2).

Можно показать справедливость равенства .

Если фактическое значение t – критерия превышает табличное, то гипотезу о существенности коэффициента можно отклонить.

Границы доверительного интервала коэффициента регрессии b определяются как .

Стандартная ошибка параметра a определяется по формуле

.

Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии. Вычисляется t – критерий: , его величина сравнивается с табличным значением при (n –2) степенях свободы и заданном уровне значимости g.

Границы доверительного интервала параметра a определяются как .

Предельная ошибка D каждого показателя имеет вид:

, .

Значимость линейного коэффициента корреляции проверяется по величине ошибки коэффициента корреляции:

.

При этом, – фактическое значение t – критерия Стьюдента.

Данная формула свидетельствует о том, что в парной линейной регрессии , и . Таким образом, проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности уравнения регрессии.

Если значение значительно превышает табличное значение при заданном уровне значимости g, то коэффициент корреляции существенно отличен от нуля, и построенная модель является достоверной.

Рассмотренная оценка коэффициента корреляции рекомендуется к применению при большом числе наблюдений и если r не близок к +1 или –1.

Фактические значения результативного признака у отличаются от теоретических значений , рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе теоретические значения подходят к эмпирическим данным, лучше качество модели.

Величина отклонений фактических и расчетных значений результативного признака по каждому наблюдению представляет ошибку аппроксимации. Их число соответствует объему совокупности. Отклонения несравнимы между собой. Так, если для одного наблюдения , а для другого оно равно 10, то это не означает, что во втором случае модель дает вдвое худший результат. Для сравнения используются величины отклонений, выраженные в процентах к фактическим значениям.

Чтобы иметь общее представление о качестве модели, из относительных отклонений по каждому наблюдению определяют среднюю ошибку аппроксимациисреднее отклонение расчетных значений от фактических:

.

Допустимый предел значений – не более 8–10%.

Прогнозное значение ур определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения хр.

Средняя стандартная ошибка прогноза определяется по формуле:

.

Границы доверительного интервала прогноза определяются как , где – ошибка прогноза.