Модели с фиктивными переменными

⇐ Назад

Уравнения множественной регрессии могут включать в качестве независимых переменных качественные признаки, например: профессия.

Чтобы ввести такие переменные в регрессионную модель их необходимо упорядочить и приводить им те или иные значения, то есть качественные переменные преобразовать в количественные.
Сконструированные переменные принято в эконометрике называть фиктивными переменными. Например включать в модель фактор пол:
r=

Качественные признаки могут приводить к неоднородности исследуемой совокупности, что может быть уточнено при моделировании двумя путями:

1)регрессия строится для каждой кач. отличной группы единич. совокупности

2)общая регрессионная модель строится для совокупности вцелом, в этом случае в регрессионную модель вводятся фиктивные переменные, то есть строится регрессионная модель с переменной структурой, отражающие неоднородность.

Коэффициент регрессии при фиктивной переменной объясняется как среднее изменение зависимой переменной при переходе от одной категории(ж пол) к другой(м пол). При неизменных значениях остальных параметров, на основе t-критерия стъюдента делается вывод о значимости влияния фиктивной переменной и существенности расхождения между категориями.

Гетероскедастичность, гомоскедастичность, автокорреляция остатков. Метод Гольдфельда-Квандта.

В соответствии с третьей предпосылкой метода наименьших квадратов(28билет) требуется, чтобы дисперсия остатков была гомоскедатичной. Это означает что для каждого значения фактора остатки имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедатичность.

Меры по устранению гетероскедастичности

p Увеличение числа наблюдений

p Изменение функциональной формы модели

p Разделение исходной совокупности на качественно-однородные группы и проведение анализа в каждой группе

p Использование фиктивных переменных, учитывающих неоднородность

p Исключение из совокупности единиц, дающих неоднородность

Тесты, используемые для выявления гетероскедастичности

p Гольдфельда-Квандта

p Парка

p Глейзера

p Уайта

p Ранговой корреляции Спирмена

Тест Гольдфельда-Квандта

p Все наблюдения упорядочивают по мере возрастания какого-либо фактора, который, как предполагается, оказывает влияние на возрастание дисперсии остатков.

p Упорядоченную совокупность делят на три группы, причем первая и последняя должны быть равного объема с числом единиц, больших, чем число параметров модели регрессии. Число отобранных единиц обозначим k

p По первой и третьей группе находят параметры уравнений регрессии и остатки по ним.

p Используя данные об остатках моделей первой и третьей группы, рассчитывают фактическое значение F-критерия

df1=df2=k-m-1

При построении регрессионных моделей важно соблюдение 4ой предпосылки МНК – отсутствие автокорреляции остатков,то есть распределение остатоков и независимы. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих(последующих) наблюдений. Коэф корреляции между и где - остатки текущих наблюдений , и - остатки предыдущих наблюдений можно определить как:

что соответствует формуле линейного коэф корреляции.
Отсутствие автокорреляции остатков обеспечивает состоятельность и эффективность оценток коэф регресси.

31. Обобщенный МНК

При нарушении гомоскедастичности и наличии автокорреляции ошибок рекомендуется заменить традиционный МНК обобщенным.

ОМНК применяется к преобразованным данным, и позволяет получать оценки, которые обладают не только свойствами и смещенностью, но и имеют меньшие выборочные дисперсии.

Рассмотрим применение ОМНК для корректировки гетероскедастичности. Предположим, что среднее значение остатков = 0, а дисперсия их пропорциональна величине К₁

-постоянная дисперсия ошибки при соблюдении предпосылки о гомоскедастичности остатков

- коэффициент пропорциональности меняющийся с изменением величины фактора, что и обуславливает неоднородность дисперсии.

При этом предполагается что неизвестна, а в отношении величины К выдвигаются гипотезы.

Для уравнения при модель примет вид:

Иными словами мы перешли от регрессии Y по X мы перешли к регрессии новых переменных по : , тогда дисперсия остатков будет величиной постоянной

Оценка параметров уравнения с преобразованными переменными дается с помощью взвешенного МНК для которого необходимо минимизировать сумму квадратов отклонения вида:

Если преобразованные x и y взять в отклонении от средних уровней, то коэффициент регрессии можно определить, как:

Для двухфакторной модели рассмотреть самостоятельно (с.204)

В эконометрических исследованиях часто выдвигается гипотеза, что остатки пропорциональны значениям факторов

Допустим, что , т.е. K=x_i и , то ОМНК предполагает оценку параметров следующего трансформированного уравнения

Следует иметь ввиду, что новые преобразованные переменные получают новое экономическое содержание и их регрессия имеет иной смысл, чем регрессия по исходным данным.

y – издержки производства

x₁ – объемы производства

x₂– основные производственные фонды

x₃ – численность работников

Трансформированная модель:

y/x₃ – затраты на одного работника

x₁/x

Для его применения необходимо знание формального закона распределения, исследуемой случайной величины.

Алгоритм решения при использовании VVG^

1) Есть исследуемая величина Y с заданным законом распределения f(y) параметры неизвестны, поэтому их нужно найти. В общем случае величину Y рассматривают как многомерную, т.е. состоящую из нескольких одномерных величин:

2) В процессе наблюдения фиксируются значения y₁, y₂, y₃, y₄, y₅, ... , y_n

3) Y-одномерная случайная величина, отдельные значения которой представляют собой числа y₁, y₂, y₃, y₄, y₅, ... , y_n –реализация n случайных величин Y₁, Y₂, Y₃, Y₄, Y₅, ... , Y_n

Параметры закона распределения вектора Y, сотоящего из случайных величин Y₁, Y₂, Y₃, Y₄, Y₅, ... , Y_n представляют собой вектор , состоящий из k параметров

Причем соответствия между случ. Величинами Y и параметром нет. Это отражается в нумерации величин и параметров.

Величины Y₁,... , Y_n могут распределяться с одинаковыми и разными параметрами, при этом одни из параметров совпадут, а другие – нет.

Любая величина Y описывается одним и тем же законом распределения f(Y) причем с одними и теми же параметрами

4) Нахождение параметров регрессии случайной величины Y? Рассматривается как имеющая собственные параметры распредеения, которые могут совпадать или не совпадать с параметрами распределения других Случайных величин

33 Системы регрессионных (независимых) уравнений (каждое уравнение имеет свой набор факторов, они не связаны друг с другом)

из лекции – каждая зависимая переменная У рассматривается, как ф-ция одного и того же фактора х

Данная система решается с помощью обычного МНК

Т.к. фактические значения зависимой переменной отличаются от теоретических на величину случайной ошибки (Е), то в каждом уравнении присутствует Е_i

34 Система рекурсивных уравнений

Если зависимая переменная одного уравнения выступает в виде фактора в другом уравнении, то имеем модель в виде рекурсивных уравнений

Каждое последующее уравнение включает в качестве факторов результаты полученные в предыдущих уравнениях (обычное МНК). Каждое уравнение этой системы может рассматриваться самостоятельно.