Некоторые особенности применения многофакторных регрессионных моделей в эконометрическом анализе.

 

Мультиколлинеарность

В предыдущих разделах были рассмотрены основные вопросы применения регрессионных моделей в эконометрическом анализе.

На практике исследователю нередко приходится сталкиваться с ситуацией, когда полученная им регрессия является «плохой», т.е. t-статистики большинства оценок малы, что свидетельствует о незначимости соответствующих независимых переменных. В то же время F-статистика может быть достаточно большой, что говорит о значимости регрессии в целом. Одна из возможных причин такого явления носит название мультиколлинеарности и возникает при наличии высокой корреляции между факторами.

Одним из условий классической регрессионной модели является предположение о линейной независимости объясняющих переменных. При нарушении этого условия, т.е. когда одна из переменных является линейной комбинацией их других, это называется полной коллинеарностью. В этой ситуации нельзя использовать метод наименьших квадратов (МНК). На практике полная коллинеарность встречается исключительно редко. Гораздо чаще приходится сталкиваться с ситуацией, когда между факторами имеется высокая степень корреляции. Тогда говорят о наличии мультиколлинеарности. В этом случае МНК-оценка (оценка методом наименьших квадратов) формально существует, но обладает «плохими» свойствами.

Мультиколлинеарность может возникать в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания. В частности, так может случиться, когда значения одной независимой переменной являются датированными значениями другой.

Выделим некоторые наиболее характерные признаки мультиколлинеарности.

1. Небольшое изменение исходных данных (например, добавление новых наблюдений) приводит к существенному изменению оценок коэффициентов модели.

2. Оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (высокое значение коэффициента детерминации R2 и соответствующей F-статистики).

3. Оценки коэффициентов имеют неправильные с точки зрения теории знаки или неоправданно большие значения.

Что же делать, если по всем признакам имеется мультиколлинеарность? Однозначного ответа на этот вопрос нет, и среди эконометристов есть разные мнения на этот счет. При столкновении с проблемой мультиколлинеарности может возникнуть естественное желание отбросить «лишние» независимые переменные, которые, возможно, служат ее причиной. Однако следует помнить, что при этом могут возникнуть новые трудности.

Во-первых, не всегда ясно, какие именно переменные являются лишними в указанном смысле. Мультиколлинеарность означает лишь приблизительную линейную зависимость между факторами, но это не всегда выделяет «лишние» переменные.

Во-вторых, во многих ситуациях удаление каких-либо независимых переменных может значительно отразиться на содержательном смысле модели.

И, в-третьих, отбрасывание так называемых существенных переменных, то есть независимых переменных, которые реально влияют на изучаемую зависимую переменную, приводит к смещению коэффициентов модели.

На практике, обычно при обнаружении мультиколлинеарности убирают наименее значимый для анализа фактор, а затем повторяют расчеты.

 

Фиктивные переменные

Регрессионные модели являются достаточно гибким инструментом, позволяющим, в частности, оценивать влияние качественных признаков на изучаемую переменную.

Это достигается введением в число факторов так называемых фиктивных переменных, принимающих, как правило, значения 1 или 0 в зависимости от наличия или отсутствия соответствующего признака в очередном наблюдении. С формальной точки зрения фиктивные переменные ничем не отличаются от других факторов. Наиболее сложный вопрос, возникающий при их использовании, – это правильная интерпретация получаемых оценок.

Как правило, независимые переменные в регрессионных моделях имеют «непрерывные» области изменения (национальный доход, уровень безработицы, размер зарплаты и тому подобное). Однако теория не накладывает никаких ограничений на характер факторов, в частности, некоторые переменные могут принимать всего два значения или, в более общей ситуации, дискретное множество значений.

Необходимость рассматривать такие переменные возникает довольно часто в тех случаях, когда требуется принимать во внимание какой-либо качественный признак. С таким примером мы столкнулись ранее, когда рассматривали модель стоимости жилой площади в Казани. В качестве такого признака рассматривалась «этажность»: необходимо было разделить первый, последний и другие этажи.

Есть и другие примеры. Так при исследовании зависимости зарплаты от различных факторов может возникнуть вопрос, влияет ли на ее размер и, если да, то в какой степени, наличие у работника высшего образования. Точно также можно выяснить в какой степени имеются различия в оплате труда между мужчинами и женщинами. Для решения подобных задач в принципе можно оценивать соответствующие уравнения внутри каждой категории, а затем изучать различия между ними, но введение дискретных или группирующих переменных позволяет определить параметры модели сразу по всем категориям. Фиктивные переменные, несмотря на свою внешнюю простоту, являются весьма гибким инструментом при исследовании влияния качественных признаков.