Применение теста Стьюдента в процедуре подбора переменных в модели множественной регрессии

Множественная регрессия широко используется в решение проблем спроса, доходности акций, изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. В настоящее время множественная регрессия - один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемые показатели.

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели, включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.

Включение в уравнения множественной регрессии того или иного набора факторов связано, прежде всего, с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию должны отвечать следующим требованиям:

· должны быть количественно измеримы;

· не должны быть интеркоррелированы и, тем более, находиться в точной функциональной связи.

Включаемые во множественную регрессию факторы должны объяснять вариацию независимой переменной. Если строится модель с набором р-факторов, то для нее рассчитывается показатель детерминации R², который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р-факторов. Влияние других, неучтенных в модели факторов, оценивается как 1-R² с соответствующей остаточной дисперсией S².

При дополнительном включении в регрессию фактора (1+р) коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться: R²_p₊₁>= R²_p и S²_р+1=< S²_р

Если же этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемые в анализ фактор х_р+1 не улучшает модель и практически является лишним фактором. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметром регрессии по t –критерию Стьюдента.

Т.о., хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответит на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой – подбирают факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют t-статистики для параметров регрессии.

50. Применение фиктивных переменных при исследовании сезонных колебаний: спецификация модели, экономический смысл параметров при фиктивных переменных.

Сезонные фиктивные переменные

При построении модели регрессии может возникнуть ситуация, когда в неё необходимо включить не только колич-ные, но и кач-ные переменные (например, возраст, образование, пол, расовую принадлежность и др.).

Фиктивной переменной наз-ся атрибутивный или качественный фактор, представленный с помощью определённого цифрового кода.

Метод сезонных фиктивных переменных относится к методам моделирования сезонных компонент временного ряда. Суть данного метода заключается в построении модели регрессии, которая наряду с фактором времени включает сезонные фиктивные переменные.

Модель регрессии, включающая в качестве факторной (факторных) переменных фиктивную переменную называется моделью регрессии с переменной структурой.

Наиболее наглядным примером применения фиктивных переменных является модель регрессии, отражающая проблему разрыва в заработной плате у мужчин и женщин.

Предположим, что на основе собранных данных была построена модель регрессии, отражающая зависимость заработной платы рабочих y от их возраста х: yt=β0+β1xt. (спецификация)

Однако данная модель регрессии не может в полной мере охарактеризовать вариацию результативной переменной. Поэтому в модель необходимо ввести дополнительный фактор, например пол, на основании предположения о том, что у мужчин в среднем заработная плата выше, чем у женщин. В связи с тем, что переменная пола является качественной, её необходимо представить в виде фиктивной переменной следующим образом:

С учётом новой фиктивной переменной модель регрессии примет вид: y=β0+β1x+β2D, где β2 – это коэффициент, который характеризует в среднем разницу в заработной плате у мужчин и женщин.

Пример 2

Рассмотрим модель регрессии, характеризующую зависимость переменной размера заработной платы у от переменной стажа работников х с различным образованием. Качественная переменная «образование» может принимать три значения: среднее, среднее специальное и высшее. Для включения факторной переменной «образование» в модель регрессии, необходимо ввести две новых фиктивных переменных, потому что их количество должно быть на единицу меньше, чем значений качественной переменной.

Следовательно, качественная переменная «образование» может быть представлена в виде:

Модель регрессии, характеризующая зависимость переменной размера заработной платы у от переменной стажа работников х с различным образованием, примет вид: y=β0+β1x+β2D1+ β3D2.