Множественная линейная регрессия в скалярной и векторной формах
Обобщением модели парной регрессии является модель множественной регрессии. Множественная регрессия – уравнение связи с несколькими независимыми переменными:
,
где – зависимая переменная (результативный признак);
– независимые переменные (факторы).
Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
Чаще всего используются линейные уравнения множественной регрессии:
. (2.1)
Построение модели связано с выбором вида уравнения и отбором факторов модели. Факторы, включаемые в модель, должны удовлетворять требованиям:
1. должны быть количественно измеримы;
2. не должны быть интеркоррелированы;
3. между факторами не должно быть высокой корреляционной связи, т.к. будет сложно определить влияние каждого фактора в отдельности на прибыль.
Для выявления мультиколлинеарных факторов можно использовать корреляционную матрицу :
где – оценки коэффициентов парной корреляции. При этом, если факторы некоррелированы, то , если между факторами линейная связь, то и чем ближе к нулю, тем сильнее мультиколлинеарность. Один из путей устранения мультиколлинеарности – исключение из модели одного или нескольких коллинеарных факторов.
Для оценки параметров уравнения множественной регрессии используют МНК, для чего необходимо решить систему линейных уравнений
Другой вид уравнения множественной регрессии – уравнение регрессии в стандартизованном масштабе:
,
где – стандартизованные переменные;
– стандартизированные коэффициенты регрессии.
Связь коэффициентов множественной регрессии со стандартизованными коэффициентами описывается соотношениями:
.
Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле
.
Для расчета частных коэффициентов эластичности применяется формула
.
На основе уравнения (2.1) могут быть найдены частные уравнения регрессии:
Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:
.
Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:
.
Индекс множественной корреляции для уравнения в стандартизованном масштабе можно записать в виде:
.
Частные коэффициенты (или индексы) корреляции, измеряющие влияние на фактора при неизменном уровне других факторов, можно определить по формуле
.
Частные коэффициенты корреляции изменяются в пределах от –1 до 1.
Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции: .
Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле
,
где – число наблюдений, – число факторов.
Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:
.
Частный -критерий оценивает статистическую значимость присутствия каждого из факторов в уравнении. В общем виде для фактора частный -критерий определится как
.
Оценка значимости коэффициентов уравнения регрессии с помощью t-критерия Стьюдента сводится к вычислению значения
,
где – средняя квадратическая ошибка коэффициента регрессии и определяется по формуле
.
Возможны случаи, когда в модель регрессии необходимо включить факторы, имеющие качественные признаки, например, образование, тип изделия, профессия и т.д.
Чтобы использовать эти переменные им придают численные значения. Такие искусственно сконструированные переменные в эконометрике называются фиктивными или структурными переменными.
Фиктивные переменные могут вводиться как в линейные, так и в нелинейные модели.