Множественная регрессия, её смысл и значение

Изучение связи между 2-мя, 3-мя и т.д. связанными между собой признаками носит название множественной регрессии:

Этапы построения моделей множественной регрессии

I.Выбор формы связи (уравнения регрессии): наиболее приемлемым является способ перебора различных уравнений. Этот подход реализуется на ЭВМ с помощью специально разраб. Алгоритма.

II.Обеспечение достаточного объема совокупности для получения несмещенных оценок ( точных значений коэффициентов).

Типы моделей:

1)линейная:

2) степенная:

3) показательная:

4) параболическая:

5) гиперболическая:

 

 

Отбор факторов, проблема мультиколлинеарности, выбор гипотетической формы уравнения регрессии.

Важным этапом построения уже выбранного уравнения регрессии является отбор и последовательное включение факторных признаков. Сложность формирования уравнения множ. Регрессии в том, что почти все факторы нах. В зависимости др. от др.

Проблема размерности модели (число необходимых факторов) явл. Одной из основных при построении моделей.

Отбор факторных признаков:

Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации.

В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.

Шаговая регрессия

(шаговый регрессионный анализ)

1). Фактор является незначимым, если его включение в уравнение регрессии только изменяет значение коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения.

2). Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициент регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо, он значим.

3). Если же при включении в модель факторного признака коэффициенты регрессии меняют не только величину, но и знаки, а множественный коэффициент корреляции не возрастает, то данный факторный признак признается нецелесообразным для включения в модель связи (незначим).

Под мультиколлинеарностью понимается тесная зависимость между факторными признаками, включенными в модель.

Наличие мультиколлинеарности между признаками приводит к:

- искажению величины параметров модели, которые имеют тенденцию к завышению;

- изменению смысла экономической интерпретации коэффициентов регрессии;

- осложнению процесса определения наиболее существенных факторных признаков.

Причины возникновения мультиколлинеарности между признаками :

- изучаемые факторные признаки, характеризующие одну и ту же сторону явления или процесса;

- использование в качестве факторных признаков показателей, суммарное значение которых представляет собой постоянную величину;

- факторные признаки, являются составными элементами друг друга;

- факторные признаки, по экономическому смыслу дублируют друг друга.

Этапы решения проблемы мультиколлинеарности :

- - установление наличия мультиколлинеарности;

- - определение причин возникновения мультиколлинеарности;

- - разработка мер по ее устранению.

Одним из индикаторов определения наличия мультиколлинеарности – превышение парных коэф-тов величины 0,8. Необходимо исклюю одну из переменных из модели, при этом какую из переменных оставить, а какую искл. Следует в первую очередь из эк. Соображений.

Если с эк. Точки зрения нельзя отдать предпочтения, то оставляют тот, который имеет больший коэф. Кор-ции. С результатом. В результате число факторов уменьшается в модели и необходимо пересчитать модель и сделать анализ.

Матрица парных коэф-тов корреляции:

 

Матрица коэффициентов парной корреляции
  y x1 x2
y 1,00    
x1 0,95 1,00  
x2 0,65 0,82 1,00