Нельзя суммировать влияние нескольких факторов и на уровне корреляции

Так, коэффициент парной корреляции между суммой производства и числом рабочих равен 0,52, а между суммой производства и мощностью двигателей равен 0,3.

Однако это не означает , что оба фактора дают суммарный коэффициент корреляции, равный 0,82.

Пример

Наконец, если коэффициент детерминации между суммой производства и числом рабочих равен 27%, а между суммой производства и мощностью двигателей равен 9%, это не означает , что оба фактора в сумме определяют сумму производства на 36%.

Мультиколлинеарность

Невозможность сложения влияний отдельных факторов связана с эффектом мультиколлинеарности, или влиянием независимых факторов друг на друга.

При этом каждый фактор влияет на результат как непосредственно, так и опосредованно, через связь с другими факторами.

Усложнение модели

Таким образом, совокупное влияние всех независимых факторов на зависимую переменную не может быть представлено как простая сумма нескольких парных регрессий.

Это совокупное влияние находится более сложным методом - методом множественной регрессии .

Модель множественной регрессии

Визуализация множественной связи

Уравнение множественной линейной регрессии

Y = a + b 1 X 1 + b 2 X 2 +…+ b k X k

X 1 , X 2 , … , X k независимые переменные (факторы);

B 1 , b 2 , … , b k соответствующие им коэффициенты регрессии

Коэффициенты регрессии

Смысл коэффициента регрессии в уравнении множественной регрессии состоит в том, что он показывает как в среднем изменится значение результативного признака , если соответствующий факторный признак увеличится на единицу при фиксированных значениях всех остальных факторов.