Уравнение парной регрессии
При статистическом изучении корреляционных зависимостей решаются две основные задачи:
1) нахождение формы связи между признаками и в виде математической формулы, выражающей эту зависимость;
2) измерение тесноты связи.
Эти задачи являются неразрывными и взаимно дополняющими друг друга задачами корреляционно-регрессионного анализа. Решение данных задач допускается в разной последовательности. В настоящем пособии сначала рассматривается нахождение уравнения регрессии, а затем – методы выявления и измерения тесноты связи.
Определение формы связи называется нахождением уравнения регрессии (уравнения связи).
Регрессия – это зависимость среднего значения случайной величины от одной или нескольких величин. Термин «регрессия» (от лат. regression – отступление, возврат к чему-либо) введен Ф. Гальтоном в 1886 г.
Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: факторным и результативным .
Найти уравнение регрессии – значит по фактическим (эмпирическим) данным математически описать изменения взаимно коррелируемых величин. Уравнение регрессии также называют теоретической линией регрессии – это линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление (основную тенденцию) связи. Теоретическая линия регрессии позволяет оценить среднее значение результативного признака при различных значениях факторного признака . При этом не должны учитываться все остальные факторы, влияющие на признак и не связанные с признаком .
Значения результативного признака, рассчитанные по уравнению регрессии, называются теоретическими . То есть, теоретические значения рассматриваются в виде функции, т.е. =
Аналитическая связь между признаками может описываться следующими уравнениями:
§ прямая:
§ парабола:
§ гипербола: и др.
Считается, что если факторный и результативный признаки изменяются одинаково (примерно в арифметической прогрессии), то это свидетельствует о линейной связи между ними. Если признаки изменяются в разных направлениях, то связь является обратной. В этом случае применяется уравнение гиперболы. А если признаки изменяются в одном направлении, но с разной скоростью, то применяется параболическая или степенная функция.
После выбора типа функции определяют параметры уравнения регрессии. Параметры должны быть такими, чтобы рассчитанные с их помощью теоретические значения результативного признака , минимально бы отличались от фактических значений . То есть, теоретическая линия регрессии должна быть проведена так, чтобы сумма отклонений точек поля корреляции от соответствующих точек теоретической линии равнялась нулю ( ).
Уравнение парной линейной регрессии имеет вид:
,
где: - среднее значение результативного признака при определенном значении факторного признака; - свободный член уравнения (не имеет экономического смысла); - коэффициент регрессии, который показывает, на сколько единиц в среднем изменится результативный признак при изменении факторного признака на единицу его измерения. При такой интерпретации коэффициента регрессии предполагается, что сила воздействия признака на признак постоянна при любых значениях . С геометрической точки зрения коэффициент регрессии характеризует угол наклона лини регрессии к оси абсцисс.
Знак при коэффициенте регрессии показывает направление связи между признаками:
§ при > 0 – связь прямая;
§ при < 0 – связь обратная.
Параметры уравнения регрессии ( , ) определяются с помощью метода наименьших квадратов (МНК), согласно которому сумма квадратов отклонений теоретических значений результативного признака от фактических значений , была бы минимальной:
.
Рассмотрим парную линейную регрессию, так как линейная зависимость является наиболее используемой формой связи между двумя признаками.
Найдя частные производные указанной суммы по и , и, приравняв их нулю, получим систему нормальных уравнений при линейной парной регрессии:
где - объем исследуемой совокупности.
Решение этой системы дает параметры уравнения регрессии. Для нахождения параметров и при линейной зависимости могут использоваться готовые формулы:
;
Однако значения параметров и можно получить иначе. Если в системе нормальных уравнений каждое уравнение разделить на , то получим:
.
Теперь, зная значение , можно определить второй параметр уравнений регрессии:
Если связь выражена параболой, то для отыскания параметров уравнения , и применяется система нормальных уравнений вида:
Решив систему, получим уравнение регрессии вида:
.
Оценка обратной зависимости признаков и может быть осуществлена на основе уравнения гиперболы. Тогда для нахождения параметров уравнения гиперболы применяется система нормальных уравнений вида:
Также коэффициент регрессии можно рассчитать с помощью линейного коэффициент корреляции по формуле:
.
Коэффициент регрессии применяется для определения коэффициента эластичности , который показывает, на сколько процентов изменится в среднем величина результативного признака при изменении факторного признака на 1 %.
Коэффициент эластичности определяется по формуле:
Для большинства форм связи коэффициент эластичности является переменной величиной, т.е. изменяется в соответствии с изменением значений фактора .