Уравнение парной регрессии

 

При статистическом изучении корреляционных зависимостей решаются две основные задачи:

1) нахождение формы связи между признаками и в виде математической формулы, выражающей эту зависимость;

2) измерение тесноты связи.

Эти задачи являются неразрывными и взаимно дополняющими друг друга задачами корреляционно-регрессионного анализа. Решение данных задач допускается в разной последовательности. В настоящем пособии сначала рассматривается нахождение уравнения регрессии, а затем – методы выявления и измерения тесноты связи.

Определение формы связи называется нахождением уравнения регрессии (уравнения связи).

Регрессия – это зависимость среднего значения случайной величины от одной или нескольких величин. Термин «регрессия» (от лат. regression – отступление, возврат к чему-либо) введен Ф. Гальтоном в 1886 г.

Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: факторным и результативным .

Найти уравнение регрессии – значит по фактическим (эмпирическим) данным математически описать изменения взаимно коррелируемых величин. Уравнение регрессии также называют теоретической линией регрессии – это линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление (основную тенденцию) связи. Теоретическая линия регрессии позволяет оценить среднее значение результативного признака при различных значениях факторного признака . При этом не должны учитываться все остальные факторы, влияющие на признак и не связанные с признаком .

Значения результативного признака, рассчитанные по уравнению регрессии, называются теоретическими . То есть, теоретические значения рассматриваются в виде функции, т.е. =

Аналитическая связь между признаками может описываться следующими уравнениями:

§ прямая:

§ парабола:

§ гипербола: и др.

Считается, что если факторный и результативный признаки изменяются одинаково (примерно в арифметической прогрессии), то это свидетельствует о линейной связи между ними. Если признаки изменяются в разных направлениях, то связь является обратной. В этом случае применяется уравнение гиперболы. А если признаки изменяются в одном направлении, но с разной скоростью, то применяется параболическая или степенная функция.

После выбора типа функции определяют параметры уравнения регрессии. Параметры должны быть такими, чтобы рассчитанные с их помощью теоретические значения результативного признака , минимально бы отличались от фактических значений . То есть, теоретическая линия регрессии должна быть проведена так, чтобы сумма отклонений точек поля корреляции от соответствующих точек теоретической линии равнялась нулю ( ).

Уравнение парной линейной регрессии имеет вид:

,

где: - среднее значение результативного признака при определенном значении факторного признака; - свободный член уравнения (не имеет экономического смысла); - коэффициент регрессии, который показывает, на сколько единиц в среднем изменится результативный признак при изменении факторного признака на единицу его измерения. При такой интерпретации коэффициента регрессии предполагается, что сила воздействия признака на признак постоянна при любых значениях . С геометрической точки зрения коэффициент регрессии характеризует угол наклона лини регрессии к оси абсцисс.

Знак при коэффициенте регрессии показывает направление связи между признаками:

§ при > 0 – связь прямая;

§ при < 0 – связь обратная.

Параметры уравнения регрессии ( , ) определяются с помощью метода наименьших квадратов (МНК), согласно которому сумма квадратов отклонений теоретических значений результативного признака от фактических значений , была бы минимальной:

.

Рассмотрим парную линейную регрессию, так как линейная зависимость является наиболее используемой формой связи между двумя признаками.

Найдя частные производные указанной суммы по и , и, приравняв их нулю, получим систему нормальных уравнений при линейной парной регрессии:

где - объем исследуемой совокупности.

Решение этой системы дает параметры уравнения регрессии. Для нахождения параметров и при линейной зависимости могут использоваться готовые формулы:

;

Однако значения параметров и можно получить иначе. Если в системе нормальных уравнений каждое уравнение разделить на , то получим:

.

Теперь, зная значение , можно определить второй параметр уравнений регрессии:

Если связь выражена параболой, то для отыскания параметров уравнения , и применяется система нормальных уравнений вида:

Решив систему, получим уравнение регрессии вида:

.

Оценка обратной зависимости признаков и может быть осуществлена на основе уравнения гиперболы. Тогда для нахождения параметров уравнения гиперболы применяется система нормальных уравнений вида:

Также коэффициент регрессии можно рассчитать с помощью линейного коэффициент корреляции по формуле:

.

Коэффициент регрессии применяется для определения коэффициента эластичности , который показывает, на сколько процентов изменится в среднем величина результативного признака при изменении факторного признака на 1 %.

Коэффициент эластичности определяется по формуле:

Для большинства форм связи коэффициент эластичности является переменной величиной, т.е. изменяется в соответствии с изменением значений фактора .