Нелинейные модели регрессии. Классификация. Схема построения

(Елисеева, Кремер, Бигильдеева).

Соотношения между социально-экономическими явлениями не всегда можно выразить линейно, хоть такая модель и проще. Нелинейные модели регрессии позволяют избежать неоправданно больших ошибок, которые могут возникнуть при использовании линейной модели регрессии.

Так, например, нелинейными оказываются производственные функции (зависимости между объемом произведеннойпродукции и основными факторами производства — трудом,капиталом и т. п.), функции спроса (зависимость между спросомна товары или услуги и их ценами или доходом) и другие.

Нелинейные соотношения между экономическими явлениями выражаются с помощью соответствующих нелинейных функций: например, равносторонней гиперболы у = а + b/x + ε, параболы второй степени у = а + b*x + c*x²+ ε.

Различают 2 класса нелинейных регрессий:

1) регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;

2) регрессии, нелинейные по оцениваемым параметрам.

Для первого класса примером могут послужить:

-полиномы разных степеней: у = а + b*x + c*x²+ ε; у = а + b*x + c*x²+ d*x³ + ε;

-равносторонняя гипербола у = а + b/x + ε.

Ко второму классу относятся функции:

-степенная у = а*x^b*ε;

-показательная у = а*b^x*ε;

-экспоненциальная у = e^a⁺^bx*ε.

Нелинейная регрессия по включенным переменным не имеет никаких сложностей для оценки ее параметров. Они определяются, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так, в параболе 2 степени

у = а₀ + а₁*х + а₂*х² + ε,

заменив переменные х = х₁, х² = х₂, получим двухфакторное уравнение линейной регрессии:

у = а₀ + а₁*х₁ + а₂*х₂ + ε,

для оценки параметров которого используется МНК.

Соответственно для полинома 3 порядка

у = а₀ + а₁*х + а₂*х² + а₃*х³+ ε

при замене х = х₁, х² = х_2, х³ = х₃получим трехфакторную модель линейной регрессии

у = а₀ + а₁*х₁ + а₂*х₂+ а₃*х₃+ ε,

а для полинома k-го порядка

у = а₀ + а₁*х₁ + а₂*х² + ... + а_k*х^k+ ε

получим линейную модель множественной регрессии с k объясняющими переменными:

у = а₀ + а₁*х₁ + а₂*х₂+ ... + а_k*х_k+ ε.

Т.е. полином любого порядка сводится к линейной регрессии с ее методами оценивания параметров и проверки гипотез. Как показывают исследования, чаще всего используется парабола второй степени., в отдельных случаях - полином 3 порядка. Полиномы более высоких степеней практически не используют, т.к. исследуемая совокупность должна быть однородной (чем выше порядок полинома, тем больше изгибов имеет кривая, тем меньше однородность совокупности по результативному признаку). Парабола 2 степени целесообразна, если характер связи меняется с прямой на обратную или с обратной на прямую.

Для построения парной нелинейной зависимости необходимо выполнить следующую последовательность действий:

1. Собрать данные о переменных регрессии:

(x ,y ),t 1,2,...,n t t = .

2. Построить поле корреляции и выполнить его анализ. Определить вид зависимости (линейная, экспоненциальная, гиперболическая, логарифмическая, степенная или показательная).

3. Определить значения новых вспомогательных переменных

(например, для логарифмической зависимости необходимо рассчитать значения X ln x , t 1,2,...,n t = t = для каждого наблюдения).

4. Рассчитать параметры парной линейной регрессии для новых переменных.

5. Оценить значимость параметров регрессии.

6. Построить доверительные интервалы для параметров регрессии.

7. Вычислить коэффициент детерминации и индекс корреляции.

Замечание. Коэффициент детерминации, описанный выше, можно рассчитывать только в том случае, когда зависимая переменная в результате преобразований не изменилась. Если же в левой части, например, вместо переменной у оказалась переменная ln y, то коэффициент детерминации будет сравнивать не фактические и расчетные значения переменной у, а их логарифмы.

Сравнение коэффициентов детерминации для разных уравнений регрессии (например, для линейного и степенного уравнений регрессии с целью выбора более точного уравнения) будет некорректным. В этом случае вычисляют так называемый quasi-R²(читается «квази эр квадрат») по формуле, где используются значения исходных, а не преобразованных переменных.

Индекс корреляции ρ_xy , определяющий тесноту связи, определяется по формуле ρ_xy = корень из R². Индекс корреляции изменяется от нуля до единицы (0 ≤ ρxy ≤ 1). Чем ближе его значение к единице, тем теснее связь переменных в предположении, что эта связь описывается выбранной зависимостью. Это позволяет сравнивать уравнения регрессии между собой: чем выше quasi-R² для уравнения (индекс корреляции), тем выше качество подгонки, тем точнее выбранное уравнение регрессии описывает существующую связь. Важно отметить, что этот способ проверки достаточно формальный и при выборе уравнения в первую очередь надо опираться на предписанные теорией зависимости (если они есть), а также на экономическое содержание построенного уравнения (оно должно соответствовать здравому смыслу, опыту и экономической интуиции).