Нелинейные модели регрессии. Классификация. Схема построения

(Елисеева, Кремер, Бигильдеева).

Соотношения между социально-экономическими явлениями не всегда можно выразить линейно, хоть такая модель и проще. Нелинейные модели регрессии позволяют избежать неоправданно больших ошибок, которые могут возникнуть при использовании линейной модели регрессии.

Так, например, нелинейными оказываются производственные функции (зависимости между объемом произведеннойпродукции и основными факторами производства — трудом,капиталом и т. п.), функции спроса (зависимость между спросомна товары или услуги и их ценами или доходом) и другие.

Нелинейные соотношения между экономическими явлениями выражаются с помощью соответствующих нелинейных функций: например, равносторонней гиперболы у = а + b/x + ε, параболы второй степени у = а + b*x + c*x2 + ε.

Различают 2 класса нелинейных регрессий:

1) регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;

2) регрессии, нелинейные по оцениваемым параметрам.

Для первого класса примером могут послужить:

-полиномы разных степеней: у = а + b*x + c*x2+ ε; у = а + b*x + c*x2 + d*x3 + ε;

-равносторонняя гипербола у = а + b/x + ε.

Ко второму классу относятся функции:

-степенная у = а*xb*ε;

-показательная у = а*bx*ε;

-экспоненциальная у = ea + bx*ε.

Нелинейная регрессия по включенным переменным не имеет никаких сложностей для оценки ее параметров. Они определяются, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так, в параболе 2 степени

у = а0 + а1*х + а22 + ε,

заменив переменные х = х1, х2 = х2, получим двухфакторное уравнение линейной регрессии:

у = а0 + а11 + а22 + ε,

для оценки параметров которого используется МНК.

Соответственно для полинома 3 порядка

у = а0 + а1*х + а22 + а33 + ε

при замене х = х1, х2 = х2, х3 = х3 получим трехфакторную модель линейной регрессии

у = а0 + а11 + а22 + а33 + ε,

а для полинома k-го порядка

у = а0 + а11 + а22 + ... + аkk + ε

получим линейную модель множественной регрессии с k объясняющими переменными:

у = а0 + а11 + а22 + ... + аkk + ε.

Т.е. полином любого порядка сводится к линейной регрессии с ее методами оценивания параметров и проверки гипотез. Как показывают исследования, чаще всего используется парабола второй степени., в отдельных случаях - полином 3 порядка. Полиномы более высоких степеней практически не используют, т.к. исследуемая совокупность должна быть однородной (чем выше порядок полинома, тем больше изгибов имеет кривая, тем меньше однородность совокупности по результативному признаку). Парабола 2 степени целесообразна, если характер связи меняется с прямой на обратную или с обратной на прямую.

Для построения парной нелинейной зависимости необходимо выполнить следующую последовательность действий:

1. Собрать данные о переменных регрессии:

(x ,y ),t 1,2,...,n t t = .

2. Построить поле корреляции и выполнить его анализ. Определить вид зависимости (линейная, экспоненциальная, гиперболическая, логарифмическая, степенная или показательная).

3. Определить значения новых вспомогательных переменных

(например, для логарифмической зависимости необходимо рассчитать значения X ln x , t 1,2,...,n t = t = для каждого наблюдения).

4. Рассчитать параметры парной линейной регрессии для новых переменных.

5. Оценить значимость параметров регрессии.

6. Построить доверительные интервалы для параметров регрессии.

7. Вычислить коэффициент детерминации и индекс корреляции.

Замечание. Коэффициент детерминации, описанный выше, можно рассчитывать только в том случае, когда зависимая переменная в результате преобразований не изменилась. Если же в левой части, например, вместо переменной у оказалась переменная ln y, то коэффициент детерминации будет сравнивать не фактические и расчетные значения переменной у, а их логарифмы.

Сравнение коэффициентов детерминации для разных уравнений регрессии (например, для линейного и степенного уравнений регрессии с целью выбора более точного уравнения) будет некорректным. В этом случае вычисляют так называемый quasi-R2 (читается «квази эр квадрат») по формуле, где используются значения исходных, а не преобразованных переменных.

Индекс корреляции ρxy , определяющий тесноту связи, определяется по формуле ρxy = корень из R2. Индекс корреляции изменяется от нуля до единицы (0 ≤ ρxy ≤ 1). Чем ближе его значение к единице, тем теснее связь переменных в предположении, что эта связь описывается выбранной зависимостью. Это позволяет сравнивать уравнения регрессии между собой: чем выше quasi-R2 для уравнения (индекс корреляции), тем выше качество подгонки, тем точнее выбранное уравнение регрессии описывает существующую связь. Важно отметить, что этот способ проверки достаточно формальный и при выборе уравнения в первую очередь надо опираться на предписанные теорией зависимости (если они есть), а также на экономическое содержание построенного уравнения (оно должно соответствовать здравому смыслу, опыту и экономической интуиции).