Шаг 4. Построение регрессионных моделей по нелинейным формам связи.

Подобрать наилучшую форму связи между результативным и независимым фактором при помощи построения диаграммы рассеяния.

 

Вызываем команду ВСТАВКА – ДИАГРАММА. Появится меню МАСТЕР ДИАГРАММ шаг 1 из 4 (рис. 2.1).

 

Рис. 2.1. Шаг 1 меню МАСТЕРА ДИАГРАММ

 

Выбираем вид диаграммы: точечная. Нажимаем кнопку ДАЛЕЕ. Появится меню Шаг 2 из 4: выбор диапазона исходных данных (рис. 2.2).

 

Рис. 2.2. Выбор диапазона исходных данных Рис. 2.3. Закладка РЯД меню МАСТЕРА ДИАГРАММ

 

Установим курсор в окошко Диапазон и выделим курсором мыши диапазон исходных данных (см. рис. 2.2). Ряды: в столбцах. Компьютер распознает первый столбец исходных данных как независимую переменную, поэтому перейдем в закладку РЯД и проверим, чтобы Значения X и Значения Y соответствовали данным рабочей таблицы (см. рис. 2.3). Нажимаем кнопку ДАЛЕЕ.

Шаг 3 из 4: параметры вывода. Можно установить различные параметры оформления диаграммы. Кнопка ДАЛЕЕ. Шаг 4 из 4: определяем, где поместить диаграмму. Нажимаем кнопку ГОТОВО. Диаграмма рассеяния для рассматриваемого примера представлена на рис. 2.4.

 

Рис. 2.4. Диаграмма рассеяния

Построим линию тренда. Выделим поле диаграммы. Меню: ДИАГРАММА – ДОБАВИТЬ ЛИНИЮ ТРЕНДА. Появится меню: ЛИНИЯ ТРЕНДА (рис. 2.5). Выберем любой тип линии тренда, кроме типа «Линейная фильтрация». Начнем с линейного. Зайдем на закладку: ПАРАМЕТРЫ (рис. 2.6) и установим флажки: Показывать уравнение на диаграмме,Поместить на диаграмму величину достоверности аппроксимации.

Рис. 2.5. Выбор типа линии тренда   Рис. 2.6. Установка параметров линии тренда

После нажатия кнопки ОК на графике появится линия тренда, ее уравнение и коэффициент детерминации (см. рис. 2.7).

 

Рис. 2.7. Линия тренда

 

Уравнение, которое отражено на диаграмме, должно совпадать с тем уравнением, которое мы построили при помощи АНАЛИЗ ДАННЫХ – РЕГРЕССИЯ при выполнении соответствующего варианта лабораторной работы № 1.

Далее, чтобы подобрать нужный вид линии тренда по коэффициенту детерминации R2, устанавливаем курсор мыши на линии тренда и нажимаем правую клавишу. Появится контекстное меню, из которого нужно выбрать: ФОРМАТ ЛИНИИ ТРЕНДА (см. рис. 2.8). Выберем другой тип линии в меню ЛИНИЯ ТРЕНДА. Например, логарифмическая. Запишем получившееся уравнение и коэффициент детерминации. Затем снова воспользуемся контекстным меню для получения аналогичных данных по полиномиальной 2-й степени, степенной и экспоненциальной линии тренда.

 

Рис. 2.8. Вход в меню «Формат линии тренда»

 

Результаты расчетов для нелинейных форм связи представлены в таблице 2.2. Заметим, что наилучшие характеристики имеет экспоненциальное уравнение.

Таблица 2.2

№ п.п. Уравнение регрессии Примечания
1. Логарифмическое Уравнение удовлетворительного качества, однако хуже экспоненциального.
2. Полиномиальное 2 степени Наибольший R2, однако коэффициент при x статистически незначим.
3. Степенное Уравнение удовлетворительного качества, однако хуже экспоненциального.
4. Экспоненциальное Второй по величине R2, коэффициент при x статистически значим. Наилучшее из всех уравнений.

Шаг 3. Найти прогнозное значение результата по наилучшему из построенных уравнений.

 

Итак, мы выбрали экспоненциальное уравнение (см. табл. 2.2). Выразим y через x в явном виде: . Рассчитаем прогноз: тыс. ед. Значит, если инвестиции будут равны 19,5 тыс. д.е., то объем производства должен составить 61 тыс. 580 ед.

 

Шаг 4.Оформить отчет о проделанной работе.

План отчета.

1.Укажите фамилию, имя, название группы, номер варианта.

2.Запишите линейное уравнение регрессии в формате:

3.Дайте экономическую интерпретацию параметров уравнения.

4.Оцените тесноту линейной зависимости факторов.

5.Охарактеризуйте качество модели.

6.Сделайте вывод о статистической значимости параметров и уравнения в целом.

7.Сделайте общий вывод о качестве уравнения и возможности его использования для прогноза.

8.Рассчитайте прогнозное значение результативного показателя по известному значению независимого фактора.

9.Запишите уравнение парной нелинейной регрессии, которое наилучшим образом описывает зависимость факторов и рассчитайте прогноз результативного показателя.

 

 

ПРИЛОЖЕНИЯ

Приложение А

Протокол регрессионного анализа.

 

Регрессионная статистика

Наименование показателя Принятые наименования Формула
Множественный R Коэффициент множественной корреляции
R-квадрат Коэффициент детерминации R2
Нормированный R-квадрат Скорректированный R2
Стандартная ошибка Среднеквадратическое отклонение от модели
Наблюдения Количество наблюдений n n

 

Дисперсионный анализ

  df SS – сумма квадратов MS – среднее значение F-критерий Фишера Значимость F
Регрессия
Остаток    
Итого      

 

Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение b0
x1 b1
x2 b2

 

Таблица «Регрессионная статистика» включает множественный коэффициент корреляции, коэффициент детерминации, нормированный коэффициент детерминации, стандартная ошибка и количество наблюдений. Столбец df таблицы «Дисперсионный анализ» содержит число независимых переменных, количество степеней свободы, столбец SS – объясненную сумму квадратов, сумму квадратов остатков и общую сумму квадратов результативного фактора, столбец MS -- объясненную сумму квадратов и сумму квадратов остатков на одну степень свободы, столбец F – расчетное значение статистики Фишера. В столбце значимость F расположена вероятность ошибки расчета (если это значение меньше уровня значимости , то Fрасч > Fкр.).

В третьей таблице в столбце Коэффициенты находятся свободный коэффициент и коэффициенты при переменных уравнения регрессии. Каждому коэффициенту соответствует значение t-статистики (одноименный столбец таблицы). P-Значение показывает вероятность ошибки расчета t-статистики, причем если P-Значение меньше уровня значимости , то tрасч > tкр.

 


Приложение Б

Расчет критических значений t и F.

 

Значение tкр можно получить при помощи статистической функции, которая имеет формат СТЬЮДРАСПОБР(< >; <nm – 1>), где α – уровень значимости, по умолчанию α = 0,05; n – число наблюдений; m – количество независимых переменных в модели. Устанавливаем курсор в пустой ячейке. Вызываем команду ВСТАВКА – ФУНКЦИЯ – СТАТИСТИЧЕСКИЕ (рис. 5.1). Выбираем функцию СТЬЮДРАСПОБР и вводим значения вероятности и количества степеней свободы (рис. 5.2).

 

Рис. 5.1. Мастер функций Рис. 5.2. Функция СТЬЮДРАСПОБР

 

Значение Fкр можно получить при помощи статистической функции, которая имеет формат FРАСПОБР(< >; <m>; <nm – 1>), где α – уровень значимости, по умолчанию α = 0,05; n – число наблюдений; m – количество независимых переменных в модели. Вызываем команду ВСТАВКА – ФУНКЦИЯ – СТАТИСТИЧЕСКИЕ – FРАСПОБР (рис. 5.3).

 

Рис. 5.3. Функция FРАСПОБР