Тема № 10. Множественная линейная регрессия

Задача 1

Анализируется зависимость объема производства продукции предприятиями отрасли черной металлургии от затрат труда и расхода чугуна. Для этого по 20 предприятиям собраны следующие данные: у - объем продукции предприятия в среднем за год (млн тенге.), х1 - среднегодовая списочная численность рабочих предприятия (чел.), х2 - средние затраты чугуна за год (млн т).

Ниже представлены результаты корреляционного анализа этого массива данных.

Матрицы парных коэффициентов корреляции:

для исходных переменных

  у х1 х2
у 1,00    
х1 0,78 1,00  
х2 0,86 0,96 1,00

для натуральных логарифмов исходных переменных

  lny ln x1 ln x2
lny 1,00    
ln x1 0,86 1,00  
ln x2 0,9 0,69 1,00

Задание

1. Поясните смысл приведенных выше коэффициентов.

2. Используя эту информацию, опишите ваши предположения относительно:

а) знаков коэффициентов регрессии в уравнениях парной линейной регрессии у по х1 (у = а + bх1) и у по х2 (у=а + bх2);

б) статистической значимости коэффициентов регрессии при переменных х1 и х2 в линейном уравнении множественной регрессии и в уравнении множественной регрессии в форме функции Кобба Дугласа.

3. Определите значения коэффициентов детерминации в уравнениях парной линейной регрессии у= а + bх1 и у = а + bх2. Какое из этих уравнений лучше?

4. Определите частные коэффициенты корреляции для линейного уравнения множественной регрессии.

5. Найдите уравнение множественной линейной регрессии в стандартизованном масштабе и сделайте выводы.

Задача 2

По 25 территориям страны изучается влияние климатических условий на урожайность зерновых у (ц/га). Для этого были отобраны две объясняющие переменные:

х1 - количество осадков в период вегетации (мм); х2 - средняя температура воздуха ( 0С).

Матрица парных коэффициентов корреляции этих показателей имеет следующий вид:

  у х1 x2
у 1,0    
х1 0,6 1,0  
х2 -0,5 -0,9 1,0

Зэдание

1. Определите частные коэффициенты корреляции результата с каждым из факторов. Прокомментируйте различие полученных парных и частных коэффициентов корреляции результатов.

2. Исследователь, анализирующий данную зависимость, намерен определить на основе приведенной выше матрицы, какое уравнение регрессии лучше строить:

а) парную линейную регрессию.у на х1

б) парную линейную регрессию.у на х2;

в) множественную линейную регрессию.

Как бы вы ответили на эти вопросы?

3. Постройте уравнение регрессии в стандартизованном масштабе и сделайте вьшоды.

Задача 3

По 30 наблюдениям матрица парных коэффициентов корреляции оказалась следующей:

  у х1 х2 х3
у 1,0      
х1 0,3 1,0    
х2 0,6 0,1 1,0  
х3 0,4 0,15 0,8 1,0

Зэдание

1. Постройте уравнение регрессии в стандартизованном виде и сделайте выводы.

2. Определите показатель множественной корреляции (нескорректированный и скорректированный).

3.Оцените целесообразность включения переменной х1 в модель после введения в нее переменных х2 и х3.

Задача 4

По 20 предприятиям отрасли были получены следующие результаты регрессионного анализа зависимости объема выпуска продукции у (млн тенге.) от численности занятых на предприятии х1 (чел.) и среднегодовой стоимости основных фондов х2 (млн тенге.):

Коэффициент детерминации 0,81
Множественный коэффициент корреляции ?
Уравнение регрессии ln y = ? +0,48 ln x1 +0,62 ln x2
Стандартные ошибки параметров 2 0,06 ?
t-критерий для параметров 1,5 ? 5

Задание

1. Напишите уравнение регрессии, характеризующее зависимость у от х1 и х2.

2. Восстановите пропущенные характеристики.

3.С вероятностью 0,95 постройте доверительные интервалы для коэффициентов регрессии.

4.Проанализируйте результаты регрессионного анализа.

Задача 5

По 30 предприятиям отрасли были получены следующие результаты регрессионного анализа зависимости объема выпуска продукции у (млн тенге.) от численности занятых на предприятии х1 (чел.) и среднегодовой стоимости основных фондов х2 (млн тенге):

Коэффициент детерминации ?
Множественный коэффициент корреляции 0,85
Уравнение регрессии y = ? +0,48 x1 +20 x2
Стандартные ошибки параметров 2 0,06 ?
t-критерий для параметров 1,5 ? 4

Задание

1. Восстановите пропущенные характеристики.

2. С вероятностью 0,95 постройте доверительные интервалы для коэфициентов регрессии.

3. Проанализируйте результаты регрессионного анализа.

Форма проведения: Решение данных задач студентами самостоятельно на местах и при необходимости у доски.

Основная литература: [4, С.90-175], [10], [14]

Дополнительная литература: [20],[22],[23],[25], [32]

1. Понятие об эконометрическом исследовании, его этапы. Виды переменных.

2. Генеральная совокупность и выборка. Репрезентативность выборки.

3. Распределение Стьюдента. Работа с таблицами t-распределения Стьюдента.

4. Корреляция. Корреляционный анализ в Excel .

5. Проверка гипотез о корреляции случайных величин.

6. Парная линейная регрессия. Графическая и аналитическая интерпретации метода наименьших квадратов.

7. Анализ статистической значимости коэффициентов линейной регрессии.

8. Построение линейной регрессии в Excel. Функция ЛИНЕЙН().

9. Множественная линейная регрессия.

10. Понятие коэффициента детерминации.

11. F- статистика. Определение значимости коэффициента детерминации R2