Тема № 10. Множественная линейная регрессия
Задача 1
Анализируется зависимость объема производства продукции предприятиями отрасли черной металлургии от затрат труда и расхода чугуна. Для этого по 20 предприятиям собраны следующие данные: у - объем продукции предприятия в среднем за год (млн тенге.), х1 - среднегодовая списочная численность рабочих предприятия (чел.), х2 - средние затраты чугуна за год (млн т).
Ниже представлены результаты корреляционного анализа этого массива данных.
Матрицы парных коэффициентов корреляции:
для исходных переменных
у | х1 | х2 | |
у | 1,00 | ||
х1 | 0,78 | 1,00 | |
х2 | 0,86 | 0,96 | 1,00 |
для натуральных логарифмов исходных переменных
lny | ln x1 | ln x2 | |
lny | 1,00 | ||
ln x1 | 0,86 | 1,00 | |
ln x2 | 0,9 | 0,69 | 1,00 |
Задание
1. Поясните смысл приведенных выше коэффициентов.
2. Используя эту информацию, опишите ваши предположения относительно:
а) знаков коэффициентов регрессии в уравнениях парной линейной регрессии у по х1 (у = а + bх1) и у по х2 (у=а + bх2);
б) статистической значимости коэффициентов регрессии при переменных х1 и х2 в линейном уравнении множественной регрессии и в уравнении множественной регрессии в форме функции Кобба Дугласа.
3. Определите значения коэффициентов детерминации в уравнениях парной линейной регрессии у= а + bх1 и у = а + bх2. Какое из этих уравнений лучше?
4. Определите частные коэффициенты корреляции для линейного уравнения множественной регрессии.
5. Найдите уравнение множественной линейной регрессии в стандартизованном масштабе и сделайте выводы.
Задача 2
По 25 территориям страны изучается влияние климатических условий на урожайность зерновых у (ц/га). Для этого были отобраны две объясняющие переменные:
х1 - количество осадков в период вегетации (мм); х2 - средняя температура воздуха ( 0С).
Матрица парных коэффициентов корреляции этих показателей имеет следующий вид:
у | х1 | x2 | |
у | 1,0 | ||
х1 | 0,6 | 1,0 | |
х2 | -0,5 | -0,9 | 1,0 |
Зэдание
1. Определите частные коэффициенты корреляции результата с каждым из факторов. Прокомментируйте различие полученных парных и частных коэффициентов корреляции результатов.
2. Исследователь, анализирующий данную зависимость, намерен определить на основе приведенной выше матрицы, какое уравнение регрессии лучше строить:
а) парную линейную регрессию.у на х1
б) парную линейную регрессию.у на х2;
в) множественную линейную регрессию.
Как бы вы ответили на эти вопросы?
3. Постройте уравнение регрессии в стандартизованном масштабе и сделайте вьшоды.
Задача 3
По 30 наблюдениям матрица парных коэффициентов корреляции оказалась следующей:
у | х1 | х2 | х3 | |
у | 1,0 | |||
х1 | 0,3 | 1,0 | ||
х2 | 0,6 | 0,1 | 1,0 | |
х3 | 0,4 | 0,15 | 0,8 | 1,0 |
Зэдание
1. Постройте уравнение регрессии в стандартизованном виде и сделайте выводы.
2. Определите показатель множественной корреляции (нескорректированный и скорректированный).
3.Оцените целесообразность включения переменной х1 в модель после введения в нее переменных х2 и х3.
Задача 4
По 20 предприятиям отрасли были получены следующие результаты регрессионного анализа зависимости объема выпуска продукции у (млн тенге.) от численности занятых на предприятии х1 (чел.) и среднегодовой стоимости основных фондов х2 (млн тенге.):
Коэффициент детерминации | 0,81 |
Множественный коэффициент корреляции | ? |
Уравнение регрессии | ln y = ? +0,48 ln x1 +0,62 ln x2 |
Стандартные ошибки параметров | 2 0,06 ? |
t-критерий для параметров | 1,5 ? 5 |
Задание
1. Напишите уравнение регрессии, характеризующее зависимость у от х1 и х2.
2. Восстановите пропущенные характеристики.
3.С вероятностью 0,95 постройте доверительные интервалы для коэффициентов регрессии.
4.Проанализируйте результаты регрессионного анализа.
Задача 5
По 30 предприятиям отрасли были получены следующие результаты регрессионного анализа зависимости объема выпуска продукции у (млн тенге.) от численности занятых на предприятии х1 (чел.) и среднегодовой стоимости основных фондов х2 (млн тенге):
Коэффициент детерминации | ? |
Множественный коэффициент корреляции | 0,85 |
Уравнение регрессии | y = ? +0,48 x1 +20 x2 |
Стандартные ошибки параметров | 2 0,06 ? |
t-критерий для параметров | 1,5 ? 4 |
Задание
1. Восстановите пропущенные характеристики.
2. С вероятностью 0,95 постройте доверительные интервалы для коэфициентов регрессии.
3. Проанализируйте результаты регрессионного анализа.
Форма проведения: Решение данных задач студентами самостоятельно на местах и при необходимости у доски.
Основная литература: [4, С.90-175], [10], [14]
Дополнительная литература: [20],[22],[23],[25], [32]
1. Понятие об эконометрическом исследовании, его этапы. Виды переменных.
2. Генеральная совокупность и выборка. Репрезентативность выборки.
3. Распределение Стьюдента. Работа с таблицами t-распределения Стьюдента.
4. Корреляция. Корреляционный анализ в Excel .
5. Проверка гипотез о корреляции случайных величин.
6. Парная линейная регрессия. Графическая и аналитическая интерпретации метода наименьших квадратов.
7. Анализ статистической значимости коэффициентов линейной регрессии.
8. Построение линейной регрессии в Excel. Функция ЛИНЕЙН().
9. Множественная линейная регрессия.
10. Понятие коэффициента детерминации.
11. F- статистика. Определение значимости коэффициента детерминации R2