Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

Проверка на гетероскедастичность

Делаем оценку параметров модели МНК

Создадим объект Equation. Для этого вводим команду ls zp_sredn c place, где salary – зависимая переменная, c – константа, и остальные – независимые переменные.

В результате оценки появится окно Equation (рис.3.1)

Рис 3.1

Проанализируем полученную модель.

Из рис3.1 видно, что:

Dop_rab(prob=0.7978<0.8%, следовательно не значимая ошибка)

M_educ2(prob=0.0000<0.01%, следовательно значимая ошибка)

S_d(prob=0.7520<0.8%, следовательно не значимая ошибка)

sex(prob=0.0000<0.01%, следовательно значимая ошибка)

stag(prob=0.8160<0.82%, следовательно не значимая ошибка)

stastus(prob=0.0010<0.01%, следовательно значимая ошибка)

udovl(prob=0.0005<0.01%, следовательно значимая ошибка)

 

Удалим из модели незначимые ошибки(s_d,dop_rab,stag),получим рис3.2

 

 

Рис3.2

 

 

Проанализируем полученную модель.

Заметим, что коэф. Детерминации увеличился.

Из рис3.1 видно, что:

M_educ2(prob=0.0000<0.01%, следовательно значимая ошибка)

sex(prob=0.0000<0.01%, следовательно значимая ошибка)

stastus(prob=0.0001<0.01%, следовательно значимая ошибка)

udovl(prob=0.0005<0.01%, следовательно значимая ошибка)

 

В итоговой модели все коэффициенты при факторах значимы, между факторами нет высокой корреляции. Что позволяет сделать вывод об отсутствии мультиколлинеарности в полученной модели.

 

Построим доверительные интервалы.

Константа:

доверительный интервал для 1% =[16473.3-2318.79*2.58;16473.3+2318.79*2.58] =[10492,37; 22454,23]

доверительный интервал для 5% =[16473.3-2318.79*1,96;16473.3+2318.79*1,96] =[11929.65;21016.95]

доверительный интервал для 10% =[16473.3-2318.79*1,65;16473.3+2318.79*1,65] =[12648.29;20298.31]

Образование:

доверительный интервал для 1%=[1239,422;3000.492]

доверительный интервал для 5%=[1451.024;2788.89]

доверительный интервал для 10% =[1556.824;2683.09]

Пол:

доверительный интервал для 1%=[-7073;-3334.12]

доверительный интервал для 5%=[-6624.32;-3783.44]

доверительный интервал для 10% =[-6399.66;-4008.1]

Тип населенного пункта:

доверительный интервал для 1%=[-2145.62;-481.774]

доверительный интервал для 5%=[-1945.7;-681.693]

доверительный интервал для 10% =[-1845.74;-781.653]

Удовлетворенность материальным положением:

доверительный интервал для 1%=[-1651.52;-246.244]

доверительный интервал для 5%=[-1482.66;-415.095]

доверительный интервал для 10% =[-1398.24;-499.52]

 

 

Проверка на гетероскедастичность.

Для проверки ошибок на гетероскедастичность тестом Уайта в окне Equation выбирается View / Residual Tests / White Heteroskedasticity (no cross terms). Т.к P-значение теста (Prob.) меньше 0,05, то гипотеза о гомоскедастичности отвергается (принимается гетероскедастичность) на уровне значимости 0,05 (рис. 4.1).

 

 

Рис4.1

 

Делаем корреляцию на гетероскедастичность: В окне Equation выбираем Estimate, в появившемся окне выбираем вкладку Options, ставим галочки в нужных полях и выбираем правильную форму записи ошибок.Рис4.2

 

 

Рис4.2.

 

Выводы:

После удаления из модели незначимых ошибок, в уравнении остались переменные образование, пол, удовлетворенность материальным положением, тип населенного пункта.

Сделаем по ним экономическую интерпретацию:

При увеличении числа лет обучения на 1 год, с вероятностью 0,95 уровень заработанной платы будет изменяться не более, чем на 2683,09$ и не менее чем на 1556,82$