Взвешенный метод наименьших квадратов
В некоторых случаях при проведении регрессионного анализа желательно использовать различные веса наблюдений и вычислить оценки коэффициентов регрессии по методу взвешенных наименьших квадратов. Этот метод обычно применяется, когда дисперсия остатков неоднородна при различных значениях независимых переменных. Можно использовать веса, равные единица на дисперсию остатков и вычислить оценки по методу взвешенных наименьших квадратов. (На практике эти дисперсии обычно не известны, однако они часто пропорциональны значениям независимых переменных, и это пропорциональность может быть использована для вычисления подходящих весов наблюдений.)
40.
Гетероскедастичность. Метод Голдфельдта-Квандта.
Рассматривая метод наименьших квадратов (см. предыдущие выпуски рассылки), мы обратили внимание на случаи, когда применение МНК ведет кразличным негативным последствиям. Эти случаи заключаются в невыполнении условий применения МНК, одним из которых является независимость остатков и постоянство их дисперсии. Пример, приведенный на рис. 1 показывает, что прогноз значения показателя
в точке
значительно отличается от истинного значения. Исходя из критерия минимума среднеквадратической ошибки на точках обучающей последовательности, который является базисом МНК, наилучшим приближением экспериментальной зависимости является прямая. В то же время, очевидно, что дисперсии остатков изменяются по некоторому закону (квадратическому или типа квадратного корня).
В общем случае, такое явление приводит к тому, что оценки параметров по МНК будут несмещенными, состоятельными, но неэффективными и формулу для стандартной ошибки оценки адекватно применять нельзя. Напомним, что:
- оценка
параметра
называется несмещенной, если
, где
- математическое ожидание;
- оценка
параметра
называется состоятельной, если
(сходимость по вероятности);
- оценка
параметра
называется эффективной, если она имеет минимальную дисперсию в некотором классе оценок.
Если дисперсия остатков изменяется для каждого наблюдения или группы наблюдений, т.е.
, где, в общем случае,
- неизвестный параметр, а
- известная симметричная положительно определенная матрица, то такое явление называется гетероскедастичностью. Если же
, то имеем гомоскедастичность.
В случае простой однофакторной модели
устранить гетероскедастичность просто. Достаточно левую и правую часть модели поделить на
. Для многофакторной модели такое преобразование значительно усложняется.
Для проверки наличия гетероскедастичности используют четыре метода, в зависимости от природы исходных данных: критерий
, параметрический тест Гольдфельда-Квандта, непараметрический тест Гольдфельда-Квандта, тест Глейсера. Приведем алгоритмы каждого из методов.
Параметрический тест Гольдфельда-Квандта применяется, если количество наблюдений невелико и сделано предположение о том, что дисперсия остатков возрастает пропорционально квадрату одной из независимых переменных, т.е.
.
Шаг 1. Упорядочить наблюдения в соответствии с величиной элементов вектора
, для которого предположительно выполняется вышеприведенное равенство.
Шаг 2. Исходя из соотношения
, предложенного авторами метода, где
- количество элементов
, выбросить
наблюдений, которые находятся в средине вектора.
Шаг 3. Согласно МНК построить две эконометрические модели по двум полученным совокупностям наблюдений размером
, естественно при условии, что
, где
- количество независимых факторов, присутствующих в модели.
Шаг 4. Найти сумму квадратов остатков для первой и второй моделей:
и
.
Шаг 5. Вычислить значение критерия
, который соответствует
- критерию со
степенями свободы.
Таким образом, если
, то гипотеза об отсутствии гетероскедастичности принимается.