Статистические характеристики оценок параметров парной линейной регрессии

Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.

Для каждого вида проверяемых гипотез разработаны специальные критерии, среди которых чаще всего используют - критерий нормального распределения и распределения Стьюдента, -критерий Фишера, распределения Пирсона («хи-квадрат») и другие.

Для построения статистического критерия, позволяющего проверить некоторую гипотезу, необходимо следующее:

Сформулировать проверяемую гипотезу . Наряду с проверяемой гипотезой формулируется также конкурирующая гипотеза (альтернативная);

выбрать уровень значимости , контролирующий допустимую вероятность ошибки первого рода;

определить область допустимых значений и так называемую критическую область;

принять то или иное решение на основе сравнения фактического и критического значений критерия.

Критерий Фишера в парной регрессии

С помощью критерия Фишера оценивают качество регрессионной модели в целом и по параметрам. Для применения критерия Фишера мы должны располагать исходными данными не менее 8 значений фактора (признака).

Для этого выполняется сравнение полученного значения F и табличного F значения. F-критерия Фишера. F фактический определяется из отношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

где n - число наблюдений;

m - число параметров при факторе х.

F табличный - это максимальное значение критерия под влиянием случайных факторов при текущих степенях свободы и уровне значимости а.

Уровень значимости а - вероятность не принять гипотезу при условии, что она верна. Как правило а принимается равной 0,05 или 0,01.

Если Fтабл > Fфакт то признается статистическая незначимость модели, ненадежность уравнения регрессии.

Табличное значение критерия Фишера вычисляют следующим образом:

Определяют k1, которое равно количеству факторов (Х). Например, в однофакторной модели (модели парной регрессии) k1=1, в двухфакторной k=2.

Определяют k2, которое определяется по формуле n - m - 1, где n - число наблюдений, m - количество факторов. Например, в однофакторной модели k2 = n - 2.

На пересечении столбца k1 и строки k2 находят значение критерия Фишера

Для нахождения табличного значения критерия Стьюдента определяют число степеней свободы, которое определяется по формуле n - m - 1 и находят его значение при определенном уровне значимости (0,10, 0,05, 0,01).

 

Критериий Стьюдента

Для оценки статистической значимости модели по параметрам рассчитывают t-критерии Стьюдента. Для применения критерия Стьюдента мы должны располагать исходными данными не менее 2-3 значений фактора (признака).

Оценка значимости модели с помощью критерия Стьюдента проводится путем сравнения их значений с величиной случайной ошибки:

Случайные ошибки коэффициентов линейной регрессии и коэффициента корреляции определяются по формулам:

Сравнивая фактическое и табличное значения t-статистики и принимается или отвергается гипотеза о значимости модели по параметрам.

Зависимость между критерием Фишера и значением t-статистики Стьюдента определяется так

Как и в случае с оценкой значимости уравнения модели в целом, модель считается ненадежной если tтабл > tфакт.

Статистические критерии должны подтверждать друг друга, а не противоечить.



Теорема Гаусса-Маркова.

Доказано, что для получения по МНК наилучших результатов (при этом оценки bi обладают свойствами состоятельности, несмещенности и эффективности) необходимовыполнение ряда предпосылок относительно случайного отклонения