Метод наибольшего правдоподобия

Рассмотренный выше метод моментов приводит обычно к относительно простым формулам для оценки параметров, однако в ряде случаев эти оценки малоэффективны или вовсе несостоятельны. Например, для применения метода моментов теоретические моменты должны существовать, что не для всех распределений выполняется. Например, у распределения Коши, имеющего плотность

,

все моменты бесконечны.

Поэтому необходимы и другие методы, лишенные отмеченных недостатков.

Метод наибольшего правдоподобия обладает важным достоинством: он всегда приводит к состоятельным оценкам, имеющим наибольшую точность. Этот метод наилучшим образом использует всю информацию о неизвестных параметрах распределения, имеющуюся в выборке. Однако на практике он часто приводит к необходимости решать весьма сложные системы уравнений.

Метод наибольшего правдоподобия был предложен Р.Фишером, одним из основоположников математической статистики и является наиболее обоснованным и проверенным методом, широко используемом в математической статистике.

Случай дискретных распределений .Рассмотрим случай оценки параметра распределения дискретной случайной величины X, вероятности значений которой определяются согласно распределению , где - неизвестный параметр, который нужно оценить по выборке .

Функция

называется функцией правдоподобия. Если число случаев, когда случайная величина X приняла значения равно соответственно , где - размер выборки, то функция правдоподобия

.

Согласно методу наибольшего правдоподобия в качестве оценки неизвестного параметра принимается то значение, при котором функция правдоподобия принимает наибольшее значение для данной выборки. То есть в качестве оценки для берется наиболее вероятное значение для данной выборки.

Это значение находится в результате решения уравнения

.

Практически удобнее находить максимум функции ln(L), тогда соответствующее уравнение примет вид:

 

.

Это уравнение принято называть уравнением правдоподобия. Решение этого уравнения дает максимум функции правдоподобия, если для него выполняется условие

.

Если распределение имеет два пара параметра и , то есть имеет вид , то для оценки этих параметров используются система из двух уравнений правдоподобия:

.

При большем числе параметров число подобных уравнений соответственно увеличивается.

Проиллюстрируем применение метода наибольшего правдоподобия на примерах.

Пример 1.При n-кратном повторении опыта событие А проявилось m раз. Оценим вероятность события А по методу наибольшего правдоподобия. Будем считать, что случайная величина X принимает значение 1, если произошло событие А и 0, если произошло противоположное событие .

Согласно (8.1.1) функция правдоподобия в данном случае имеет вид:

,

где - оцениваемая вероятность.

После логарифмирования получаем, что

.

После дифференцирования по получаем следующее уравнение:

,

после решения которого получаем, что

.

Крышечкой сверху будем отличать оценку параметра от его точного значения.

Пример 2.Рассмотрим случай оценки параметра дискретной случайной величины Х, распределенной по закону Пуассона

Согласно (8.1.1) функция правдоподобия равна

.

После логарифмирования получаем

.

После дифференцирования получаем:

,

Откуда

,

где - статистическая вероятность того, что X=i.

Таким образом, в качестве оценки параметра а распределения Пуассона следует брать статистическое среднее выборки.

Случай непрерывных распределений. Если случайная величина X имеет непрерывную плотность распределения , где - параметр распределения, который нужно оценить по выборке реализаций этой случайной величины , то в этом случае функция правдоподобия

.

Согласно методу наибольшего правдоподобия наилучшей оценкой параметра является значение, для которого функция правдоподобия достигает максимума.

Если функция дифференцируема по , то это значение находится из уравнения

.

Практически удобнее пользоваться логарифмической формой этого уравнения

.

Это уравнение называется уравнением правдоподобия.

Если плотность распределения случайной величины X имеет два параметра и , то есть имеет вид , то оценки наибольшего правдоподобия находятся из системы двух уравнений

К сожалению, эти уравнения не всегда дают явные выражения для оценок параметров и их приходится решать численными методами.

Если область определения плотности зависит от параметров, то максимум функции правдоподобия может достигаться на границе этой области. В этом случае надо анализировать непосредственно функцию правдоподобия .

Если уравнение правдоподобия имеет несколько корней, то надо брать то решение, при котором функция правдоподобия максимальна.

Пример 3.Оценим данным методом параметр показательного распределения случайной величины T по выборке ее реализаций .

В этом случае , а функция правдоподобия

.

Уравнение правдоподобия в этом случае имеет вид:

.

В результате решения этого уравнения получаем, что оценка наибольшего правдоподобия

.

Пример 4.Оценим параметры случайной величины Х, распределенной по нормальному закону с плотностью

по выборке реализаций .

Функция правдоподобия в этом случае равна

,

а уравнения правдоподобия:

Из первого уравнения получаем, что

.

Из второго уравнения получаем, что

.

В данном случае оценки наибольшего правдоподобия совпали с ранее выведенными оценками по методу моментов. Но это не всегда так.