Оценки случайных величин

Различают точечные и интервальные оценки. Точечная оценка некоторого параметра определяется по результатам выборки одним числом. Для того, чтобы точечная оценка была «хорошей» необходимо, чтобы она была состоятельной, несмещенной, эффективной. Задача оценивания параметров и сводится к нахождению таких функций от выборки и , которые могут быть использованы для приближенного определения параметров и . В качестве точечных оценок для и нормально распределенной СВ ( ) принимаются:

 

(1.2)

 

(1.3)

 

Точечные оценки не указывают величины ошибки, которая совершается при замене и их приближенными значениями и . Поэтому иногда выгоднее пользоваться интервальной оценкой, которая определяется двумя числами и – концами интервала, накрывающего оцениваемый параметр с заданной вероятностью (надежностью).

Пусть – точечная оценка параметра . Она тем лучше, чем меньше разность . Тогда в качестве характеристики точности оценки можно взять некоторое такое, что .

Доверительной вероятностью оценки называется вероятность выполнения неравенства . Доверительный интервал – это интервал, который накрывает неизвестный параметр с заданной надежностью . Чем меньше длина доверительного интервала, тем точнее оценка.

При неизвестном доверительный интервал для математического ожидания СВ имеет вид:

 

, (1.4)

 

где величина определяется по таблицам по заданному уровню значимости (либо надежности ) и объему выборки .

Доверительный интервал для задается неравенствами

 

, если , (1.5)

либо

, если . (1.6)

 

Величина определяется по таблице доверительных интервалов для по доверительной вероятности и объему выборки .

Медианой называется вариант, который приходится на середину ряда распределения. При вычислении медианы дискретного ряда рассматриваются два случая: объем совокупности четный и нечетный. В первом случае применяется формула , если ( – объем совокупности). Если , то медиана: .

Модой называется вариант, который наиболее часто встречается. Мода – это вариант, которому соответствует наибольшая частота или частоты.

Эмпирической функцией распределения СВ называют функцию

,

где – число значений меньших, чем ;

– объем выборки.

Эмпирическая функция распределения используется в качестве оценки функции распределения.

Для наглядности данные выборки можно представить графически в виде гистограммы, а также полигона относительных частот. Для построения гистограммы интервал наблюдаемых значений СВ разбивается над подынтервалы равной длины , на каждом из которых строится прямоугольник с высотой , где – число значений СВ из выборки, попадающих в рассматриваемый подынтервал. Ломаная, соединяющая точки пересечения середин подынтервалов с соответствующими высотами , образуют полигон относительных частот.

Если форма гистограммы или полигона относительных частот напоминает кривую Гаусса, то можно выдвинуть гипотезу о нормальном распределении СВ . Для проверки того, что СВ можно использовать следующие характеристики: асимметрию и эксцесс , где .

Для нормального распределения , . По данным выборки объема можно найти точечные оценки и :

 

, , (1.7)

 

где , а также средние квадратичные ошибки и их определения

 

; . (1.8)

 

Гипотеза о нормальности закона распределения СВ выдвигается, если и . В противном случае она отвергается.

После предварительного выбора закона распределения рекомендуется применять строгие критерии согласия.

1.3. Критерий -Пирсона

При проверке гипотезы о нормальном распределения СВ с помощью критерия -Пирсона поступают следующим образом:

1) вычисляют вероятности попадания СВ в подынтервалы , ;

2) вычисляют выборочную статистику

 

; (1.9)

3) сравнивают с квантилем , определяемым по таблицам по заданному уровню значимости и числу степеней свободы , где – число параметров предполагаемого распределения СВ . Если , то считают, что нет оснований для отклонения проверяемой гипотезы. В противном случае гипотеза отклоняется.