Эмпирическая функция распределения

Как известно из теории вероятностей, функция распределения вероятностей случайной величины «X», определяемая соотношением является универсальной формой задания закона распределения, как для дискретных, так и для случайных непрерывных величин.

Поэтому, используя теорему сложения вероятностей и заменяя теоретические вероятности pi на их оценки , мы получаем следующую эмпирическую функцию распределения Fn(x) для случая дискретной исследуемой случайной величины:

  при
1 при
1+2 при
………
при

В случае непрерывной исследуемой величины Х при извлечении выборки для случайного события мы опять имеем классическую схему Бернулли, поэтому теоретическая вероятность события «Аi», определяемая в теории вероятностей как , оценивается относительной частотой попадания точки выборки в i-й класс. Припишем эту вероятность середине i-го класса, т.е значению ,

далее строим эмпирическую функцию так же, как и для случая дискретной случайной величины, в результате мы получим:

  при
1 при
1+2 при
………
при

Полученные таким образом функции являются оценкой теоретической функции распределения F(x); из теоремы Бернулли следует, что Fn(x) сходится по вероятности при объеме выборки n к F(x), т.е. для любого положительного числа  и любого числа -<x<+ .

  при
1/10 при
3/10 при
5/10 при
7/10 при
8/10 при
9/10 при
при

Пример 6.6.1 Результаты проверки 10ти однотипных приборов на длительность работы представлены следующей таблицей.

 

Таблица 6.6.2

 

i(номер прибора)
x1(время работы в часах)

Статическое распределение частот

Таблица 6.6.3

x1
n1
1 1/10 2/10 2/10 2/10 1/10 1/10 1/10

Эмпирическая функция F*(x).

 

Чтобы найти значение F*(x), нужно подсчитать число вариант, меньших х и разделить на общее число вариант:

 

График функций F*(x)

0,9                
0,8                
0,7                
0,6                
0,5                
0,4                
0,3                
0,2                
0,1                
               

0 100 200 300 400 500 600 700 800

Рис. 6.6.1.

Гистограмма

На практике имеет распространение и другое графическое представление выборки, известное под названием гистограммы выборки.

Предварительно выборка подвергается группировке. Для этого весь интервал числовой оси, в который попадают значения выборки , разбивают на несколько частичных интервалов (обычно 10-20) длиною h и находят для каждого частичного интервала ni-сумму частот вариант, попавших в i-тый интервал. Над каждым из интервалов, как на основании, строится прямоугольник высотой ni/h (плотность частоты).