Экспериментальный анализ одномерной случайной величины

Пусть имеется набор (выборка) экспериментальных данных x1, x2,…,xN. Обработку этих данных для получения эмпирических характеристик одномерной случайной величины производят в такой последовательности.

1) Построение вариационного ряда Вариационный ряд z1, z2,…,zN получают из исходных данных путем расположения xm (m = 1, 2,…,N) в порядке возрастания от xmin до xmax так, чтобы xmin = z1 £ z2 £…£ zN = xmax.

Пусть, например, имеется 5 наблюдений: x1 = 5; x2 = 2; x3 = 4; x4 =5; x5 =7. Тогда им соответствует вариационный ряд z1 =2 ; z2 = 4; z3 = 5; z4 =5; z5 = 7.

2) Построение диаграммы накопленных частот , являющейся эмпирическим аналогом интегрального закона распределения. Диаграмму строят в соответствии с формулой

= (1.16)

где – число элементов в выборке, для которых значение xj< x. На практике это делается следующим образом:

- на оси абсцисс указывают значения xm или zt;

- значение по оси ординат равно нулю левее точки xmin;

- в точке xmin и далее во всех других точках xm диаграмма имеет скачок, равный ;

- если существует несколько совпадающих значений xm, то в этом месте на диаграмме происходит скачок, равный , где l - число совпадающих точек;

- для величин x > xmax значение диаграммы накопленных частот равно 1. Если N ®¥, то ®F(x)/.

 

3) Построение гистограммы выборки Гистограмма является эмпирическим аналогом функции плотности распределения f(x). Обычно ее строят следующим образом:

- находят предварительное количество квантов (интервалов), на которое должна быть разбита ось Ох. Это количество К определяют с помощью правила Старджесса:

К = 1 + 3,2 , (1.17)

где найденное значение округляют до ближайшего целого числа.

- определяют длину интервала:

Dx = (xmax - xmin) / К. (1.18)

Величину Dx можно несколько округлить для удобства вычислений.

- Середину области изменения выборки (центр распределения) (xmax + xmin) / 2 принимают за центр некоторого интервала, после чего находят границы и окончательное количество указанных интервалов так, чтобы в совокупности они перекрывали всю область от xmin до xmax.

- отсчитывают количество наблюдений Nm попавшее в каждый квант: Nm равно числу членов вариационного ряда, для которых справедливо неравенство

xm £ zt < xm + Dx

Здесь xm и xm + Dx – границы m – го интервала. При использовании формулы (1.19) значения zt попавшие на границу между (m – 1)-м и m-м интервалами, относят к m-му интервалу;

- подсчитывают относительное количество (относительную частоту) наблюдений Nm/N, попавших в данный квант;

- строят гистограмму, представляющую собой ступенчатую кривую, значение которой на m-м интервале (xm, xm + Dx) (m = 1, 2,…,К) постоянно и равно Nm/N, или с учетом условия равно Nm/N) Dx.

4) Определение оценок математического ожидания , дисперсии и среднего квадратического отклонения производят по формулам

= , (1.20)

= , (1.21)

= + . (1.22)

вместо ф формуле (1.21) вводится для получения несмещенной оценки дисперсии.