Вычисление эмпирических параметров
Числовые характеристики выборки вычисляются по следующим формулам:
- эмпирическое (выборочное) среднее
; (4)
- выборочная дисперсия
, или
; (5)
- стандартное отклонение
, или
; (6)
- размах выборки
; (7)
- эмпирический центральный момент -го порядка
, или
; (8)
- эмпирические коэффициенты асимметрии и эксцесса
,
. (9)
Несмещенные оценки коэффициентов асимметрии и эксцесса вычисляются по формулам:
,
, (10)
где
,
.
Вторая формула (5) дает несмещенную оценку дисперсии , но, несмотря на это, после извлечения квадратного корня (формула (6)) получается смещенная (несколько преуменьшенная) оценка для среднеквадратичного отклонения. Несмещенная оценка
получается после введения поправочного коэффициента
, зависящего от объема выборки:
,
, (11)
где - гамма-функция Эйлера. Использовать эту формулу имеет смысл лишь при малом объеме выборки, поскольку множитель
при больших значениях
приблизительно равен единице и очень слабо изменяется с ростом
:
;
;
;
.
Отметим, что оценки математического ожидания и дисперсии и
являются несмещенными оценками при произвольных распределениях, оценка стандартного отклонения (11) может быть смещенной при распределениях, отличных от нормального распределения.
Порядок выполнения задания
- Присвойте переменной ORIGIN значение равное единице.
- Из файла с именем «Lab1 Nx», где N – номер варианта задания, считайте исходные данные и разместите их в массиве Х.
- С помощью встроенной функции length (X) определите объем выборки –
.
- Определите максимальное и минимальное значения и размах выборки.
- Выполните операцию ранжирования выборки.
- Задайте (или вычислите) число
интервалов группирования данных.
- Вычислите характеристики интервалов группированной выборки:
,
,
,
.
- Определите с помощью встроенной функции hist(x,X) массив значений (вектор) относительных частот.
- Постройте гистограмму и полигон относительных частот, используя различные стили графического оформления результатов.
- Сравните гистограмму (полигон) с теоретической плотностью вероятностей.
- Определите оптимальное значение количества интервалов группированной выборки
; все дальнейшие вычисления проводите при этом значении
.
- Определите массив (вектор) относительных накопленных частот.
- Постройте графики эмпирической функции распределения по исходной и группированной выборке, сравните результаты.
- Сравните эмпирическое и теоретическое распределения (изобразив на одном графике эмпирические полигоны частот и указанное в задании распределение).
- Вычислите все указанные в задании числовые характеристики выборки с использованием формул (4) – (11) и встроенных функций системы Mathcad. Сравните результаты вычислений.
- Используя квантиль
распределения Колмогорова, постройте доверительную область для эмпирической функции распределения. Обратите внимание на то, как изменяется «ширина» доверительной области с изменением
.
- Сформулируйте выводы по проделанной работе.
- Сохраните рабочий документ.
При определении оптимального значения количества интервалов группированной выборки (пункт 11.) можно воспользоваться приведенной ниже Маткад-программой Gist(X,m) (или аналогичной программой, составленной самостоятельно). Параметры этой программы: X – массив, содержащий числовые значения элементов выборки, m – количество интервалов группировки данных.
Обратившись к этой программе с различными значениями параметра и построив соответствующие графики, оптимальное значение
можно определить визуально, «на глаз». Проделав эту работу, сравните полученное вами оптимальное значение с приведенными выше рекомендациями.