Вычисление эмпирических параметров

Числовые характеристики выборки вычисляются по следующим формулам:

- эмпирическое (выборочное) среднее

; (4)

- выборочная дисперсия

, или ; (5)

- стандартное отклонение

, или ; (6)

- размах выборки

; (7)

- эмпирический центральный момент -го порядка

, или ; (8)

- эмпирические коэффициенты асимметрии и эксцесса

, . (9)

Несмещенные оценки коэффициентов асимметрии и эксцесса вычисляются по формулам:

, , (10)

где

, .

Вторая формула (5) дает несмещенную оценку дисперсии , но, несмотря на это, после извлечения квадратного корня (формула (6)) получается смещенная (несколько преуменьшенная) оценка для среднеквадратичного отклонения. Несмещенная оценка получается после введения поправочного коэффициента , зависящего от объема выборки:

, , (11)

где - гамма-функция Эйлера. Использовать эту формулу имеет смысл лишь при малом объеме выборки, поскольку множитель при больших значениях приблизительно равен единице и очень слабо изменяется с ростом : ; ; ; .

Отметим, что оценки математического ожидания и дисперсии и являются несмещенными оценками при произвольных распределениях, оценка стандартного отклонения (11) может быть смещенной при распределениях, отличных от нормального распределения.

 

 

Порядок выполнения задания

  1. Присвойте переменной ORIGIN значение равное единице.
  2. Из файла с именем «Lab1 Nx», где N – номер варианта задания, считайте исходные данные и разместите их в массиве Х.
  3. С помощью встроенной функции length (X) определите объем выборки – .
  4. Определите максимальное и минимальное значения и размах выборки.
  5. Выполните операцию ранжирования выборки.
  6. Задайте (или вычислите) число интервалов группирования данных.
  7. Вычислите характеристики интервалов группированной выборки: , , , .
  8. Определите с помощью встроенной функции hist(x,X) массив значений (вектор) относительных частот.
  9. Постройте гистограмму и полигон относительных частот, используя различные стили графического оформления результатов.
  10. Сравните гистограмму (полигон) с теоретической плотностью вероятностей.
  11. Определите оптимальное значение количества интервалов группированной выборки ; все дальнейшие вычисления проводите при этом значении .
  12. Определите массив (вектор) относительных накопленных частот.
  13. Постройте графики эмпирической функции распределения по исходной и группированной выборке, сравните результаты.
  14. Сравните эмпирическое и теоретическое распределения (изобразив на одном графике эмпирические полигоны частот и указанное в задании распределение).
  15. Вычислите все указанные в задании числовые характеристики выборки с использованием формул (4) – (11) и встроенных функций системы Mathcad. Сравните результаты вычислений.
  16. Используя квантиль распределения Колмогорова, постройте доверительную область для эмпирической функции распределения. Обратите внимание на то, как изменяется «ширина» доверительной области с изменением .
  17. Сформулируйте выводы по проделанной работе.
  18. Сохраните рабочий документ.

 

При определении оптимального значения количества интервалов группированной выборки (пункт 11.) можно воспользоваться приведенной ниже Маткад-программой Gist(X,m) (или аналогичной программой, составленной самостоятельно). Параметры этой программы: X – массив, содержащий числовые значения элементов выборки, m – количество интервалов группировки данных.

 

 

Обратившись к этой программе с различными значениями параметра и построив соответствующие графики, оптимальное значение можно определить визуально, «на глаз». Проделав эту работу, сравните полученное вами оптимальное значение с приведенными выше рекомендациями.