Эмпирические и выравнивающие (теоретические) частоты

Рассмотрим случайную величину Х, закон распределения которой неизвестен. Пусть произведено п испытаний, в которых величина Х приняла п1раз значение х1, п2раз – значение х2, ..., пk раз – значение хk, причем . Эмпирическими частотами называют фактически наблюдаемые частоты .

Пусть имеются основания предположить, что изучаемая величина Х распределена по некоторому определенному закону. Чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты наблюдаемых значений, то естьнаходят теоретически частоту каждого из наблюдаемых значений в предположении; что величина Х распределена по предполагаемому закону. Эти частоты в отличие от фактически наблюдаемых эмпирических частот называют выравнивающими или теоретическими частотами. Выравнивающие частоты находят с помощью равенства , где n – объем выборки. Если предполагаемое распределение дискретно, то – вероятность наблюдаемого значения , вычисленная при допущении, что Х имеет предполагаемое дискретное распределение. Если же предполагаемое распределение непрерывно, то – вероятность попадания Х в i–тый частичный интервал, вычисленная при допущении, что Х имеет предполагаемое непрерывное распределение.

 

5. Построение теоретической нормальной кривой по опытным данным.

 

1. Находят выборочное среднее и выборочное среднее квадратическое отклонение .

2. Находят характерные точки нормальной кривой, используя таблицу:

характерные точки х у
вершина кривой
точки перегиба
 
 

 

Здесь n – объем выборки, h – длина частичного интервала.

3. Если требуется построить более точно теоретическую нормальную кривую, то вычисляют дополнительные точки . В качестве берут середину i–того частичного интервала. Ординату вычисляют по формуле , где n – объем выборки, h – длина частичного интервала, – условные варианты, находят по таблице.

4. Строят точки в прямоугольной системе координат и соединяют их плавной линией.

Если на этом же графике построить полигон частот, то близость двух графиков будет наглядно показывать, отражает ли построенная теоретическая нормальная кривая данные наблюдений.

 

Критерий согласия Пирсона

 

Пусть эмпирическое распределение задано в виде последовательности интервалов одинаковой длины h и соответствующих им частот . Требуется, используя критерий Пирсона, проверить нулевую гипотезу о том, что’ генеральная совокупность Х распределена нормально, при конкурирующей гипотезе о том, что генеральная совокупность Х не распределена нормально.

Для того чтобы при уровне значимости проверить гипотезу о нормальном распределении генеральной совокупности, необходимо:

1. Вычислить, например методом произведений, выборочное среднее и выборочное среднее квадратическое отклонение , Причем в качестве вариант берут середину i–того частичного интервала ( , где s – число интервалов эмпирическом распределении).

2. Пронормировать Х, т. е. перейти к случайной величине , и вычислить концы интервалов: , , причем наименьшее значение Z, т. е. z0, полагают равным , а наибольшее, т. е. zs, полагают равным .

3. Вычислить теоретические частоты , где n – объем выборки; – вероятность попадания Х в интервалы , – функция Лапласа.

4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:

а) находят наблюдаемое значение критерия Пирсона ;

б)по таблице критических точек распределения по заданному уровню значимости и числу степеней свободы (s – число интервалов выборки) находят критическую точку правосторонней критической области .

Если , то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности (эмпирические данные согласуются с нормальным распределением). Если , то нулевую гипотезу отвергают (эмпирические данные не согласуются с нормальным распределением).

Замечание. Интервалы, содержащие малочисленные эмпирические частоты ( <5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле следует в качестве s принять число интервалов, оставшихся после объединения интервалов.

Пример.При уровне значимости 0,05 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты:

эмп. частоты
теорет. частоты

 

Решение. Вычислим , для чего составим расчетную таблицу:

-1 -4 -8 -7 0,07 0,38 0,78 0,49 1,07 1,32 0,08 12,07 34,38 66,78 113,49 95,07 24,32 15,08
      373,19

Контроль: :

Вычисления произведены правильно.

Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариант) ; .

По таблице критических точек распределения , по уровню значимости и числу степеней свободы k=5 находим .

Так как - нет оснований отвергнуть нулевую гипотезу. Другими словами, расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.