Методические указания к выполнению расчетно-графической работы
Проверка гипотезы о нормальном распределении генеральной совокупности
1. По данной выборке построить эмпирическое распределение в виде последовательности равноотстоящих вариант и соответствующих им частот, для чего:
а) упорядочить выборку по возрастанию, найти
;
б) весь интервал, в который попали опытные данные, разбить на r частичных интервалов
одинаковой длины. Для определения длин частичных интервалов рекомендуется формула
. (8)
За длину частичного интервала принимается некоторое удобное число, ближайшее к полученному значению
Границы интервалов выбираются так, чтобы результаты измерений не совпали с границами интервалов. Начало первого интервала сдвинуть влево от значения
(например, взять
- 0,5);
в) для каждого частичного интервала
найти
- сумму частот вариант и считать, что
сосредоточено в середине i-го интервала, т.е. взять
.
2. Построить гистограмму частот.
3. Найти выборочную среднюю
и выборочное среднее квадратическое отклонение S по формулам:
(9)
4. Найти теоретические частоты
, попавшие в i - ый интервал, по формуле (3);.
5. Вычислить наблюдаемое значение критерия
по формуле (1);
6. По таблице
- распределения при уровне значимости
=0,05 и числе степеней свободы k найти критическое значение
(приложение 5).
7. Сравнить два значения
и
. Если
, то нулевая гипотеза не отвергается, т.е. в этом случае отклонения от предполагаемого теоретического закона считаются незначительными. Если
>
, то нулевая гипотеза отвергается.
Пример 1 Контролировался диаметр у 150 цапф передней оси, изготовленных на токарном станке. В результате были получены следующие значения положительных отклонений в микронах (мк) от номинального размера 20 мк:
Проверить согласие нормального закона распределения с опытными данными по критерию Пирсона при уровне значимости
.
Решение
1.Случайную величину (отклонения от номинального размера) обозначим 
Из выборки приведённого примера находим:
.
Вычисляем:
.
Возьмём длину частичного интервала 3мк. Левый конец первого интервала возьмём 24,5мк. Из данной выборки найдём число опытных данных, попавших в каждый частичный интервал.
Полученные данные сведём в таблицу 1.
Таблица 1
| i |
|
| № |
|
|
| 24,5 - 27,5 | 39,5 - 42,5 | ||||
| 27,5 - 30,5 | 42,5 - 45,5 | ||||
| 30,5 - 33,5 | 45,5 - 48,5 | ||||
| 33,5 - 36,5 | 48,5 - 51,5 | ||||
| 36,5 - 39,5 | 51,5 - 54,5 |
2. Для каждого частичного интервала найдем
: 
Вычислим значения
и S по формулам (9); расчеты поместим в таблицу 2.
Таблица 2
| i |
|
|
|
|
|
|
| 24,5-27,5 | ||||||
| 27,5-30,5 | ||||||
| 30,5-33,5 | ||||||
| 33,5-36,5 | ||||||
| 36,5-39,5 | ||||||
| 39,5-42,5 | ||||||
| 42,5-45,5 | ||||||
| 45,5-48,5 | ||||||
| 48,5-51,5 | ||||||
| 51,5-54,5 | ||||||
Находим :
.
3. Построим гистограмму частот (рис.4)

Рис.4
По виду гистограммы (рис.4) можно предположить, что исследуемый признак подчиняются нормальному закону распределения.
4. Найдем теоретические частоты
по формуле (3) при n=150,
=40,4, S=5,8:
.
В первом интервале левый конец изменим на
, а в последнем интервале - правый конец на
. Таким образом, первый интервал будет
, а последний
. Значения функции
находятся из таблицы (приложение 7). При этом нужно учесть, что
, и для
>5 значение
=0,5.
Приведем пример расчета значения
:

и так далее.
Расчёты для нахождения критерия
приведёны в таблице 3.
Таблица 3
| i |
|
|
|
| |||||
27,5
27,5 30,5
|
|
| 0,39 | ||||||
| 30,5 33,5 | 0,36 | ||||||||
| 33,5 36,5 | 20,2 | 0,39 | |||||||
| 36,5 39,5 | 27,8 | 2,8 | |||||||
| 39,5 42,5 | 30,6 | 1,21 | |||||||
| 42,5 45,5 | 24,4 | 2,45 | |||||||
| 45,5 48,5 | 15,4 | 1,49 | |||||||
48,5 51,5
51,5
|
|
| 0,00 | ||||||
=3,26
| |||||||||
5. Число интервалов
с учетом объединения частот равно 8. Проверку гипотезы о нормальном распределении проводим при уровне значимости
= 0,05 и числе степеней свободы, равном
Из таблицы ( приложение 5) находим 
В нашем примере
, т.е.
.
Следовательно, опытные данные согласуются с нормальным законом распределения. На гистограмму наложим теоретическую кривую, полученную в соответствии с нормальным законом распределения.
6. Для построения нормальной кривой по опытным данным находим ординаты
(выравнивающие частоты ) по формуле

Значения функции
находим в таблице приложения 6.
Вычислим выравнивающие частоты для нашего примера. Имеем

Результаты вычислений поместим в таблицу 4.
Таблица 4
| i |
|
|
|
|
|
| -2,48 | 0,02 | 1,6 | |||
| -1,96 | 0,05 | 3,9 | |||
| -1,45 | 0,14 | 10,8 | |||
| -0,94 | 0,26 | 20,2 | |||
| -0,41 | 0,37 | 28,7 | |||
| 0,10 | 0,39 | 30,3 | |||
| 0,62 | 0,33 | 25,6 | |||
| 1,14 | 0,21 | 16,3 | |||
| 1,66 | 0,09 | 7,0 | |||
| 2,17 | 0,04 | 3,1 |
В прямоугольной системе координат строим точки
и соединяем их плавной кривой (рис.5). Близость выравнивающих частот к наблюдаемым подтверждает правильность допущения о том, что исследуемый признак распределен нормально.

Рис.5
Пример 2
Эмпирическое распределение выборки объема n=100 приведено в таблице 5.
Используя критерий Пирсона, при уровне значимости 0.05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности Х c эмпирическим распределением выборки .
Таблица 5
| i |
|
| i |
|
|
| 3 - 8 | 23 -28 | ||||
| 8 - 13 | 28 -33 | ||||
| 13 - 18 | 33 -38 | ||||
| 18 - 23 |
Решение
1. Построим гистограмму(рис.6)

Рис.6
2. Для каждого частичного интервала найдем
: 
Вычислим значения
и S по формулам (9); расчеты поместим в таблицу 6.
Таблица 6
| i |
|
|
|
|
|
|
| 3 - 8 | 5,5 | 30,25 | 181,5 | |||
| 8 -13 | 10,5 | 110,25 | ||||
| 13 -18 | 15,5 | 240,25 | 232,5 | 3603,75 | ||
| 18 -23 | 20,5 | 420,25 | ||||
| 23 -28 | 25,5 | 650,25 | ||||
| 28 -33 | 30,5 | 777,25 | ||||
| 33 -38 | 35,5 | 1260,25 | 248,5 | 8821,75 | ||
Находим:
.
3. По виду гистограммы (рис.6) можно предположить, что исследуемый признак подчиняются нормальному закону распределения.
Найдем теоретические частоты
по формуле (3) при n=100;
=20,7; S=7,31:
.
Расчёты для нахождения критерия
приведёны в таблице 7.
Таблица 7
| i |
|
|
|
|
- 8
| 4,09 | 0,89 | ||
| 8 - 13 | 10,60 | 0,64 | ||
| 13 - 18 | 20,88 | 1,66 | ||
| 18 - 23 | 26,60 | 6,75 | ||
| 23 - 28 | 21,96 | 1,62 | ||
| 28 - 33 | 11,22 | 0,92 | ||
33 -
| 4,65 | 1,19 | ||
=13,67
|

4. Число интервалов
равно 7. Проверку гипотезы о нормальном распределении проводим при уровне значимости
= 0,05 и числе степеней свободы, равном
Из таблицы ( приложение 5) находим
.
В нашем примере
, т.е.
>
. Следовательно, опытные данные не согласуются с нормальным законом распределения и гипотеза о нормальном распределении отвергается.
2.3.2 Проверка гипотезы о показательном распределении генеральной совокупности.
Задано эмпирическое распределение непрерывной случайной величины X в виде последовательности интервалов (
) и соответствующих им частот
, причем
(объем выборки). Требуется, используя критерий Пирсона, проверить гипотезу о том, что случайная величина X имеет показательное распределение.
Для того чтобы при уровне значимости проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо:
1. Найти по заданному эмпирическому распределению выборочную среднюю
, приняв в качестве «представителя» i-го интервала его середину
.
2. Принять в качестве оценки параметра показательного распределения величину, обратную выборочной средней:
.
4. Вычислить теоретические частоты по формуле (5).
5. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы
, где
– число интервалов выборки c учетом объединения малочисленных частот.
Пример 3. В результате испытания 200 элементов на длительность работы в часах получено эмпирическое распределение, приведенное в таблице 8. Во второй строке таблицы указаны интервалы времени в часах, в третьей – частоты, т.е. количество элементов, проработавших время в пределах соответствующего интервала.
Таблица 8
| i | ||||||
| 0-5 | 5-10 | 10-15 | 15-20 | 20-25 | 25-30 |
|
Решение.
1. Построим гистограмму частот (рис.7).

Рис. 7
Предполагаемое распределение – показательное.
2. Найдем среднее время работы для всех элементов (в качестве среднего времени работы одного элемента примем середину интервала, которому принадлежит элемент):

3. Найдем оценку параметра предполагаемого показательного распределения:

Таким образом, плотность предполагаемого показательного распределения имеет вид
.
4. Найдем вероятности попадания случайной величины X в каждый из интервалов по формуле
:






5. Найдем теоретические частоты по формуле (5):
, где
- вероятность попадания случайной величины X в i-ый интервал. Получаем:

6. Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Составим расчетную таблицу 9. Для упрощения вычислений объединим интервалы 4, 5, и 6 малочисленных частот в один интервал, получим интервал (15;30).
Объединим также малочисленные частоты (4+2+1=7) и соответствующие им теоретические частоты (6,30+2,32+0,84=9,46).
Таблица 9
|
|
|
|
|
|
| 126,42 | 6,58 | 43,2964 | 0,3425 | ||
| 46,52 | -1,52 | 2,3104 | 0,0497 | ||
| 17,10 | -2,10 | 4,4100 | 0,2579 | ||
| 9,46 | -2,46 | 6,0516 | 0,6397 | ||
|
|
Из таблицы критических точек распределения 2, по уровню значимости =0,05 и числу степеней свободы
находим
=6,0.
Так как
<
, то нет оснований отвергнуть гипотезу о распределении X по показательному закону. Другими словами, данные наблюдений согласуются с этой гипотезой.
- 8