Методические указания к выполнению расчетно-графической работы
Проверка гипотезы о нормальном распределении генеральной совокупности
1. По данной выборке построить эмпирическое распределение в виде последовательности равноотстоящих вариант и соответствующих им частот, для чего:
а) упорядочить выборку по возрастанию, найти ;
б) весь интервал, в который попали опытные данные, разбить на r частичных интервалов одинаковой длины. Для определения длин частичных интервалов рекомендуется формула
. (8)
За длину частичного интервала принимается некоторое удобное число, ближайшее к полученному значению Границы интервалов выбираются так, чтобы результаты измерений не совпали с границами интервалов. Начало первого интервала сдвинуть влево от значения
(например, взять
- 0,5);
в) для каждого частичного интервала найти
- сумму частот вариант и считать, что
сосредоточено в середине i-го интервала, т.е. взять
.
2. Построить гистограмму частот.
3. Найти выборочную среднюю и выборочное среднее квадратическое отклонение S по формулам:
(9)
4. Найти теоретические частоты , попавшие в i - ый интервал, по формуле (3);.
5. Вычислить наблюдаемое значение критерия по формуле (1);
6. По таблице - распределения при уровне значимости
=0,05 и числе степеней свободы k найти критическое значение
(приложение 5).
7. Сравнить два значения и
. Если
, то нулевая гипотеза не отвергается, т.е. в этом случае отклонения от предполагаемого теоретического закона считаются незначительными. Если
>
, то нулевая гипотеза отвергается.
Пример 1 Контролировался диаметр у 150 цапф передней оси, изготовленных на токарном станке. В результате были получены следующие значения положительных отклонений в микронах (мк) от номинального размера 20 мк:
Проверить согласие нормального закона распределения с опытными данными по критерию Пирсона при уровне значимости .
Решение
1.Случайную величину (отклонения от номинального размера) обозначим
Из выборки приведённого примера находим: .
Вычисляем: .
Возьмём длину частичного интервала 3мк. Левый конец первого интервала возьмём 24,5мк. Из данной выборки найдём число опытных данных, попавших в каждый частичный интервал.
Полученные данные сведём в таблицу 1.
Таблица 1
i | ![]() | ![]() | № | ![]() | ![]() |
24,5 - 27,5 | 39,5 - 42,5 | ||||
27,5 - 30,5 | 42,5 - 45,5 | ||||
30,5 - 33,5 | 45,5 - 48,5 | ||||
33,5 - 36,5 | 48,5 - 51,5 | ||||
36,5 - 39,5 | 51,5 - 54,5 |
2. Для каждого частичного интервала найдем :
Вычислим значения и S по формулам (9); расчеты поместим в таблицу 2.
Таблица 2
i | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
24,5-27,5 | ||||||
27,5-30,5 | ||||||
30,5-33,5 | ||||||
33,5-36,5 | ||||||
36,5-39,5 | ||||||
39,5-42,5 | ||||||
42,5-45,5 | ||||||
45,5-48,5 | ||||||
48,5-51,5 | ||||||
51,5-54,5 | ||||||
Находим :
.
3. Построим гистограмму частот (рис.4)
Рис.4
По виду гистограммы (рис.4) можно предположить, что исследуемый признак подчиняются нормальному закону распределения.
4. Найдем теоретические частоты по формуле (3) при n=150,
=40,4, S=5,8:
.
В первом интервале левый конец изменим на , а в последнем интервале - правый конец на
. Таким образом, первый интервал будет
, а последний
. Значения функции
находятся из таблицы (приложение 7). При этом нужно учесть, что
, и для
>5 значение
=0,5.
Приведем пример расчета значения :
и так далее.
Расчёты для нахождения критерия приведёны в таблице 3.
Таблица 3
i | ![]() | ![]() | ![]() | ![]() | |||||
![]() | ![]() | ![]() | 0,39 | ||||||
30,5 33,5 | 0,36 | ||||||||
33,5 36,5 | 20,2 | 0,39 | |||||||
36,5 39,5 | 27,8 | 2,8 | |||||||
39,5 42,5 | 30,6 | 1,21 | |||||||
42,5 45,5 | 24,4 | 2,45 | |||||||
45,5 48,5 | 15,4 | 1,49 | |||||||
48,5 51,5
51,5 ![]() | ![]() | ![]() | 0,00 | ||||||
![]() | |||||||||
5. Число интервалов с учетом объединения частот равно 8. Проверку гипотезы о нормальном распределении проводим при уровне значимости
= 0,05 и числе степеней свободы, равном
Из таблицы ( приложение 5) находим
В нашем примере , т.е.
.
Следовательно, опытные данные согласуются с нормальным законом распределения. На гистограмму наложим теоретическую кривую, полученную в соответствии с нормальным законом распределения.
6. Для построения нормальной кривой по опытным данным находим ординаты (выравнивающие частоты ) по формуле
Значения функции находим в таблице приложения 6.
Вычислим выравнивающие частоты для нашего примера. Имеем
Результаты вычислений поместим в таблицу 4.
Таблица 4
i | ![]() | ![]() | ![]() | ![]() | ![]() |
-2,48 | 0,02 | 1,6 | |||
-1,96 | 0,05 | 3,9 | |||
-1,45 | 0,14 | 10,8 | |||
-0,94 | 0,26 | 20,2 | |||
-0,41 | 0,37 | 28,7 | |||
0,10 | 0,39 | 30,3 | |||
0,62 | 0,33 | 25,6 | |||
1,14 | 0,21 | 16,3 | |||
1,66 | 0,09 | 7,0 | |||
2,17 | 0,04 | 3,1 |
В прямоугольной системе координат строим точки и соединяем их плавной кривой (рис.5). Близость выравнивающих частот к наблюдаемым подтверждает правильность допущения о том, что исследуемый признак распределен нормально.
Рис.5
Пример 2
Эмпирическое распределение выборки объема n=100 приведено в таблице 5.
Используя критерий Пирсона, при уровне значимости 0.05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности Х c эмпирическим распределением выборки .
Таблица 5
i | ![]() | ![]() | i | ![]() | ![]() |
3 - 8 | 23 -28 | ||||
8 - 13 | 28 -33 | ||||
13 - 18 | 33 -38 | ||||
18 - 23 |
Решение
1. Построим гистограмму(рис.6)
Рис.6
2. Для каждого частичного интервала найдем :
Вычислим значения и S по формулам (9); расчеты поместим в таблицу 6.
Таблица 6
i | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
3 - 8 | 5,5 | 30,25 | 181,5 | |||
8 -13 | 10,5 | 110,25 | ||||
13 -18 | 15,5 | 240,25 | 232,5 | 3603,75 | ||
18 -23 | 20,5 | 420,25 | ||||
23 -28 | 25,5 | 650,25 | ||||
28 -33 | 30,5 | 777,25 | ||||
33 -38 | 35,5 | 1260,25 | 248,5 | 8821,75 | ||
Находим:
.
3. По виду гистограммы (рис.6) можно предположить, что исследуемый признак подчиняются нормальному закону распределения.
Найдем теоретические частоты по формуле (3) при n=100;
=20,7; S=7,31:
.
Расчёты для нахождения критерия приведёны в таблице 7.
Таблица 7
i | ![]() | ![]() | ![]() | ![]() |
![]() | 4,09 | 0,89 | ||
8 - 13 | 10,60 | 0,64 | ||
13 - 18 | 20,88 | 1,66 | ||
18 - 23 | 26,60 | 6,75 | ||
23 - 28 | 21,96 | 1,62 | ||
28 - 33 | 11,22 | 0,92 | ||
33 - ![]() | 4,65 | 1,19 | ||
![]() |
4. Число интервалов равно 7. Проверку гипотезы о нормальном распределении проводим при уровне значимости
= 0,05 и числе степеней свободы, равном
Из таблицы ( приложение 5) находим
.
В нашем примере , т.е.
>
. Следовательно, опытные данные не согласуются с нормальным законом распределения и гипотеза о нормальном распределении отвергается.
2.3.2 Проверка гипотезы о показательном распределении генеральной совокупности.
Задано эмпирическое распределение непрерывной случайной величины X в виде последовательности интервалов ( ) и соответствующих им частот
, причем
(объем выборки). Требуется, используя критерий Пирсона, проверить гипотезу о том, что случайная величина X имеет показательное распределение.
Для того чтобы при уровне значимости проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо:
1. Найти по заданному эмпирическому распределению выборочную среднюю , приняв в качестве «представителя» i-го интервала его середину
.
2. Принять в качестве оценки параметра показательного распределения величину, обратную выборочной средней: .
4. Вычислить теоретические частоты по формуле (5).
5. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы , где
– число интервалов выборки c учетом объединения малочисленных частот.
Пример 3. В результате испытания 200 элементов на длительность работы в часах получено эмпирическое распределение, приведенное в таблице 8. Во второй строке таблицы указаны интервалы времени в часах, в третьей – частоты, т.е. количество элементов, проработавших время в пределах соответствующего интервала.
Таблица 8
i | ||||||
![]() | 0-5 | 5-10 | 10-15 | 15-20 | 20-25 | 25-30 |
![]() |
Решение.
1. Построим гистограмму частот (рис.7).
Рис. 7
Предполагаемое распределение – показательное.
2. Найдем среднее время работы для всех элементов (в качестве среднего времени работы одного элемента примем середину интервала, которому принадлежит элемент):
3. Найдем оценку параметра предполагаемого показательного распределения:
Таким образом, плотность предполагаемого показательного распределения имеет вид
.
4. Найдем вероятности попадания случайной величины X в каждый из интервалов по формуле :
5. Найдем теоретические частоты по формуле (5): , где
- вероятность попадания случайной величины X в i-ый интервал. Получаем:
6. Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Составим расчетную таблицу 9. Для упрощения вычислений объединим интервалы 4, 5, и 6 малочисленных частот в один интервал, получим интервал (15;30).
Объединим также малочисленные частоты (4+2+1=7) и соответствующие им теоретические частоты (6,30+2,32+0,84=9,46).
Таблица 9
![]() | ![]() | ![]() | ![]() | ![]() | ![]() ![]() |
126,42 | 6,58 | 43,2964 | 0,3425 | ||
46,52 | -1,52 | 2,3104 | 0,0497 | ||
17,10 | -2,10 | 4,4100 | 0,2579 | ||
9,46 | -2,46 | 6,0516 | 0,6397 | ||
![]() | ![]() |
Из таблицы критических точек распределения 2, по уровню значимости =0,05 и числу степеней свободы находим
=6,0.
Так как <
, то нет оснований отвергнуть гипотезу о распределении X по показательному закону. Другими словами, данные наблюдений согласуются с этой гипотезой.