Методические указания к выполнению расчётно–графической работы.

ПОДБОР ЗАКОНА РАСПРЕДЕЛЕНИЯ ПО ОПЫТНЫМ ДАННЫМ И ПРОВЕРКА ЕГО СОГЛАСИЯ ПО КРИТЕРИЯМ И КОЛМОГОРОВА

 

 

Методические указания к расчётно-графической работе

 

Пермь 2009

 

Составитель

 

УДК. 519. 2

 

Подбор закона распределения по опытным данным и проверка его согласия по критериям и Колмогорова: Метод. Указания к расчётно-графической работе / Сост.

Пермь, 2009 19с.

Изложены методы подбора закона распределения случайной величины по опытным данным. Работа снабжена индивидуальными заданиями. В ней подробно рассмотрен ход выполнений этих заданий.

 

Рецензент

Табл.5. Ил.4 Библиор.: 4 назв.

 


Из приложения 3 и 4 выписать свой вариант.

Функция распределения случайной величины используется при определении надёжности станков, долговечности изделий, числа запасных деталей, при контроле качества продукции во многих других случаях.

 

Задание для расчётно-графической работы.

 

I. Из приложения 1 или 2 взять выборку объёма n = 200. Выборку произвести с использованием таблиц случайных чисел из приложении 4 (или каким – либо другим методом, указанным преподавателем). Варианты таблиц случайных чисел даны в приложении 3.

2. По выборке найти статические оценки математического ожидания и среднего математического отклонения ( и S ).

3. Построить гистограмму.

4. Подобрать закон распределения случайной величины (например: нормальный, показательный, равномерный).

5. Проверить согласие закона распределения с опытными данными по критерию при уровне значимости

6. Проверить согласие по критерию Колмогорова при .

7. Теоретическую кривую нанести на гистограмму опытных данных.

 


Методические указания к выполнению расчётно–графической работы.

 

1. Весь интервал, в который попали опытные данные, разбиваем на ряд частичных интервалов. Иногда для определения данных интервала рекомендуется формула

(1)

Начало первого интервала сдвинем от влево. За величину разряда h принимается некоторое удобное число, ближайшее к полученному .

В качестве примера рассмотрим 150 цифр передней оси. Контролируем диаметр. Значения положительных отклонений в микронах от номинального размера ( пример взят из работы / 1 / ) :

 

 

Случайную величину (отклонения от номинального размера) обозначим

Из приведённого примера находим , .

(2)

Возьмём h = 3мк. Левый конец первого интервала возьмём 24,5мк. Из приведённых значений найдём число опытных данных, попавших в каждый частичный интервал.

Полученные данные сведём в таблицу 1.

 

Таблица 1

№ п/п № п/п
24,5 - 27,5 39,5 - 42,5
27,5 - 30,5 42,5 - 45,5
30,5 - 33,5 45,5 - 48,5
33,5 - 36,5 48,5 - 51,5
36,5 - 39,5 51,5 - 54,5

 

 

Составим гистограмму.

Таблица 2

 

По выборке найдём и S:

, (3)

 

, (4)

В случае, если статических данных много, а счётные средства ограниченны, пользуемся частичными интервалами и считаем, что сосредоточенны в середине i – го интервала.

В этом случае имеем

, (5)

 

, (6)

Вычислим значения для нашего примера по формулам (3), (4). Для удобства вычисления составим таблицу 3.

Таблица 3

№ п/п
24,5-27,5
27,5-30,5
30,5-33,5
33,5-36,5
36,5-39,5
39,5-42,5
42,5-45,5
45,5-48,5
48,5-51,5
51,5-54,5
     

 

Получаем:

(30,96; 5,56)

 

2. По виду гистограмм, с учётом , S подбираем закон распределения случайной величины. Износовые отказы часто подчиняются нормальному закону распределения, а случайные – показательному:

а) нормальный закон (рис.1)

x

Рис. 1

, ;

 

б) показательный закон (рис.2),

Рис. 2

, ;

 

в) равномерный закон (рис.3)

 

Рис.3

.

 

В нашем примере (см. табл. 1) имеем гистограмму (см. табл. 2)

Похожую на нормальный закон распределения.

 

3. Важнейшим отделом математической статистики является проверка статистических гипотез.

Под статистическими гипотезами подразумеваются такие гипотезы, которые относятся или к виду, или к отдельным параметрам распределения случайной величины. Например, статистической будет гипотеза – долговечность рассматриваемых деталей подчиняется нормальному закону распределения.

Выдвинутая гипотеза может быть правильной или неправильной и поэтому возникает необходимость её статистической проверки.

Идея проверки статистической гипотезы заключается в следующем: рассматривается случайная величина (различная для разных критериев), распределённая по некоторому закону. Из специальных таблиц находят критической значение (при заданном уровне значимости ), кроме того, находят значение из опытных данных. Если , то выдвинутая гипотеза (например, о нормальном законе распределения) принимается, если , выдвинутая гипотеза отвергается.

Следует заметить, что условие совсем не означает, что выдвинутая гипотеза доказана и является единственно верной; это означает лишь то, что гипотеза не противоречит опытным данным.

Критерии проверки гипотезы о предполагаемом законе распределения называются критериями согласия.

Критерий или Пирсона. Наиболее часто используется критерий .

,

 

где – число интервалов, на которые разбиты исходные опытные данные (в дальнейшем может быть уменьшено в результате объединения исходных интервалов);

- число опытных данных, попавших в - й интервал;

- теоретическое число, попавшее в - й интервал.

,

где – объём выборки.

 

В случае нормального закона

,

где

.

В случае показательного закона

.

 

В случае для равномерного закона распределения

.

 

находится из таблиц распределения , в зависимости от заданного уровня значимости и числа степеней свободы (см. приложение 5).

 

 

Необходимо учесть следующие замечания:

1. Число опытных данных при использовании критерия должно быть большим (критерий справедлив при ). Некоторые авторы полагают, что должно быть порядка нескольких сотен, другие считают, что достаточно иметь и даже .

2. Достаточно большим должно быть не только общее число опытов , но и число наблюдений в отдельных интервалах. Рекомендуется иметь в каждом интервале не менее 5-10 наблюдений. Если в отдельных интервалах очень малы, следует объединить интервалы. Длины интервалов могут быть различными. В соответствии с этим число исходных интервалов должно быть уменьшено.

3. Уровень значимости - вероятность ошибки 1-го рода, т.е. вероятность ошибки отвергнуть выдвинутую гипотезу, когда в действительности она верна. Чаще всего берут = 0,05, но встречаются и другие уровни значимости.

4. Число степеней свободы , где – число интервалов (с учётом объединения см.п.2), - число параметров функции распределения, оцениваемых по выборке.

В частном случае, если предполагаемое распределение нормальное, то по выборке оценивают два параметра , поэтому число степеней свободы . Таким же будет число степеней свободы в случае равномерного закона распределения (оцениваемые параметры а и b). В случае показательного закона распределения по выборке оценивают один параметр, следовательно, в этом случае .

5. Даже если < , т.е. гипотеза о виде закона принимается, следует ближе изучить величины , так как критерии не учитывает знаков отклонений и, следовательно, критерий не отражает именно эту сторону соответствия фактов и теории.

6. Во всех сомнительных случаях следует проявлять осторожность. Если возможно, надо повторить опыт, увеличить число наблюдений, воспользоваться другими критериями согласия и т.д.

 

Рассмотрим конкретный пример (см. табл. 4):

.

Для первого интервала левый конец изменим на , а для последнего интервала правый конец на . Таким образом, первый интервал будет , а последний . Расчёт приведён в табл. 4.

Таблица 4

№ п/п
27,5 2,4 } 8,8   1,64
27,5 30,5 6,4
30,5 33,5 0,26
33,5 36,5 24,4 0,08
      Продолжение таблицы 4
36,5 39,5 31,4 2,8
39,5 42,5 29,5 0,008
42,5 45,5 21,7 2,45
45,5 48,5 11,8 1,49
48,5 51,5 } 4,8 } 7,4 4,23
51,5 2,6
  13,03

Число интервалов с учётом объединения 8.

= 0,05, .

Из таблицы работы / I /ПРИЛОЖЕНИЕ имеем =13,03, =11,1. < .

Следовательно, опытные данные согласуются с нормальным законом распределения. На гистограмму наложим теоретическую кривую, полученную в соответствии с нормальным законом распределения.

 

Критерий Колмогорова.

,

где – объём выборки; . и - теоретическая и эмпирическая функции распределения. Следует иметь в виду, что .

Критерий Колмогорова прост в применении, но его можно применить только в случае, когда полностью известно, т.е. известен не только вид функции распределения, но и входящие в него параметры. Такие случаи на практике практически не встречаются. Обычно параметры определяются из опытных данных, т.е. находят статистические оценки параметров распределения. Критерий Колмогорова применяется и в тех случаях, когда параметры не известны, а получены лишь их статистические оценки. Тогда нужно иметь в виду, что в этом случае рискуем принять рассматриваемую гипотезу, в то время как она плохо согласуется с опытными данными. В связи с этим, уровень значимости будет очень “жёстким” и даже . Для предельного распределения имеются специальные таблицы /2/. Некоторые значения при определённых :

0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,05

0,71 0,77 0,83 0,89 0,97 1,07 1,22 1,36

Применим критерий Колмогорова к выше рассмотренному примеру (см. табл.2). Расчёты согласия по критерию Колмогорова приведены в табл.3.

Таблица 5

№п/п
2,4 6,4 24,4 31,4 29,5 21,7 11,8 4,8 2,6 2,4 8,8 23,8 48,2 79,6 109,1 130,8 142,6 147,4 0,007 0,033 0,120 0,273 0,420 0,613 0,807 0,913 0,987 1,000 0,016 0,059 0,159 0,321 0,531 0,727 0,872 0,950 0,983 1,000 0,009 0,026 0,039 0,048 0,111 0,114 0,065 0,034 0,004

В табл. 3 - , - сумма опытных и теоретических данных меньше .

.

Имеем , следовательно, и по критерию Колмогорова имеем, что опытные данные не согласуются с нормальным законом распределения.