Критерии исключения грубых погрешностей

 

При однократных измерениях обнаружить промах не представляется возможным. Для уменьшения вероятности появления промахов измерения проводят два-три раза и за результат принимают среднее арифметическое полученных отсчетов. При многократных измерениях для обнаружения промахов используют статистические критерии, предварительно определив, какому виду распределения соответствует результат измерений.

Вопрос о том, содержит ли результат наблюдений грубую погрешность, решается общими методами проверки статистических гипотез. Проверяемая гипотеза состоит в утверждении, что результат наблюдения х, не содержит грубой погрешности, т.е. является одним из значений измеряемой величины. Пользуясь определенными статистическими критериями, пытаются опровергнуть выдвинутую гипотезу. Если это удается, то результат наблюдений рассматривают как содержащий грубую погрешность и его исключают.

Для выявления грубых погрешностей задаются вероятностью q (уровнем значимости) того, что сомнительный результат действительно мог иметь место в данной совокупности результатов измерений.

Критерий "трех сигм" применяется для результатов измерений, распределенных по нормальному закону. По этому критерию считается, что результат, возникающий с вероятностью q < 0,003, маловероятен и его можно считать промахом, если |х̅ -хi| > 3Sx , где Sx — оценка СКО измерений. Величины х и Sx вычисляют без учета экстремальных значений xi. Данный критерий надежен при числе измерений n > 20... 50.

Это правило обычно считается слишком жестким, поэтому рекомендуется [4] назначать границу цензурирования в зависимости от объема выборки: при

6 < n < 100 она равна 4Sx; при 100 < n < 1000 - 4,5Sx; при 1000 < n < 10000 - 5Sx. Данное правило также применимо только для нормального закона.

В общем случае границы цензурирования trpSx выборки зависят не только от объема n, но и от вида распределения. Назначая ту или иную границу, необходимо оценить уровень значимости q, т.е. вероятность исключения какой-либо части отсчетов, принадлежащих обрабатываемой выборке. В [4] приводится выражение для приближенного расчета коэффициента trp при уровне значимости q < l/(n + 1):

где e — эксцесс распределения. Данные выражения применимы для:

• кругловершинных двухмодальных распределений с e = 1,5,..., 3, являющихся композицией дискретного двузначного и нормального распределений;

• островершинных двухмодальных распределений с e = 1,5,..., 6, являющихся композицией дискретного двузначного распределения и распределения Лапласа;

• композиций равномерного и экспоненциальных распределений с показателем степени a = 1/2 при e = 1,8,...,6;

• экспоненциальных распределений с e = 1,5,...,6.

Критерий Романовского применяется, если число измерений n < 20. При этом вычисляется отношение |(х̅ - xi)/SX| = b и сравнивается с критерием bт, выбранным по табл. 7.1. Если b ³ bт, то результат хi считается промахом и отбрасывается.

 

Пример 7.1. При диагностировании топливной системы автомобиля результаты пяти измерений расхода топлива составили: 22, 24, 26, 28, 30 л на 100 км. Последний результат вызывает сомнение. Проверить по критерию Романовского, не является ли он промахом.

Найдем среднее арифметическое значение расхода топлива и его СКО без учета последнего результата, т.е. для четырех измерений. Они соответственно равны 25 и 2,6 л на 100 км.

Поскольку n < 20, то по критерию Романовского при уровне значимости 0,01 и n = 4 табличный коэффициент bт = 1,73. Вычисленное для последнего, пятого измерения b = |(25 30)|/2,6 = 1,92 > 1,73 .

Критерий Романовского свидетельствует о необходимости отбрасывания последнего результата измерения.

Критерий Шарлье используется, если число наблюдений в ряду велико (n> 20). Тогда по теореме Бернулли [56] число результатов, превышающих по абсолютному значению среднее арифметическое значение на величину КШSx, будет n[l - Ф(КШ)], где Ф(КШ) — значение нормированной функции Лапласа для X = КШ. Если сомнительным в ряду результатов наблюдений является один результат, то n[1-Ф(Кш)] = 1. Отсюда Ф(КШ) = (n -1)/n.

Значения критерия Шарлье приведены в табл. 7.2.

Таблица 7.1

Значения критерия Романовского

 

q n =4 n = 6 n = 8 n = 10 n = 12 n = 15 n = 20
0,01 1,73 2,16 2,43 2,62 22,75 2,90 3,08
0,02 1,72 2,13 2,37 2,54 2,66 2,80 2,96
0,05 1,71 2,10 2,27 2,41 2,52 2,64 2,78
0,10 1,69 2,00 2,17 2,29 2,39 2,49 2,62

 

 

Таблица 7.2

Значения критерия Шарльe

 

п
Кщ 1,3 1,65 1.96 2,13 2,24 2,32 2,58

Таблица 7.3

Значения критерия Диксона

 

n Zq при q, равном
0,10 0,05 0,02 0,01
0,68 0,76 0,85 0,89
0,48 0,56 0,64 0,70
0,40 0,47 0,54 0,59
0,35 0,41 0,48 0,53
0,29 0,35 0,41 0,45
0,28 0,33 0,39 0,43
0,26 0,31 0,37 0,41
0,26 0,30 0,36 0,39
0,22 0,26 0,31 0,34

 

Пользуясь критерием Шарлье, отбрасывают результат, для значения которого в ряду из n наблюдений выполняется неравенство |хi - х̅| > КШSx .

Вариационный критерий Диксона удобный и достаточно мощный (с малыми вероятностями ошибок). При его применении полученные результаты наблюдений записывают в вариационный возрастающий ряд х1, х2, . . ., xn (x1 < х2 < . . .< хп). Критерий Диксона определяется как КД = (хn - xn-1/(xn –x1). Критическая область для этого критерия Р(КД > Zq) = q. Значения Zf( приведены в табл. 7.3 [56].

 

Пример 7.2. Было проведено пять измерений напряжения в электросети. Получены следующие данные: 127,1; 127,2; 126,9; 127,6; 127,2 В. Результат 127,6 В существенно (на первый взгляд) отличается от остальных. Проверить, не является ли он промахом.

Составим вариационный ряд из результатов измерений напряжения в электросети: 126,9; 127,1; 127,2; 127,2; 127,6 В. Для крайнего члена этого ряда (127,6 В) критерий Диксона

 

Кд = (127,6 - 127,2) / (127,6 - 126,9) = 0,4 / 0,7 » 0,57.

 

Как следует из табл.7.3, по этому критерию результат 127,6 В может быть отброшен как промах лишь на уровне значимости q = 0,10.

 

Применение рассмотренных критериев требует осмотрительности и учета объективных условий измерений. Конечно, оператор должен исключить результат наблюдения с явной грубой погрешностью и выполнить новое измерение. Но он не имеет права отбрасывать более или менее резко отличающиеся от других результаты наблюдений. В сомнительных случаях лучше сделать дополнительные измерения (не взамен сомнительных, а кроме них) и затем привлекать на помощь рассмотренные выше статистические критерии. Кроме рассмотренных критериев, существуют и другие, например критерии Граббса и Шовенэ.

Контрольные вопросы

 

1. Что такое грубые погрешности и промахи? Как определить их присутствие в выборке по виду закона распределения или гистограмме?

2. Расскажите о критерии "трех сигм" и его модификациях.

3. Как применить критерий Романовского для исключения из выборки промахов?

4. В чем суть критерия Шарлье?

5. Расскажите об использовании вариационного критерия Диксона для нахождения промахов.