Вариационный критерий Диксона

Критерии исключения грубых погрешностей

При однократных измерениях обнаружить промах не представ­ляется возможным. Для уменьшения вероятности появления про­махов измерения проводят два-три раза и за результат принимают среднее арифметическое полученных отсчетов. При многократных измерениях для обнаружения промахов используют статистиче­ские критерии, предварительно определив, какому виду распреде­ления соответствует результат измерений.

Вопрос о том, содержит ли результат наблюдений грубую погрешность, решается общими методами проверки статистиче­ских гипотез. Проверяемая гипотеза состоит в утверждении, что результат наблюдения X; не содержит грубой погрешности, т.е. является одним из значений измеряемой величины. Пользуясь определенными статистическими критериями, пытаются опро­вергнуть выдвинутую гипотезу. Если это удается, то результат наблюдений рассматривают как содержащий грубую погреш­ность и его исключают.

Для выявления грубых погрешностей задаются вероятностью q (уровнем значимости) того, что сомнительный результат действительно мог иметь место в данной совокупности результатов измерений.

Критерий "трех сигм"

 

Критерий "трех сигм" применяется для результатов измере­ний, распределенных по нормальному закону. По этому критерию считается, что результат, возникающий с вероятностью q < 0,003, маловероятен и его можно считать промахом, если |X- Xi |>3Sx, где — оценка СКО измерений. Величины х и Sx вычисляют без учета экстремальных значений Xi Данный критерий надежен при числе измерений n > 20... 50.

Это правило обычно считается слишком жестким, поэтому ре­комендуется [4] назначать границу цензурирования в зависимости от объема выборки: при 6 < n < 100 она равна 4SX; при 100 < n < 1000- 4,5SX; при 1000 < n < 10000 - 5Sx Данное правило также применимо только для нормального закона.

В общем случае границы цензурирования teSx выборки зави­сят не только от объема n, но и от вида распределения. Назначая ту или иную границу, необходимо оценить уровень значимости q, т.е. вероятность исключения какой-либо части отсчетов, при­надлежащих обрабатываемой выборке. В [4] приводится выра­жение для приближенного расчета коэффициента trp при уровне значимости q < l/(n + 1) : trp = 1,55 + 0,81 lg(n/10),

где е — эксцесс распределения. Данные выражения применимы для:

• кругловершинных двухмодальных распределений с е = 1,5,..., 3, являющихся композицией дискретного двузначного и нормального

распределений;

• островершинных двухмодальных распределений с е = 1,5,..., 6, являющихся композицией дискретного двузначного распределе­ния и распределения Лапласа;

• композиций равномерного и экспоненциальных распределе­ний с показателем степени а = 1/2 при е = 1,8,...,6;

• экспоненциальных распределений с е = 1,5,...,6.

Критерий Романовского

 

Критерий Романовского применяется, если число измерений

n < 20. При этом вычисляется отношение | (X-Xj)/Sx | = и срав­нивается с критерием т, выбранным по табл. 7.1. Если т, то результат Xjсчитается промахом и отбрасывается.

Таблица 7.1

Значения критерия Романовского (=f (n)

 

q n=4 n=6 n=8 n=10 n=12 n=15 n=20
0,01 1,73 2,16 2.43 2,62 2,75 2.90 3,08
0,02 1,72 2,13 2,37 2,54 2,66 2,80 2,96
0,05 1,71 2,10 2,27 2.41 2,52 2,64 2,78
0,10 1,69 2,00 2,17 2,29 2,39 2,49 2.62

Пример 7.1. При диагностировании топливной системы автомобиля ре­зультаты пяти измерений расхода топлива составили: 22, 24, 26, 28, 30 л на 100 км. Последний результат вызывает сомнение. Проверить по крите­рию Романовского, не является ли он промахом.

Найдем среднее арифметическое значение расхода топлива и его СКО без учета последнего результата, т.е. для четырех измерений. Они соответственно равны 25 и 2,6 л на 100 км.

Поскольку n < 20, то по критерию Романовского при уровне значимо­сти 0,01 и n = 4 табличный коэффициент =1,73. Вычисленное для по­следнего, пятого измерения = |(25-30)|/2,6 = 1,92 > 1,73

Критерий Романовского свидетельствует о необходимости отбрасыва­ния последнего результата измерения.

Критерий Шарлье

Критерий Шарлье используется, если число наблюдений в ряду велико (n > 20). Тогда по теореме Бернулли [56] число результатов, превышающих по абсолютному значению среднее арифметическое

значение на величину КШ Sx, будет n[l - Ф(КШ)], где Ф(КШ)— значе­ние нормирован­ной функции Ла­пласа для X = КШ

Если сомни­тельным в ряду ре­зультатов наблю­дений является один результат, то n[1-Ф(Кш)| = 1. Отсюда Ф(Кш) = (n — 1)/n. Значения критерия Шарлье приведены в табл. 7.2.

Пользуясь критери­ем Шарлье, отбрасыва­ют результат, для значения которого в ряду из n наблюдений вы­полняется неравенство |X-Xj | > КшSx .


Таблица 7.2 Значения критерия Шарлье

n
1,3 1,65 1,96 2,13 2,24 2,32 2,58

Вариационный критерий Диксона

 

Вариационный критерий Диксона удобный и достаточно мощ­ный (с малыми вероятностями ошибок). При его применении получен­ные результаты наблюдений записывают в вариационный возрастаю­щий ряд X1, X2,… Xn (X1 < X2 < . . -< Xn). Критерий Диксона опреде­ляется как KД = (Xn-Xn-1)/ = (Xn – X1). Критическая область для этого критерия Р(КД > Zq) = q. Значения Zq приведены в табл. 7.3 [56].

 

Пример 7.2. Было проведенопять измерений напряжения в электросети. Получены следую­щие данные: 127,1; 127,2; 126,9; 127,6; 127,2 В. Результат 127,6 В существенно (на первый взгляд) от­личается от остальных. Прове­рить, не является ли он промахом.

Составим вариационный ряд из результатов измерений напряжения в электросети: 126,9; 127,1; 127,2; 127,2; 127,6 В. Для крайнего члена этого ряда (127,6 В) критерий Диксона

КД = (127,6 -127,2)/ (127,6 - 126,9) = 0,4 / 0,7 = 0,57.

Как следует из табл.7.3, по этому критерию результат 127,6 В может быть отброшен как промах лишь на уровне значимости q = 0,10.

Таблица 7.3 .Значения критерия Диксона

n Zq при q,равном
0,10 0.05 0,02 0,01
0,68 0,76 0,85 0,89
0,48 0,56 0,64 0,70
0,40 0,47 0,64 0,59
0,35 0,41 0,48 0,53
0,29 0,35 0,41 0,45
0,28 0,33 0,39 0,43
0,26 0,31 0,37 0.41
0,26 0.30 0,36 0,39
0,22 0,26 0.31 0,34

Применение рассмотренных критериев требует осмотрительности и учета объективных условии измерении. Конечно, оператор должен ис­ключить результат наблюдения с явной грубой погрешностью и выпол­нить новое измерение. Но он не имеет права отбрасывать более или менее резко отличающиеся от других результаты наблюдений. В сомни­тельных случаях лучше сделать дополнительные измерения (не взамен сомнительных, а кроме них) и затем привлекать на помощь рассмотрен­ные выше статистические критерии. Кроме рассмотренных критериев, существуют и другие, например критерии Граббса и Шовенэ.