Вариационный критерий Диксона
Критерии исключения грубых погрешностей
При однократных измерениях обнаружить промах не представляется возможным. Для уменьшения вероятности появления промахов измерения проводят два-три раза и за результат принимают среднее арифметическое полученных отсчетов. При многократных измерениях для обнаружения промахов используют статистические критерии, предварительно определив, какому виду распределения соответствует результат измерений.
Вопрос о том, содержит ли результат наблюдений грубую погрешность, решается общими методами проверки статистических гипотез. Проверяемая гипотеза состоит в утверждении, что результат наблюдения X; не содержит грубой погрешности, т.е. является одним из значений измеряемой величины. Пользуясь определенными статистическими критериями, пытаются опровергнуть выдвинутую гипотезу. Если это удается, то результат наблюдений рассматривают как содержащий грубую погрешность и его исключают.
Для выявления грубых погрешностей задаются вероятностью q (уровнем значимости) того, что сомнительный результат действительно мог иметь место в данной совокупности результатов измерений.
Критерий "трех сигм"
Критерий "трех сигм" применяется для результатов измерений, распределенных по нормальному закону. По этому критерию считается, что результат, возникающий с вероятностью q < 0,003, маловероятен и его можно считать промахом, если |X- Xi |>3Sx, где — оценка СКО измерений. Величины х и Sx вычисляют без учета экстремальных значений Xi Данный критерий надежен при числе измерений n > 20... 50.
Это правило обычно считается слишком жестким, поэтому рекомендуется [4] назначать границу цензурирования в зависимости от объема выборки: при 6 < n < 100 она равна 4SX; при 100 < n < 1000- 4,5SX; при 1000 < n < 10000 - 5Sx Данное правило также применимо только для нормального закона.
В общем случае границы цензурирования teSx выборки зависят не только от объема n, но и от вида распределения. Назначая ту или иную границу, необходимо оценить уровень значимости q, т.е. вероятность исключения какой-либо части отсчетов, принадлежащих обрабатываемой выборке. В [4] приводится выражение для приближенного расчета коэффициента trp при уровне значимости q < l/(n + 1) : trp = 1,55 + 0,81 lg(n/10),
где е — эксцесс распределения. Данные выражения применимы для:
• кругловершинных двухмодальных распределений с е = 1,5,..., 3, являющихся композицией дискретного двузначного и нормального
распределений;
• островершинных двухмодальных распределений с е = 1,5,..., 6, являющихся композицией дискретного двузначного распределения и распределения Лапласа;
• композиций равномерного и экспоненциальных распределений с показателем степени а = 1/2 при е = 1,8,...,6;
• экспоненциальных распределений с е = 1,5,...,6.
Критерий Романовского
Критерий Романовского применяется, если число измерений
n < 20. При этом вычисляется отношение | (X-Xj)/Sx | = и сравнивается с критерием т, выбранным по табл. 7.1. Если т, то результат Xjсчитается промахом и отбрасывается.
Таблица 7.1
Значения критерия Романовского (=f (n)
q | n=4 | n=6 | n=8 | n=10 | n=12 | n=15 | n=20 |
0,01 | 1,73 | 2,16 | 2.43 | 2,62 | 2,75 | 2.90 | 3,08 |
0,02 | 1,72 | 2,13 | 2,37 | 2,54 | 2,66 | 2,80 | 2,96 |
0,05 | 1,71 | 2,10 | 2,27 | 2.41 | 2,52 | 2,64 | 2,78 |
0,10 | 1,69 | 2,00 | 2,17 | 2,29 | 2,39 | 2,49 | 2.62 |
Пример 7.1. При диагностировании топливной системы автомобиля результаты пяти измерений расхода топлива составили: 22, 24, 26, 28, 30 л на 100 км. Последний результат вызывает сомнение. Проверить по критерию Романовского, не является ли он промахом.
Найдем среднее арифметическое значение расхода топлива и его СКО без учета последнего результата, т.е. для четырех измерений. Они соответственно равны 25 и 2,6 л на 100 км.
Поскольку n < 20, то по критерию Романовского при уровне значимости 0,01 и n = 4 табличный коэффициент =1,73. Вычисленное для последнего, пятого измерения = |(25-30)|/2,6 = 1,92 > 1,73
Критерий Романовского свидетельствует о необходимости отбрасывания последнего результата измерения.
Критерий Шарлье
Критерий Шарлье используется, если число наблюдений в ряду велико (n > 20). Тогда по теореме Бернулли [56] число результатов, превышающих по абсолютному значению среднее арифметическое
значение на величину КШ Sx, будет n[l - Ф(КШ)], где Ф(КШ)— значение нормированной функции Лапласа для X = КШ
Если сомнительным в ряду результатов наблюдений является один результат, то n[1-Ф(Кш)| = 1. Отсюда Ф(Кш) = (n — 1)/n. Значения критерия Шарлье приведены в табл. 7.2.
Пользуясь критерием Шарлье, отбрасывают результат, для значения которого в ряду из n наблюдений выполняется неравенство |X-Xj | > КшSx .
Таблица 7.2 Значения критерия Шарлье
n | |||||||
Kш | 1,3 | 1,65 | 1,96 | 2,13 | 2,24 | 2,32 | 2,58 |
Вариационный критерий Диксона
Вариационный критерий Диксона удобный и достаточно мощный (с малыми вероятностями ошибок). При его применении полученные результаты наблюдений записывают в вариационный возрастающий ряд X1, X2,… Xn (X1 < X2 < . . -< Xn). Критерий Диксона определяется как KД = (Xn-Xn-1)/ = (Xn – X1). Критическая область для этого критерия Р(КД > Zq) = q. Значения Zq приведены в табл. 7.3 [56].
Пример 7.2. Было проведенопять измерений напряжения в электросети. Получены следующие данные: 127,1; 127,2; 126,9; 127,6; 127,2 В. Результат 127,6 В существенно (на первый взгляд) отличается от остальных. Проверить, не является ли он промахом.
Составим вариационный ряд из результатов измерений напряжения в электросети: 126,9; 127,1; 127,2; 127,2; 127,6 В. Для крайнего члена этого ряда (127,6 В) критерий Диксона
КД = (127,6 -127,2)/ (127,6 - 126,9) = 0,4 / 0,7 = 0,57.
Как следует из табл.7.3, по этому критерию результат 127,6 В может быть отброшен как промах лишь на уровне значимости q = 0,10.
Таблица 7.3 .Значения критерия Диксона
n | Zq при q,равном | |||
0,10 | 0.05 | 0,02 | 0,01 | |
0,68 | 0,76 | 0,85 | 0,89 | |
0,48 | 0,56 | 0,64 | 0,70 | |
0,40 | 0,47 | 0,64 | 0,59 | |
0,35 | 0,41 | 0,48 | 0,53 | |
0,29 | 0,35 | 0,41 | 0,45 | |
0,28 | 0,33 | 0,39 | 0,43 | |
0,26 | 0,31 | 0,37 | 0.41 | |
0,26 | 0.30 | 0,36 | 0,39 | |
0,22 | 0,26 | 0.31 | 0,34 |
Применение рассмотренных критериев требует осмотрительности и учета объективных условии измерении. Конечно, оператор должен исключить результат наблюдения с явной грубой погрешностью и выполнить новое измерение. Но он не имеет права отбрасывать более или менее резко отличающиеся от других результаты наблюдений. В сомнительных случаях лучше сделать дополнительные измерения (не взамен сомнительных, а кроме них) и затем привлекать на помощь рассмотренные выше статистические критерии. Кроме рассмотренных критериев, существуют и другие, например критерии Граббса и Шовенэ.