Проверка выпадов (артефактов)

Нормированное отклонение помогает определить выпады, или артефакты, т. е. такие записанные значения признака, которые резко отличаются от всех других значений признака в группе. Проверка артефактов должна проводиться всегда перед началом обработки полученных первичных данных. Если подтвердится, что резко выделяющееся значение действительно не может относиться к объектам данной группы, и попало в записи вследствие ошибок внимания, следует такой артефакт исключить из обработки.

Проверка артефактов может производиться по критерию, равному нормированному отклонению выпада:

, (7.9)

где:

Т – критерий выпада;

– выделяющееся значение признака (или очень большое или очень малое);

μ, s – средняя и сигма, рассчитанные для группы, включающей артефакт;

Tst – стандартные значения критерия выпадов, определяемых по таблице 7.3.

Таблица 7.3 – Стандартные значения критерия выпадов (Tst)

n Tst n Tst n Tst n Tst
2,0 16 – 20 2,4 47 – 66 2,8 125 – 174 3,2
3 – 4 2,1 21 – 28 2,5 67 – 84 2,9 175 – 349 3,3
5 – 9 2,2 29 – 34 2,6 85 – 104 3,0 350 – 599 3,4
10 – 15 2,3 35 – 46 2,7 105 – 124 3,1 600 – 1500 3,5

 

Если Т ≥ Tst, то анализируемое значение признака является артефактом. Альтернатива Т < Tst не позволяет исключить из анализа значение признака.

Табулированные данные таблицы 7.3 можно аппроксимировать следующей функцией: Tst = 0,287×ln(n) + 1,714

 

Пример

Данные: 1, 2, 3, 10; n = 4, μ = 4, s = 4, ; 10 еще не может считаться выпадом.

Данные: 1, 2, 2, 3, 3, 4, 4, 5, 21; n = 9, μ = 5, s = 6,1, ;

21 может считаться выпадом и должна быть исключена из обработки.

Средняя и сигма суммарной группы

Иногда бывает необходимо определить среднюю и сигму для суммарного распределения, составленного из нескольких распределений. При этом известны не сами распределения, а только их средние и сигмы.

Средняя и сигма в таких случаях находятся по следующим формулам:

(7.10)

, (7.11)

где:

ni – численность отдельных объединяемых групп;

μi – средняя арифметическая каждой объединяемой группы;

si – сигма каждой объединяемой группы.

Пример

Четыре независимых наблюдения величины одного и того же вида амеб в сходных условиях дали следующие результаты (в микронах):

 

Наблюдения μ s n

 

По этим данным средний размер и стандартное отклонение амеб могут быть вычислены, как показано в таблице 7.4.

Разнообразие объектов, составляющих группу, – основное свойство всякой совокупности. Знание закономерностей, по которым формируется разнообразие признака в группе, имеет большое практическое и научное значение.

В малочисленных группах трудно подметить какую–либо закономерность в разнообразии данных. Обычно все значения бывают различны, повторяются без всякой видимой закономерности.

Таблица 7.4 – Вычисление μ и σ суммарной группы

Исследования  
ni
μ i
si
ni μi
si2  
(ni-1) si2
–1 + 1 +1  
 

 

; ; .