Проверка гипотезы о нормальности распределения

Теоретические сведения

Прямыми называются измерения, в результате которых искомое значение физической величины находят непосредственно из опытных данных. Прямые измерения осуществляются путем многократных измерений.

Результаты наблюдений называются равноточными (равнорассеянными), если они являются независимыми, одинаково распределенными случайными величинами. Равноточные измерения получают при измерениях, проводимых одним наблюдателем или группой наблюдателей с помощью одних и тех же методов и средств измерений в неизменных условиях внешней среды.

Обработка результатов наблюдений в соответствии с [1] производится в следующем порядке.

Введение поправок

Путем введения поправок исключаются известные систематические погрешности из результатов наблюдений:

, (1.1)

где – исправленный результат i-го наблюдения;

– неисправленный результат i-го наблюдения;

– поправка для i-го наблюдения.

Нахождение систематических погрешностей целиком зависит от используемых методов и средств измерения физической величины.

Вычисление оценки математического ожидания

Рассчитывается оценка математического ожидания как среднее арифметическое исправленных результатов наблюдений, принимая его за оценку истинного значения измеряемой величины:

, (1.2)

где n – количество измерений.

Вычисление оценок среднеквадратических отклонений

Рассчитываются несмещенная оценка среднеквадратического отклонения результатов наблюдения

, (1.3)

и оценка среднеквадратического отклонения среднего арифметического:

. (1.4)

Проверка гипотезы о нормальности распределения

Сходимость результатов наблюдений можно оценить наиболее полно, если их распределение является нормальным. Поэтому исключительно важную роль при обработке результатов наблюдений играет проверка нормальности распределения.

Если число результатов n ³ 50, используется критерий Пирсона c², при 15 £ n < 50 – составной критерий, при n < 15 нормальность распределения не проверяется.

1.1.4.1. Критерий Пирсона c²

1. Весь диапазон полученных исправленных результатов наблюдений – разделяется на r интервалов шириной

(1.5)

и подсчитываются частоты m_i, равные числу результатов, лежащих в каждом
i-ом интервале, т. е. меньших или равных его правой и больших левой границы. Если в некоторые интервалы попадает меньше пяти наблюдений, то такие интервалы объединяются с соседними. Величиной r задаются из табл. 1.1.

Таблица 1.1

Рекомендуемое количество интервалов r

n	r
40 – 100	7 – 9
100 – 500	8 – 12
500 – 1000	10 – 16
1000 – 10000	12 – 22

2. Для каждого интервала находятся вероятности попадания в них результатов наблюдений:

, (1.6)

где , – левая и правая границы i-го интервала соответственно;

F(z) – интегральная функция нормированного нормального распределения с аргументом

, (1.7)

протабулированная в табл. П.5.

3. Для каждого интервала вычисляются величины

(1.8)

и суммируются по всем интервалам, в результате чего получается мера расхождения

. (1.9)

4. Определяется число степеней свободы с учетом группировки интервалов в п. 1

(1.10)

и, задаваясь уровнем значимости q от 10 до 2 %, по табл. П.1 находятся значения и . Если , то распределение результатов наблюдений считается нормальным.

Составной критерий

Критерий 1. Вычисляется отношение

, (1.11)

где – смещенная оценка среднеквадратического отклонения результатов наблюдения:

. (1.12)

Результаты наблюдений можно считать распределенными нормально, если выполняется неравенство

, (1.13)

где и – квантили распределения, получаемые из табл. П.2 при выбранном уровне значимости q₁.

Критерий 2. Можно считать, что результаты наблюдений принадлежат нормальному распределению, если не более m разностей

(1.14)

превосходят значение

, (1.15)

где – квантиль интегральной функции нормированного нормального распределения, определяемая по табл. П.6 при значении

. (1.16)

Значения m указаны в табл. П.3.

В случае если при проверке нормальности распределения результатов наблюдений для критерия 1 выбран уровень значимости q₁, а для критерия 2 – q₂, то результирующий уровень значимости составного критерия

. (1.17)

В случае, если хотя бы один из критериев не соблюдается, то считается, что распределение результатов наблюдений не соответствует нормальному.

Проверка на промахи

Промах – это результат грубого измерения, погрешность которого явно превышает по своему значению погрешности, оправданные условиями проведения эксперимента.

Вопрос о том, содержит ли данный результат наблюдений грубую погрешность, решается общими методами проверки статистических гипотез. Предполагая наперед, что результаты наблюдений могут быть описаны нормальным законом, для проверки гипотезы о промахах следует воспользоваться распределениями величин

и . (1.18)

Рассчитанные n₁ и n₂ сравниваются с n, выбираемым из табл. 1.1 приложения. По данным этой таблицы при заданном уровне значимости q можно найти те наибольшие n, которые случайная величина n₁ или n₂ может еще принять по случайным причинам. Если вычисленное по опытным данным n₁ или n₂ окажется меньше n, то гипотеза принимается; в противном случае она отвергается как противоречащая данным наблюдений. Тогда результат или соответственно приходится рассматривать как содержащий грубую погрешность, и его следует исключить из ряда наблюдений. При этом необходимо вернуться к п. 1.1.2 и выполнить перерасчет.