Гипотеза о равенстве дисперсии некоторой константе

Дисперсия является показателем точности какого-то прибора, инструмента или даже технологии выполнения наблюдений. При этом, часто встаёт вопрос о том, обеспечена ли требуемая точность работ. Подобный вопрос может быть сформулирован в форме нулевой гипотезы

H₀ = {² = C} (259)

против альтернативной

H_A = {² C}, (260)

где «С» – требуемое значение показателя точности.

Пусть мы имеем простую выборку x₁ x₂ … x_n из нормальной ГС X N(E(X); ²_X), представляющей собой наблюдения некоторой величины «X» без постоянных погрешностей. По данным такой выборки можно построить оценивающие функции для МО и дисперсии: среднее арифметическое – = (x_i)/n и исправленную дисперсию – m² = (x_i– )²/(n–1). В качестве эмпирического теста используется дробь

, (261)

имеющая [Ш] ²-распределение с (n – 1) степенью свободы. Критические границы двухстороннего доверительного интервала , соответствующего уровню значимости «», будут равны:

= и = , (262)

где r = (n – 1) – это число степеней свободы.

Нулевая гипотеза (259) отвергается, когда .

Тест (261) может быть использован как для оценки качества технологии работ, включающей в себя квалификацию исполнителя, так и для оценки точностных параметров аппаратуры, когда имеется уверенность в упомянутой квалификации персонала.

Два примера.

3.3.2.2 Распределение Фишера.

Распределение Фишера, или F-распределение, является законом распределения дроби, представляющей собой отношение двух стохастически не связанных величин «u» и «v», учитывающее тот факт, что каждая из этих величин характеризуется ²-распределением с числом степеней свободы ₁ и ₂, соответственно:

. (263)

Плотность вероятности пары {u,v} равна [22]:

, (264)

когда u [0, [и v [0, [. Для отрицательных значений «u» и «v» f(u,v)=0.

Соответствующая функция распределения – это и есть F-распределение Фишера-Снедекора, характеризующееся двумя параметрами ₁ и ₂. Для часто употребляемых значений вероятностей «P» составляются таблицы с двумя входами ₁ и ₂ (Приложения F-распр.):

F_P(₁,₂) = P. (265)

Важно отметить, что величина 1/ также имеет F-распределение с параметрами ₂ и ₁:

F_1-_P (₂,₁) = 1/ F_P(₁,₂). (266)

Распределение Фишера применяется для проверки гипотезы о равенстве двух несмещённых выборочных дисперсий m₁² и m₂², оценённых по простым выборкам из двух различных нормальных ГС, каждая из которых имеет свою дисперсию ₁² и ₂², соответственно. Пусть первая выборочная дисперсия m₁² вычислена по данным простой выборки, объёмом n₁, а вторая, m₂² – n₂. В таком случае дробь

как это показано в [22], будет иметь F-распределение с (n₁ – 1) и (n₂ – 1) степенями свободы. Вероятность «» того, что эта дробь лежит в пределах между квантилями F₁ и F₂ определит доверительный интервал

P(F₁ < < F₂) = . (267)

Для интересующей нас дроби m₁² / m₂² интервал (267) легко преобразуется в эквивалентный:

P(F₁* < < F₂* ) = . (268)

Если предполагается, что дисперсии обеих ГС одинаковы, т.е. ₁²=₂²=², то нулевая гипотеза о равенстве дисперсий записывается следующим образом:

H₀ = {m₁² = m₂² = ²}. (269)

Интервал (267) принимает вид

P(F₁ < < F₂) = . (270)

Квантили F-распределения с (n₁ – 1) и (n₂ – 1) степенями свободы зависят от доверительной вероятности = P:

F₁ = F₍₁₊_)/2(n₁–1; n₂–1), F₂ = F_(1-_)/2(n₁–1; n₂–1).

Эти же квантили можно представить как функции уровня значимости =1–:

F₁ = F_1-_/2(n₁–1; n₂–1), F₂ = F _/2(n₁–1; n₂–1).

Эти квантили ограничивают область

F_T = [F₁; F₂], (271)

которая с вероятностью = P накрывает неизвестное истинное значение отношения дисперсий.

В качестве теста используется отношение бòльшей оценки дисперсии к мèньшей. Обозначим бòльшую оценку дисперсии через m₁², а мèньшую – m₂². Тогда тест, всегда бòльший единицы, будет иметь вид:

F_Э = m₁² / m₂². (272)

Нулевая гипотеза (269) отвергается, когда F_Э F_T.

Следующий пример, данные для которого заимствованы из [23], стр. 238, иллюстрирует использование критерия Фишера-Снедекора при анализе двух выборочных дисперсий.

Пример 3.8. «Один и тот же горизонтальный угол измерен двумя наблюдателями посредством триангуляционных теодолитов ТТ-2/6 № 8019 и 8002». «Сводка измерений приводится в табл. 3.Х (только секунды дуги)».

Табл. 3.Х

№№ ин-та.	Обозна- чения	№ приёмов наблюдений

	X	6,2	6,8	5,8	5,4	6,8	5,9	3,5	4,2	6,1	4,6	5,3
	Y	6,4	6,9	5,1	4,8	5,6	6,0	6,0	5,9	5,8	8,3	4,8

Данные измерений рассматриваются как две простые выборки из двух ГС «X» и «Y». По этим данным получены несмещённые оценки математических ожиданий и дисперсий обеих ГС:

= 5,51; m_x² = 1,05; = 5,96; m_y² = 1,01.

Задача заключается в проверке на уровне значимости = 0,05 нулевой гипотезы о равенстве дисперсий

H₀ = {m_x² = m_y² = ²}, (273)

против альтернативной

H_A = {m_x² m_y²}. (274)

Эмпирическое значение теста (272) равно F_Э = m_x² / m_y² = 1,09, а область F_T = [F₁; F₂], с доверительной вероятностью = 1 – = 0,95 и числами степеней свободы n₁–1 = n₂–1 = 10, имеет границы

F₁ = F_0,975;10;10 = 0,27 и F₂ = F_0,025;10;10 = 3,72.

Таким образом, F_Э F_T и, следовательно, нулевая гипотеза (273) не отвергается. Это означает, что качество наблюдений, выполненных разными наблюдателями одинаково приемлемо.

Критерий Кочрена.

Данный критерий применяется для анализа однородности ряда выборочных дисперсий, оценённых по «k» выборкам одинакового объёма «n».

3.3.3 Гипотезы о равенстве МО.

Чаще всего востребованы две гипотезы о равенстве МО:

1) гипотеза о равенстве МО некоторой константе – H₀ = {E(X) = C};

2) гипотеза о равенстве МО двух разных ГС – H₀ = {E(X) = E(Y)}.

Первая гипотеза может быть использована при компарировании или эталонировании прибора с целью оценивания его постоянной ошибки «». Примем значение эталона за константу «С». Выполнив ряд некоррелированных равноточных измерений эталона, мы получим простую выборку x₁ x₂ … x_nиз нормальной ГС X N(E(X) = C; ²_X). По материалам такой простой выборки оцениваем генеральные параметры E(X) = C и дисперсию ²_X.Несмещёнными оценками будут среднее арифметическое – = (x_i)/n и исправленная дисперсия – m² = (x_i– )²/(n–1). Далее, используя тот факт [22], что дробь

(237)

подчиняется t-распределению с (n – 1) степенью свободы, проверяем на уровне значимости «» нулевую гипотезу

H₀ = {E(X) = C} (270)

против альтернативной

H_A = {E(X) C}. (271)

В качестве теста используется двухсторонний ДИ t_T = [t_H; t_B], границы которого t_H и t_B представляют собой квантили распределения Стьюдента:

t_B = t_r_;1-_a/2и t_H = – t_B, (272)

где r = n – 1 – число степеней свободы статистики (237).

Нулевая гипотеза (270) отвергается, если . Это означает, что проверяемый прибор имеет постоянную погрешность, равную разности СА изначению эталона «С»: = – C, которую надлежит учитывать. СКО постоянной погрешности «»определяется СКО СА:

m = m= m / . (273)

Вторая гипотеза бывает востребована в ситуации, когда одна и та же величина определяется двумя разными технологиями, вероятностными моделями которых служат две СВ «X» и «Y».

3.3.4 Гипотезы о парной некоррелированности случайных величин.

3.3.5 Сводная таблица гипотез, наиболее часто используемых на практике.

При выполнении обработки независимых многократных измерений одной или нескольких величин, не объединенных в единую систему, часто приходится искать ответы на вопросы, касающиеся практического использования результатов наблюдений. Например, обрабатывая материалы эталонирования или компарирования приборов, необходимо оценить значимость полученной постоянной систематической поправки. При анализе любых измерений бывает необходимо решить вопрос о достижении требуемой точности, или сравнить различные технологии как по точности, так и по результативности, или убедиться в независимости массивов данных. Приводимая здесь сводная таблица (Табл. 3.3.5) объединяет гипотезы, описанные в предыдущих параграфах, и позволяет находить ответы на некоторые из вышеприведенных вопросов.

Сводная таблица проверки гипотез.

Табл. 3.3.5

Гипотеза	Проверка гипотезы	Примечания
Текст	Условная запись	Тест	Границы критической области (ГКО)

1.Закон распределения – нормальный	H = {X N(E(X) = ; s_X = s_X)}	= =	= = ; r = q – 3	Квантили распределения Пирсона
2.Асимметрия незнàчима	H = {As = 0}	= /	t_B = – t_H ; t_B 2	Приближенная нормальность
3.Эксцесс незнàчим	H = {Ex = 0}	= / – 3	t_B = – t_H ; t_B 2	Приближенная нормальность
4.МО равно заданному значению	H₀ = {E(X) = C}	= ( – C) / s	t_B = t_r;1-_a/2; t_H = – t_B; r = n – 1	Квантили распределения Стьюдента
5.Дисперсия равна заданному значению	H = { = C}		= = ; r = n – 1	Квантили распределения Пирсона
6.Дисперсии двух ГС X и Y равны	H = { = }	= / ; =max{ }	F_H = 1 / F_B; F_B= r_1,2 = n_X,Y – 1.	Квантили распределения Фишера
7.МО двух ГС X и Y равны	H = {E(X) = =E(Y)}, при условии, что = .	( )* *	t_B = t_r;1-_a/2; t_H = – t_B; r = n – 2	Квантили распределения Стьюдента
8.Корреляция двух ГС X и Y отсутствует	H = {r_XY = 0}	= r_XY* *	t_B = – t_H; t_B = t_m;1-_a/2; m = n – 2	Квантили распределения Стьюдента
9. Разность МО двух ГС X и Y не значима	H = {E(d) = 0} (d = x – y)		t_B = – t_H; t_B = t_m;1-_a/2; m = n – 1	Квантили распределения Стьюдента
10. Измерение x_i не содержит грубой ошибки	H = { = 0} ( = – x_i)	=	t_B = – t_H; t_B = t_m;1-_a/2; m = n – 1	Квантили распределения Стьюдента

Гипотеза отвергается на уровне значимости a, когда тест попадает в критическую область, т.е. .

Кроме общепринятых обозначений, приводимых в главах 3.1 - 3.3, в таблице дополнительно введены следующие обозначения:

Гипотеза 7. = [vv]_X = * (n_X – 1), где – дисперсия по выборке из ГС X, n_X – объем этой выборки, [vv]_X – сумма квадратов уклонений элементов выборки x_i от их СА ;

Гипотеза 7. = [vv]_Y = * (n_Y – 1), где - дисперсия по выборке из ГС Y, n_Y - объем этой выборки, [vv]_Y - сумма квадратов уклонений элементов выборки y_j от их СА ;

Гипотеза 9. = ( ) / n – средняя разность.