Перевірка гіпотези про рівність математичних сподівань двох нормально розподілених випадкових величин
Нехай задані дві генеральні сукупності, що характеризуються незалежними нормально розподіленими випадковими величинами і
із параметрами, відповідно,
і
. Позначимо
,
. Припустимо, що математичні сподівання
і
невідомі, тоді нехай потрібно перевірити гіпотезу про їх рівність, тобто
. Для перевірки гіпотези
за відповідної альтернативної гіпотези
із кожної сукупності проводиться вибірка: з першої – обсягу
, за якою отримуємо вибіркове середнє
, з другої – обсягу
, з якої отримуємо вибіркове середнє
. Усі критерії перевірки гіпотези
ґрунтуються на порівнянні статистик кожної із генеральних сукупностей. Тут знову розглянемо кілька випадків.
Випадок I. Дисперсії та
ознак
і
відомі. За критерій перевірки гіпотези
вибираємо статистику
:
. (12.8)
Якщо
1) конкуруюча гіпотеза , то критична область двостороння, і критичну точку
шукаємо з рівності:
. (12.9)
Далі робимо висновок про гіпотезу: якщо , то приймаємо нульову гіпотезу; якщо
, то гіпотезу
відхиляємо на користь альтернативної гіпотези
2) конкуруюча гіпотеза (критична область правостороння), то рівняння для знаходження критичної точки
набуває вигляду
(12.10)
Знову робимо такі висновки стосовно нульової гіпотези : якщо
, то приймаємо нульову гіпотезу; якщо
, то гіпотезу
відхиляємо на користь альтернативної гіпотези
3) конкуруюча гіпотеза (критична область лівостороння), тоді критичну точку
знаходимо з рівняння (12.10).
Якщо , то приймаємо нульову гіпотезу; якщо
, то гіпотезу
відхиляємо, а приймаємо альтернативну гіпотезу
Приклад 12.4. З двох нормально розподілених генеральних сукупностей, що характеризуються випадковими величинами і
з параметрами
та
відповідно, утворені вибірки обсягами
і
відповідно, і обчислені їх вибіркові середні значення
і
. При рівні значущості
перевірити гіпотезу про рівність математичних сподівань
за альтернативної гіпотези
, якщо
.
Розв’язання.Спираючись на формулу (12.8) знаходимо :
За таблицею додатка 3 знаходимо розв’язок рівняння (12.9)
звідки
. Оскільки
, то гіпотезу
відхиляємо.
Випадок II. Дисперсії та
ознак
і
невідомі . Нехай випадкові величини
і
, що описують дві генеральні сукупності, незалежні і нормально розподілені. Їх математичні сподівання
і
та дисперсії
і
є невідомі. За даними вибірок великих обсягів п і т
та за даним рівнем значущості
перевіряємо гіпотезу
(про рівність математичних сподівань випадкових величин
і
) за відповідної альтернативи
.
За умов даної моделі критерій перевірки гіпотези будуємо аналогічно, як у Випадку I цього пункту, з тією лиш різницею, що за значення невідомих дисперсій
і
приймаємо виправлені вибіркові дисперсії
, які обчислюємо для даних вибірок. В цьому випадку за критерій беруть статистику
(12.11)
У випадку вибірок малих обсягів п і т для перевірки гіпотези використовується статистика
яка, як і статистика (12.11), має розподіл Стьюдента з числом k = n + m – 2 ступенів вільності.
Подальша побудова критичної області здійснюється аналогічно, як викладено у Випадку 1, з тією відмінністю, що критичні точки визначаються за таблицею розподілу Стьюдента (додаток 7).
Якщо нульова гіпотеза (як у Випадку I так і у Випадку II) приймається, то за значення
і
вибираємо спільне вибіркове середнє, яке обчислюємо за формулою
Приклад 12.5.Середній щоденний об’єм продажу в І кварталі поточного року для 37 продавців району А становить 15 тис. грн., а виправлене середнє квадратичне відхиленні 4,5 тис. грн., для 40 продавців району В – 13 тис. грн. і 5 тис. грн. відповідно. Кожну групу можна вважати випадковою незалежною вибіркою з відповідної нормально розподіленої генеральної сукупності. Чи суттєва різниця об’ємів продажу в районах А та В при 5%-му рівні значущості?
Розв’язання. Математичне сподівання і середнє квадратичне відхилення законів розподілу об’ємів продажу для районів А та В невідомі. В такому випадку виникає задача оцінки статистичної гіпотези якщо взяти за
математичне сподівання об’ємів продажу для району А, а за
– для району В за конкуруючої гіпотези
,
Обчислюємо емпіричне значення критерію за формулою (12.11): Випадкова величина
підпорядкована розподілу Стьюдента з
ступенями вільності. За таблицею розподілу(додаток 7 )для
і
-го рівня значущості (для двосторонньої критичної області) знаходимо
. Це означає, що критична область є об’єднанням інтервалів
. Отримане значення критерію
не належить критичній області. Звідси випливає, що різниця об’ємів продажу в районах А та В несуттєва і гіпотеза
приймається. За спільне вибіркове середнє вибирають величину
Отже, середній денний об’єм продажу в кожному з районів становить приблизно 13,96 тис. грн.
.