Перевірка гіпотези про рівність математичних сподівань двох нормально розподілених випадкових величин

Нехай задані дві генеральні сукупності, що характеризуються незалежними нормально розподіленими випадковими величинами і із параметрами, відповідно, і . Позначимо , . Припустимо, що математичні сподівання і невідомі, тоді нехай потрібно перевірити гіпотезу про їх рівність, тобто . Для перевірки гіпотези за відповідної альтернативної гіпотези із кожної сукупності проводиться вибірка: з першої – обсягу , за якою отримуємо вибіркове середнє , з другої – обсягу , з якої отримуємо вибіркове середнє . Усі критерії перевірки гіпотези ґрунтуються на порівнянні статистик кожної із генеральних сукупностей. Тут знову розглянемо кілька випадків.

Випадок I. Дисперсії та ознак і відомі. За критерій перевірки гіпотези вибираємо статистику :

. (12.8)

 

Якщо

1) конкуруюча гіпотеза , то критична область двостороння, і критичну точку шукаємо з рівності:

. (12.9)

Далі робимо висновок про гіпотезу: якщо , то приймаємо нульову гіпотезу; якщо , то гіпотезу відхиляємо на користь альтернативної гіпотези

2) конкуруюча гіпотеза (критична область правостороння), то рівняння для знаходження критичної точки набуває вигляду

(12.10)

Знову робимо такі висновки стосовно нульової гіпотези : якщо , то приймаємо нульову гіпотезу; якщо , то гіпотезу відхиляємо на користь альтернативної гіпотези

3) конкуруюча гіпотеза (критична область лівостороння), тоді критичну точку знаходимо з рівняння (12.10).

Якщо , то приймаємо нульову гіпотезу; якщо , то гіпотезу відхиляємо, а приймаємо альтернативну гіпотезу

 

Приклад 12.4. З двох нормально розподілених генеральних сукупностей, що характеризуються випадковими величинами і з параметрами та відповідно, утворені вибірки обсягами і відповідно, і обчислені їх вибіркові середні значення і . При рівні значущості перевірити гіпотезу про рівність математичних сподівань за альтернативної гіпотези , якщо .

Розв’язання.Спираючись на формулу (12.8) знаходимо : За таблицею додатка 3 знаходимо розв’язок рівняння (12.9) звідки . Оскільки , то гіпотезу відхиляємо.

 

Випадок II. Дисперсії та ознак і невідомі . Нехай випадкові величини і , що описують дві генеральні сукупності, незалежні і нормально розподілені. Їх математичні сподівання і та дисперсії і є невідомі. За даними вибірок великих обсягів п і т та за даним рівнем значущості перевіряємо гіпотезу (про рівність математичних сподівань випадкових величин і ) за відповідної альтернативи .

За умов даної моделі критерій перевірки гіпотези будуємо аналогічно, як у Випадку I цього пункту, з тією лиш різницею, що за значення невідомих дисперсій і приймаємо виправлені вибіркові дисперсії , які обчислюємо для даних вибірок. В цьому випадку за критерій беруть статистику

(12.11)

У випадку вибірок малих обсягів п і т для перевірки гіпотези використовується статистика

яка, як і статистика (12.11), має розподіл Стьюдента з числом k = n + m – 2 ступенів вільності.

Подальша побудова критичної області здійснюється аналогічно, як викладено у Випадку 1, з тією відмінністю, що критичні точки визначаються за таблицею розподілу Стьюдента (додаток 7).

Якщо нульова гіпотеза (як у Випадку I так і у Випадку II) приймається, то за значення і вибираємо спільне вибіркове середнє, яке обчислюємо за формулою

 

Приклад 12.5.Середній щоденний об’єм продажу в І кварталі поточного року для 37 продавців району А становить 15 тис. грн., а виправлене середнє квадратичне відхиленні 4,5 тис. грн., для 40 продавців району В – 13 тис. грн. і 5 тис. грн. відповідно. Кожну групу можна вважати випадковою незалежною вибіркою з відповідної нормально розподіленої генеральної сукупності. Чи суттєва різниця об’ємів продажу в районах А та В при 5%-му рівні значущості?

Розв’язання. Математичне сподівання і середнє квадратичне відхилення законів розподілу об’ємів продажу для районів А та В невідомі. В такому випадку виникає задача оцінки статистичної гіпотези якщо взяти за математичне сподівання об’ємів продажу для району А, а за – для району В за конкуруючої гіпотези ,

Обчислюємо емпіричне значення критерію за формулою (12.11): Випадкова величина підпорядкована розподілу Стьюдента з ступенями вільності. За таблицею розподілу(додаток 7 )для і -го рівня значущості (для двосторонньої критичної області) знаходимо . Це означає, що критична область є об’єднанням інтервалів . Отримане значення критерію не належить критичній області. Звідси випливає, що різниця об’ємів продажу в районах А та В несуттєва і гіпотеза приймається. За спільне вибіркове середнє вибирають величину

Отже, середній денний об’єм продажу в кожному з районів становить приблизно 13,96 тис. грн.

.