Гіпотеза про рівність математичних сподівань двох нормально розподілених ознак генеральної сукупності

 

Нехай в генеральній сукупності досліджуються дві нормально розподілені випадкові величини (ознаки) x і h з параметрами (ax, sx) і (ah, sh), відповідно. З цією метою проведено дві незалежні вибірки (x1, x2, ..., ) i (y, y2, ..., ­) з об’ємами n1 і n2.

Необхідно перевірити таку параметричну гіпотезу:

H0:ax=ah. (4.21)

Розглянемо два випадки:

а) sx i sh – відомі.

Враховуючи, що значення математичних сподівань ax i ah випадкових величин x i h – невідомі, то для перевірки гіпотези (4.21) використовують їх точкові оцінки відповідно. Відомо [6], що, у випадку нормально розподілених x i h, вибіркові середні мають нормальний закон розподілу з параметрами i . Оскільки вибірки незалежні, то випадкові величини також незалежні.

З цього факту випливає, що випадкова величина ( ) також є нормально розподіленою. Дійсно, використовуючи властивості математичного сподівання, дисперсії та їх точкових оцінок з врахуванням змісту гіпотези (4.21), будемо мати:

Отже, випадкова величина ( ) нормально розподілена з параметрами . Це дає змогу зробити висновок, що оскільки випадкова величина

, (4.22)

як неважко показати, є нормально розподіленою з параметрами (0,1), то вона може бути вибрана за міру різниці між математичними сподіваннями ax i ah.

При альтернативній гіпотезі для заданого рівня значущості a критичну область можна знайти з рівняння:

. (4.23)

А оскільки , то враховуючи те, що – нормально розподілена випадкова величина, отримаємо, що рівняння (4.23) запишеться у вигляді:

, (4.24)

де – функція Лапласа.

Розв’язуючи рівняння (4.24), для заданого a за таблицею 2 у додатку для функції Лапласа отримаємо, що межа (критична точка) критичної області знаходиться в точці .

При альтернативних гіпотезах: Н1: ; Н1: , де – розв’язок рівняння .

Нехай – точкова оцінка випадкової величини , яка обчислюється на основі вибірок і за формулою (4.22). Тоді, якщо , то гіпотеза відхиляється, а в протилежному випадку – приймається.

Приклад 4.13. В результаті проведення двох вибірок об’ємами n1=40 і n2=50 при дослідженні деякої ознаки в генеральній сукупності отримані такі середні значення: і . Зробивши припущення про те, що дана ознака в генеральній сукупності нормально розподілена, необхідно перевірити гіпотезу H0: ax=ah, якщо відомо, що sx=sh=0,3 i a=0,01.

Розв’язок. За формулою (4.22), виходячи з умови задачі, знайдемо, що:

Розв’язавши рівняння (4.21), із таблиці 2 у додатку для функції Лапласа отримаємо значення межі критичної області t0,01 = 2,58.

Оскільки >t0,01, то, згідно із вищенаведеним критерієм, дану гіпотезу треба відхилити.

б) sx i sh– невідомі.

Необхідно підкреслити, що побудувати критерій узгодження для гіпотези H0 (4.21) в загальному у даному випадку не вдається. Це складає, так звану, проблему Беренса -Фішера. Тому розглянемо лише частковий випадок, а саме: будемо вважати, що s2x=s2h=s2, оскільки при виконанні цієї умови можна знайти випадкову величину t, як міру відхилення між математичними сподіваннями ax i ah.

Дійсно, можна показати, аналогічно як і в попередньому випадку, що якщо x i h - нормально розподілені випадкові величини, то випадкова величина ( ) також має нормальний розподіл з параметрами . У математичній статистиці, наприклад, в [6], доведено, що, якщо за точкову оцінку дисперсії вибрати наступну зміщену (це неважко показати) точкову оцінку:

,(4.25)

де i - виправлені вибіркові дисперсії випадкових величин x i h, а випадкова величина ( ) є нормально розподіленою, то випадкова величина

(4.26)

має t - розподіл Стьюдента з числом ступенів свободи. Саме це дає змогу знайти критичну область виду , де a - рівень значущості.

Згідно з (4.2), рівняння для отримання межі (критичної точки) критичної області, виходячи з (4.26), буде мати вигляд:

. (4.27)

Розв’язуючи рівняння (4.27), для заданого рівня значущості a і числа ступенів свободи за таблицею 4 для t-розподілу Стьюдента дістанемо, що межа критичної області знаходиться в точці .

А це дозволяє сформулювати шуканий критерій узгодження таким чином.

Нехай – точкова оцінка випадкової величини t, яка обчислена на основі вибірок (x1, x2, ..., ) і (y1, y2, ..., ) за формулою (4.26). Тоді:

1. Якщо , то гіпотеза H0 відхиляється;

2. Якщо ж , то гіпотеза H0 приймається.

Зауваження 4.9. При перевірці гіпотези (4.18) для заданого рівня значущості a контролюється лише помилка першого роду. Задача про перевірку гіпотези про рівність математичних сподівань випадкових величин (ознак) x і h в генеральній сукупності має велике прикладне значення. Зокрема, у промисловості та торгівлі задача порівняння середніх часто виникає при вибірковому контролю якості виробів. Критерій узгодження, який сформульований у випадку б) можна застосувати до задачі про виключення грубих помилок при проведенні вибіркових спостережень.



>
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • Далее ⇒