Перевірка гіпотез про рівність середніх двох сукупностей

Нехай є дві сукупності, що характеризуються генеральними середніми та і відомими дисперсіями та . Необхідно перевірити гіпотезу Н0 про рівність генеральних середніх, тобто Н0: . Для перевірки гіпотези Н0 із цих сукупностей взято дві незалежні вибірки об’ємів та , по яких знайдено середні арифметичні та і вибіркові дисперсії та . При достатньо великих об’ємах вибірки вибіркові середні та мають наближено нормальний закон розподілу, відповідно і . У випадку вірності гіпотези Н0 різниця - має нормальний закон розподілу з математичним сподіванням

і дисперсією . Тому при виконанні гіпотези Н0 статистика має стандартний нормальний розподіл N(0;1). У випадку конкуруючої гіпотези (або ) вибирають односторонню критичну область і критичне значення статистики знаходять із умови (рис.4.3); а при конкуруючій гіпотезі вибирають двосторонню критичну область і критичне значення статистики із умови (рис. 4.4).

 

Рис. 4.3 Рис. 4.4

 

Якщо значення статистики t, що фактично спостерігається, більше за критичне tкр, визначеного на рівні значущості α (за абсолютною величиною), тобто , то гіпотеза Н0 відкидається. Якщо , то робиться висновок, що нульова гіпотеза Н0 не суперечить спостереженням.

◄ Приклад 4.2Для перевірки ефективності нової технології відібрано дві групи робітників: у першій групі чисельністю =50 чоловік, де використовувалася нова технологія, вибірковий середній виробіток становив =85 (виробів), у другій групі чисельністю =70 чоловік вибірковий середній — =78 (виробів). Попередньо встановлено, що дисперсії виробітку в групах дорівнюють відповідно =100 та =74. На рівні значущості α = 0,05 з’ясувати вплив нової технології на середню продуктивність.

Розв’язання. Гіпотеза, що перевіряється, Н0: , тобто середні виробітки робітників однакові по новій і старій технологіях. В якості конкуруючої гіпотези можна взяти .

Фактичне значення статистики критерію . При конкуруючій гіпотезі Н1 критичне значення статистики знаходиться із умови , тобто , звідки по таблиці , а при конкуруючій гіпотезі Н2 — з умови , тобто , звідки по таблиці . Оскільки значення t = 4,00, що фактично спостерігається, більше за критичне значення tкр (при будь-якій із взятих конкуруючих гіпотез), то гіпотеза Н0 відкидається, тобто на 5%-вому рівні значущості можна зробити висновок, що нова технологія дозволяє підвищити середній виро

біток робітників.►

 

Будемо тепер вважати, що розподіл ознаки (випадкової величини) X та Y в кожній сукупності є нормальним. В цьому випадку, якщо дисперсії та відомі, то перевірка гіпотези проводиться так само, як описано вище, не тільки для великих, але й для малих по об’єму вибірок.

Якщо ж дисперсії та невідомі, але рівні, тобто , то в якості невідомої величини можна взяти їх оцінку — «виправлену» вибіркову дисперсію або .

Проте «кращою» оцінкою для буде дисперсія «змішаної» сукупності об’єму , тобто

,

а оцінкою дисперсії різниці незалежних вибіркових середніх

(звертаємо увагу на те, що число степенів вільності на 2 менше загального числа спостережень , оскільки дві степені «губляться» при визначенні по вибіркових даних та ). Доведено, що у випадку вірності гіпотези Н0 статистика

має t-розподіл Стьюдента з степенями вільності. Тому критичне значення статистики t знаходиться за формулами і в залежності від типу критичної області, в яких замість функції Лапласа Ф(t) береться функція для розподілу Стьюдента при числі степенів вільності , тобто або .

Якщо дисперсії та невідомі, і не вважається, що вони рівні, то статистика також має t-розподіл Стьюдента, проте число степенів вільності, що йому відповідає, визначається наближено і більш складним чином.

 

◄ Приклад 4.3Проведено дві вибірки врожаю пшениці: під час своєчасного збору врожаю і збору з певним запізненням. В першому випадку при спостереженні 8 ділянок вибіркова середня врожайність склала 16,2 ц/га, а середнє квадратичне відхилення — 3,2 ц/га; у другому випадку при спостереженні 9 ділянок ті ж характеристики дорівнювали відповідно 13,9 ц/га і 2,1 ц/га. На рівні значущості α=0,05 визначити вплив своєчасності збору врожаю на середнє значення врожайності.

Розв’язання. Гіпотеза, що перевіряється, Н0: , тобто середнє значення врожайності під час своєчасного збору врожаю та з певним запізненням рівні. В якості конкуруючої гіпотези беремо гіпотезу , прийняття якої означає значний вплив на врожайність строків збору. Значення статистики критерію, що фактично спостерігається

Критичне значення статистики для односторонньої області визначається

при числі степенів вільності із умови , звідки по таблиці . Оскільки , то гіпотеза Н0 приймається. Це означає, що вибіркові дані на 5%-вому рівні значущості не дозволяють вважати, що деяке запіз-

нення у строках збору суттєво впливають на розмір врожаю. ►