Порівняння часток ознаки в кількох сукупностях

Нехай дано l сукупностей, генеральні частки яких дорівнюють відповідно . Необхідно перевірити нульову гіпотезу про рівність генеральних часток, тобто Н0: або Н0: (i=1,2,…,l). Для перевірки гіпотези Н0 із цих сукупностей відібрано l незалежних вибірок достатньо великих об’ємів . Вибіркові частки ознаки дорівнюють відповідно , ,…, , де — число елементів і-тої вибірки (i=1,2,…,l), що мають дану ознаку.

Можна показати, що при справедливості гіпотези Н0 і при статистика має -розподіл з l-1 степенями вільності. В якості невідомого значення , що входить у вираз, беруть найкращу оцінку для р, яка дорівнює вибірковій частці ознаки, якщо всі l вибірок змішати у одну, тобто .

Для перевірки гіпотези Н0 зазвичай беруть правосторонню критичну область. Гіпотеза Н0 відкидається, якщо , де — критичне значення критерію , що визначається на рівні значущості α при числі степенів свободи l-1.

 

Приклад 3За умовою прикладу 2 на рівні значущості α = 0,05 з’ясувати, чи можна вважати, що різниця у засвоєнні навчального матеріалу студентами чотирьох груп першого курсу значна. Додаткові умови: для третьої групи =63, =125, для четвертої групи =105, =160.

Розв’язання. Висунемо гіпотезу Н0: або (i=1,2,3,4), тобто частки розв’язаних задач всіх груп рівні. Обчислимо оцінку : .

Вибіркові частки розв’язаних задач для кожної групи: , і . Статистика критерію

.

За таблицею значень критерію Пірсона . Оскільки (9,87>7,82), то гіпотеза Н0 відкидається, тобто різниця в засвоєнні навчального матеріалу студентами чотирьох груп значна на рівні α=0,05.►

 

Порівняння дисперсій декількох сукупностей

Нехай дано l нормально розподілених сукупностей, дисперсії яких дорівнюють відповідно , і l незалежних вибірок із кожної сукупності з об’ємами . Необхідно перевірити нульову гіпотезу про рівність дисперсій, тобто Н0: або Н0: (i=1,2,…,l).

Для перевірки гіпотези Н0 може бути використано критерій Бартлетта. Доведено, що при вірності гіпотези Н0 і при умові, що (i=1,2,…,l) статистика , в якій

— виправлена вибіркова дисперсія i-ї вибірки, — оцінка середнього арифметичного дисперсії) має -розподіл з l -1 степенями свободи. Тому гіпотеза Н0 відкидається, якщо значення, що фактично спостерігається, , де — критичне значення критерію , знайдене на рівні значущості α при числі степенів свободи l – 1.

Перевірка гіпотез про закон розподілу.

Критерій Колмогорова

На практиці окрім критерія часто використовується критерій Колмогорова, в якому в якості міри розходження між теоретичним та емпіричним розподілами розглядають максимальне значення абсолютної величини різниці між емпіричною функцією розподілу Fn(x) та відповідною теоретичною функцією розподілу , що має назву статистика критерію Колмогорова.

Доведено, що якою б не була функція розподілу F(x) неперервної випадкової величини Х, при необмеженому збільшенні числа спостережень ( ) ймовірність нерівності прямує до границі . Задаючи рівень значущості α, із співвідношення можна знайти відповідне критичне значення .

В табл.1 приводяться критичні значення критерію Колмогорова для деяких α.

 

Таблиця 1

Рівень значущості α 0,40 0,30 0,20 0,10 0,05 0,025 0,01 0,005 0,001 0,0005
Критичне значення 0,89 0,97 1,07 1,22 1,36 1,48 1,63 1,73 1,95 2,03

 

Схема застосування критерію Колмогорова наступна:

1. Будуються емпірична функція розподілу Fn(x) та передбачувана теоретична функція розподілу F(x).

2. Визначається міра невідповідності між теоретичним та емпіричним розподілами D та обчислюється величина .

3. Якщо обчислене значення λ виявиться більшим за критичне , визначене на рівні значущості α, то нульова гіпотеза Н0 про те, що випадкова величина Х має заданий закон розподілу, відкидається. Якщо , то вважають, що гіпотеза Н0 не суперечить експериментальним даним.

 

◄Приклад 4.За даними приклада 3.8 та табл. 1.1 (розділи 3 і 1) за допомогою критерію Колмогорова на рівні значущості α=0,05 перевірити гіпотезу H0 про те, що випадкова величина Х – виробіток робочих підприємства – має нормальний закон розподілу з параметрами a=119,2; , тобто N(119,2; 87,48).

Розв’язання. Значення емпіричної функції розподілу Fn(x), або накопиченої частості, обчислені в табл. 1.1, а її графік приведено на рис. 1.2б – ці значення та графік відтворюються відповідно в табл. 2. Для побудови теоретичної функції розподілу для нормального закону скористаємось її виразом через функцію Лапласа:

. Наприклад,

і т.д. Результати обчислень зведемо у табл. 2, а графік F(x) представимо на рис. 1.

 

Таблиця 2

x
Fn(x) 0,010 0,030 0,100 0,210 0,410 0,690 0,880 0,980 1,000
F(x) 0,004 0,021 0,080 0,221 0,449 0,695 0,878 0,964 0,993

 

 

Рис. 1

Із рис. 1 випливає, що .

Величина . Критичне значення критерію Колмогорова дорівнює . Оскільки , то гіпотеза H0 узгоджується з експериментальними даними. ►

Критерій Колмогорова часто застосовується на практиці завдяки своїй простоті. Але його застосування можливо лише тоді, коли теоретична функція розподілу F(x) задана повністю. Тому, якщо при невідомих значеннях параметрів застосувати критерій Колмогорова, взявши за значення параметрів їхні оцінки, то отримаємо завищене значення ймовірності

, а отже і більше критичне значення . В результаті є ризик у ряді випадків прийняти нульову гіпотезу H0 про закон розподілу випадкової величини як правдоподібну, в той час як насправді вона суперечить експериментальним даним.