Перевірка гіпотез про однорідність вибірок

Гіпотези про однорідність вибірок – це гіпотези про те, що вибірки, що розглядаються, вибрані з однієї і тієї ж генеральної сукупності. Нехай маємо дві незалежні вибірки, зроблені з генеральних сукупностей з невідомими теоретичними функціями розподілу F1(x) та F2(x). Нульова гіпотеза, що перевіряється, має вигляд H0: F1(x) = F2(x) проти конкуруючої H1: Будемо вважати, що функції F1(x) та F2(x) неперервні.

Критерій Колмогорова-Смирнова використовує ту ж ідею, що і критерій Колмогорова, але тільки в критерії Колмогорова порівнюється емпірична функція розподілу з теоретичною, а в критерії Колмогорова-Смирнова порівнюються дві емпіричні функції розподілу.

Статистика Колмогорова-Смирнова має вигляд:

,

де та – емпіричні функції розподілу, побудовані за двома вибірками об’ємів n1 та n2. Гіпотеза H0 відкидається, якщо фактичне значення статистики , що спостерігається, більше критичного , тобто , та приймається в іншому випадку. При малих об’ємах вибірок ( ) критичні значення заданих рівнів значущості критерію можна знайти у спеціальних таблицях. При (а практично при ) розподіл статистики сходиться до розподілу Колмогорова для статистики . Тому гіпотеза H0 відкидається на рівні значущості α, якщо фактично значення , що спостерігається, більше критичного , тобто , та приймається в протилежному випадку.

 

◄Приклад 5Протягом місяця вибірково здійснювалась перевірка торгових точок міста з продажу овочів. Результати двох перевірок за недоваженостями покупцям одного виду овочів приведені в табл. 3. Чи можна вважати, що на рівні значущості α=0,05 за результатами двох перевірок (випадкових вибірок) недоваженості овочів описуються однією і тією ж функцією розподілу?

Розв’язання. Позначимо: та – накопичені частоти відповідно вибірок 1 та 2; – значення їхніх емпіричних функцій розподілу. Результати обчислень зведемо у табл. 4. З останнього стовпчика випливає, що . За формулою значення статистики, що спостерігається, при n1=110, n2=100 . За табл.1 при α=0,05, λ0,05=1,36. Оскільки , то нульова гіпотеза H0 не відкидається, отже, недоваженості покупцям описуються однією і тією ж функцією розподілу, тобто вони є стійким та закономірним процесом при продажу овочів у даному

місті. ►

 

Таблиця 3

Номер інтервалу Інтервали недоваженостей, г Частоти
для вибірки 1 для вибірки 2
0–10
10–20
20–30
30–40
40–50
50–60
60–70
70–80
80–90
Σ n1=110 n2=110

 

 

Якщо дані згруповані, то для перевірки однорідності двох чи кількох вибірок можна використовувати критерій . Нехай маємо l незалежних вибірок об’ємом ni (i=1,2,…,l) та дані вибірки згруповані в m інтервалів (груп), а nij – число елементів j-ї вибірки, що потрапила в і-й інтервал. Перевіряється гіпотеза H0 про те, що всі l вибірок вибрані з однієї і тієї ж генеральної сукупності. У якості статистики критерію використовується

величина

,

де .

У випадку справедливості гіпотези H0 статистика має розподіл з (m-1)(l-1) степенями вільності.

 

До рангових відносяться також ряд критеріїв перевірки гіпотез про стохастичну незалежність елементів вибірки, таких як: критерій серій, оснований на медіані вибірки; критерій Аббе та ін.

 

 

Додаток 2