Перевірка гіпотез про однорідність вибірок
Гіпотези про однорідність вибірок – це гіпотези про те, що вибірки, що розглядаються, вибрані з однієї і тієї ж генеральної сукупності. Нехай маємо дві незалежні вибірки, зроблені з генеральних сукупностей з невідомими теоретичними функціями розподілу F1(x) та F2(x). Нульова гіпотеза, що перевіряється, має вигляд H0: F1(x) = F2(x) проти конкуруючої H1: Будемо вважати, що функції F1(x) та F2(x) неперервні.
Критерій Колмогорова-Смирнова використовує ту ж ідею, що і критерій Колмогорова, але тільки в критерії Колмогорова порівнюється емпірична функція розподілу з теоретичною, а в критерії Колмогорова-Смирнова порівнюються дві емпіричні функції розподілу.
Статистика Колмогорова-Смирнова має вигляд:
,
де та
– емпіричні функції розподілу, побудовані за двома вибірками об’ємів n1 та n2. Гіпотеза H0 відкидається, якщо фактичне значення статистики
, що спостерігається, більше критичного
, тобто
, та приймається в іншому випадку. При малих об’ємах вибірок (
) критичні значення
заданих рівнів значущості критерію можна знайти у спеціальних таблицях. При
(а практично при
) розподіл статистики
сходиться до розподілу Колмогорова для статистики
. Тому гіпотеза H0 відкидається на рівні значущості α, якщо фактично значення
, що спостерігається, більше критичного
, тобто
, та приймається в протилежному випадку.
◄Приклад 5Протягом місяця вибірково здійснювалась перевірка торгових точок міста з продажу овочів. Результати двох перевірок за недоваженостями покупцям одного виду овочів приведені в табл. 3. Чи можна вважати, що на рівні значущості α=0,05 за результатами двох перевірок (випадкових вибірок) недоваженості овочів описуються однією і тією ж функцією розподілу?
Розв’язання. Позначимо: та
– накопичені частоти відповідно вибірок 1 та 2;
– значення їхніх емпіричних функцій розподілу. Результати обчислень зведемо у табл. 4. З останнього стовпчика випливає, що
. За формулою значення статистики, що спостерігається, при n1=110, n2=100
. За табл.1 при α=0,05, λ0,05=1,36. Оскільки
, то нульова гіпотеза H0 не відкидається, отже, недоваженості покупцям описуються однією і тією ж функцією розподілу, тобто вони є стійким та закономірним процесом при продажу овочів у даному
місті. ►
Таблиця 3
Номер інтервалу | Інтервали недоваженостей, г | Частоти | |
![]() | ![]() | ||
0–10 | |||
10–20 | |||
20–30 | |||
30–40 | |||
40–50 | |||
50–60 | |||
60–70 | |||
70–80 | |||
80–90 | |||
Σ | n1=110 | n2=110 |
Якщо дані згруповані, то для перевірки однорідності двох чи кількох вибірок можна використовувати критерій . Нехай маємо l незалежних вибірок об’ємом ni (i=1,2,…,l) та дані вибірки згруповані в m інтервалів (груп), а nij – число елементів j-ї вибірки, що потрапила в і-й інтервал. Перевіряється гіпотеза H0 про те, що всі l вибірок вибрані з однієї і тієї ж генеральної сукупності. У якості статистики критерію використовується
величина
,
де .
У випадку справедливості гіпотези H0 статистика має розподіл з (m-1)(l-1) степенями вільності.
До рангових відносяться також ряд критеріїв перевірки гіпотез про стохастичну незалежність елементів вибірки, таких як: критерій серій, оснований на медіані вибірки; критерій Аббе та ін.
Додаток 2