Перевірка гіпотез про однорідність вибірок

Гіпотези про однорідність вибірок – це гіпотези про те, що вибірки, що розглядаються, вибрані з однієї і тієї ж генеральної сукупності. Нехай маємо дві незалежні вибірки, зроблені з генеральних сукупностей з невідомими теоретичними функціями розподілу F₁(x) та F₂(x). Нульова гіпотеза, що перевіряється, має вигляд H₀: F₁(x) = F₂(x) проти конкуруючої H₁: Будемо вважати, що функції F₁(x) та F₂(x) неперервні.

Критерій Колмогорова-Смирнова використовує ту ж ідею, що і критерій Колмогорова, але тільки в критерії Колмогорова порівнюється емпірична функція розподілу з теоретичною, а в критерії Колмогорова-Смирнова порівнюються дві емпіричні функції розподілу.

Статистика Колмогорова-Смирнова має вигляд:

де та – емпіричні функції розподілу, побудовані за двома вибірками об’ємів n₁ та n₂. Гіпотеза H₀ відкидається, якщо фактичне значення статистики , що спостерігається, більше критичного , тобто , та приймається в іншому випадку. При малих об’ємах вибірок ( ) критичні значення заданих рівнів значущості критерію можна знайти у спеціальних таблицях. При (а практично при ) розподіл статистики сходиться до розподілу Колмогорова для статистики . Тому гіпотеза H₀ відкидається на рівні значущості α, якщо фактично значення , що спостерігається, більше критичного , тобто , та приймається в протилежному випадку.

◄Приклад 5Протягом місяця вибірково здійснювалась перевірка торгових точок міста з продажу овочів. Результати двох перевірок за недоваженостями покупцям одного виду овочів приведені в табл. 3. Чи можна вважати, що на рівні значущості α=0,05 за результатами двох перевірок (випадкових вибірок) недоваженості овочів описуються однією і тією ж функцією розподілу?

Розв’язання. Позначимо: та – накопичені частоти відповідно вибірок 1 та 2; – значення їхніх емпіричних функцій розподілу. Результати обчислень зведемо у табл. 4. З останнього стовпчика випливає, що . За формулою значення статистики, що спостерігається, при n₁=110, n₂=100 . За табл.1 при α=0,05, λ_0,05=1,36. Оскільки , то нульова гіпотеза H₀ не відкидається, отже, недоваженості покупцям описуються однією і тією ж функцією розподілу, тобто вони є стійким та закономірним процесом при продажу овочів у даному

місті. ►

Таблиця 3

Номер інтервалу	Інтервали недоваженостей, г	Частоти
для вибірки 1	для вибірки 2
	0–10
	10–20
	20–30
	30–40
	40–50
	50–60
	60–70
	70–80
	80–90
Σ	n₁=110	n₂=110

Якщо дані згруповані, то для перевірки однорідності двох чи кількох вибірок можна використовувати критерій . Нехай маємо l незалежних вибірок об’ємом n_i (i=1,2,…,l) та дані вибірки згруповані в m інтервалів (груп), а n_ij – число елементів j-ї вибірки, що потрапила в і-й інтервал. Перевіряється гіпотеза H₀ про те, що всі l вибірок вибрані з однієї і тієї ж генеральної сукупності. У якості статистики критерію використовується

величина

де .

У випадку справедливості гіпотези H₀ статистика має розподіл з (m-1)(l-1) степенями вільності.

До рангових відносяться також ряд критеріїв перевірки гіпотез про стохастичну незалежність елементів вибірки, таких як: критерій серій, оснований на медіані вибірки; критерій Аббе та ін.

Додаток 2