Генеральної частки за великими вибірками
Теорема 3.1Ймовірність того, що відхилення вибіркового середньго (чи частки) не перевищить число Δ>0 (за абсолютною величиною), дорівнює:
![]() ![]() | ![]() ![]() |
- функція (інтеграл ймовірностей) Лапласа.
Доведення. Вибіркове середнє і вибіркова частка w повторної вибірки є сумою n незалежних випадкових величин
, де
має один і той самий закон розподілу – зі скінченним математичним сподіванням і дисперсією. Звідси, на основі теореми Ляпунова при
розподіли
і
необмежено наближаються до нормальних (практично при
розподіли
і w можна вважати наближено нормальними). Для безповторної вибірки
і w є сумою залежних випадкових величин. Можна показати, що і в цьому випадку при
закон розподілу
і w наближається до нормального.
Формули (3.4) і (3.5)випливають безпосередньо із властивості нормального закону . Ці формули отримали назву формул довірчої ймовірності для середнього та частки.
Означення 3.2 Середнє квадратичне відхилення вибіркового середнього та вибіркової частки
власно-випадкової вибірки називається середньою квадратичною (стандартною) похибкою вибірки.
Наслідок 1 При заданій довірчій ймовірності γ гранична похибка вибірки дорівнює t-кратній величині середньої квадратичної похибки, де , тобто
,(3.6)
. (3.7)
Наслідок 2Інтервальні оцінки (довірчі інтервали) для генерального середнього і генеральної частки можуть бути знайдені за формулами:
(3.8)
(3.9)
Оскільки генеральні частка p і дисперсія невідомі, то в формулах табл. 3.1 заміняємо їх спроможними оцінками по вибірці – відповідно w і
, бо при достатньо великому об’ємі вибірки n практично достовірно, що
Таблиця 3.1
Оцінюваний параметр | Формули середніх квадратичних похибок вибірки | |
повторна вибірка | безповторна вибірка | |
Середнє | ![]() | ![]() |
Частка | ![]() | ![]() |
При визначенні середньої квадратичної похибки вибірки для частки, якщо навіть w невідома, в якості pq можна взяти його максимально можливе значення .
◄ Приклад 3.3При дослідженні виробітку 1000 робітників цеху в звітному році у порівнянні з попереднім за схемою власно-випадкової вибірки було відібрано 100 робітників. Отримані наступні дані (див. перші дві графи табл. 1.1, розділ 1). Необхідно визначити: а) ймовірність того, що середній виробіток робітників цеху відрізняється від попереднього вибіркового не більше, ніж на 1% (за абсолютною величиною); б) межі, між якими з ймовірністю 0,9545 знаходиться середній виробіток робітників цеху. Розглянути випадки повторної і безповторної вибірки.
Розв’язання. а) Маємо ,
. Раніше в прикладі 1.8були обчислені
,
. Знайдемо середню квадратичну похибку вибірки для середнього:
для повторної вибірки
![]() | для безповторної вибірки
![]() |
Тепер шукану довірчу ймовірність знаходимо за (3.5):
![]() | ![]() |
(Значення знаходимо за стандартною таблицею, яку можна знайти в додатках будь – якої книжки, що запропонована у переліку використаної
літератури).
Отже, ймовірність того, що вибіркове середнє відрізняється від генерального середнього не більше, ніж на 1% (за абсолютною величиною),
дорівнює 0,715 для повторної і 0,741 для безповторної вибірок.
б) Знайдемо граничні похибки повторної і безповторної вибірок за формулою (2.22), в якій (знаходимо із співвідношення
).
![]() | ![]() |
Тепер шуканий довірчий інтервал визначаємо за (3.8):
![]() ![]() | ![]() ![]() |
Таким чином, з надійністю 0,9545 середній виробіток робітників цеху знаходиться в межах від 117,33 до 121,07%, якщо вибірка повторна, і від 117,03 до 120,97%, якщо вибірка безповторна.►
Об’єм вибірки
Для проведення вибіркового спостереження досить важливо правильно визначити об’єм вибірки n, який значною мірою визначає необхідні при цьому часові, трудові і вартісні витрати. Для визначення n необхідно задати надійність (довірчу ймовірність) оцінки γ і точність (граничну похибку вибірки) Δ.
Об’єм вибірки знаходиться з формули, що виражає граничну похибку вибірки через дисперсію ознаки. Наприклад, для повторної вибірки фо-
рмула має вигляд: , звідки
, де
. Аналогічно можуть бути отримані й інші формули об’єму вибірки, які зведемо в таблицю 3.2. Для визначення об’єму вибірки необхідно знати характеристики генеральної сукупності
або
, які невідомі, і для визначення яких передбачаєтся проведення вибіркового спостереження.
В якості цих характеристик зазвичай використовують вибіркові дані
або
попереднього дослідження в аналогічних умовах, тобто вважають
(або
) або
.
Таблиця 3.2
Оцінюваний параметр | Повторна вибірка | Безповторна вибірка |
Генеральне середнє | ![]() | ![]() |
Генеральна частка | ![]() | ![]() |
При оцінці генеральної частки (якщо про неї нічого невідомо) замість проведення пробної вибірки можна в якості взяти його максимально можливе значення, рівне 0,25, але при цьому необхідно враховувати, що знайдене значення об’єму вибірки буде більшим від мінімально необхідного для заданих точності та надійності оцінок.
◄ Приклад 3.4За умовою прикладу 3.3визначити об’єм вибірки, при якому із ймовірністю 0,9973 відхилення середнього виробітку робітників у вибірці від середнього виробітку всіх робітників цеху не перевищить 1% (за абсолютною величиною).
Розв’язання. В якості невідомого значення для визначення об’єму вибірки беремо його спроможну оцінку
, знайдену раніше в прикладі 3.3. Враховуючи, що
і
, знайдемо об’єм повторної вибірки за (3.14), тобто
. Об’єм безповторної вибірки за (3.15):
.
Як бачимо, при одній і тій самій точності і надійності
оцінки, об’єм безповторної вибірки значно менший, ніж повторної. ►