Генеральної частки за великими вибірками
Теорема 3.1Ймовірність того, що відхилення вибіркового середньго (чи частки) не перевищить число Δ>0 (за абсолютною величиною), дорівнює:
, (3.4)
де ,
| , (3.5)
де ,
|
- функція (інтеграл ймовірностей) Лапласа.
Доведення. Вибіркове середнє
і вибіркова частка w повторної вибірки є сумою n незалежних випадкових величин
, де
має один і той самий закон розподілу – зі скінченним математичним сподіванням і дисперсією. Звідси, на основі теореми Ляпунова при
розподіли
і
необмежено наближаються до нормальних (практично при
розподіли
і w можна вважати наближено нормальними). Для безповторної вибірки
і w є сумою залежних випадкових величин. Можна показати, що і в цьому випадку при
закон розподілу
і w наближається до нормального.
Формули (3.4) і (3.5)випливають безпосередньо із властивості нормального закону . Ці формули отримали назву формул довірчої ймовірності для середнього та частки.
Означення 3.2 Середнє квадратичне відхилення вибіркового середнього
та вибіркової частки
власно-випадкової вибірки називається середньою квадратичною (стандартною) похибкою вибірки.
Наслідок 1 При заданій довірчій ймовірності γ гранична похибка вибірки дорівнює t-кратній величині середньої квадратичної похибки, де
, тобто
,(3.6)
. (3.7)
Наслідок 2Інтервальні оцінки (довірчі інтервали) для генерального середнього і генеральної частки можуть бути знайдені за формулами:
(3.8)
(3.9)
Оскільки генеральні частка p і дисперсія
невідомі, то в формулах табл. 3.1 заміняємо їх спроможними оцінками по вибірці – відповідно w і
, бо при достатньо великому об’ємі вибірки n практично достовірно, що 
Таблиця 3.1
| Оцінюваний параметр | Формули середніх квадратичних похибок вибірки | |
| повторна вибірка | безповторна вибірка | |
| Середнє | (3.10)
| (3.11)
|
| Частка |
(3.12)
|
(3.13)
|
При визначенні середньої квадратичної похибки вибірки для частки, якщо навіть w невідома, в якості pq можна взяти його максимально можливе значення
.
◄ Приклад 3.3При дослідженні виробітку 1000 робітників цеху в звітному році у порівнянні з попереднім за схемою власно-випадкової вибірки було відібрано 100 робітників. Отримані наступні дані (див. перші дві графи табл. 1.1, розділ 1). Необхідно визначити: а) ймовірність того, що середній виробіток робітників цеху відрізняється від попереднього вибіркового не більше, ніж на 1% (за абсолютною величиною); б) межі, між якими з ймовірністю 0,9545 знаходиться середній виробіток робітників цеху. Розглянути випадки повторної і безповторної вибірки.
Розв’язання. а) Маємо
,
. Раніше в прикладі 1.8були обчислені
,
. Знайдемо середню квадратичну похибку вибірки для середнього:
для повторної вибірки
| для безповторної вибірки
|
Тепер шукану довірчу ймовірність знаходимо за (3.5):
|
|
(Значення
знаходимо за стандартною таблицею, яку можна знайти в додатках будь – якої книжки, що запропонована у переліку використаної
літератури).
Отже, ймовірність того, що вибіркове середнє відрізняється від генерального середнього не більше, ніж на 1% (за абсолютною величиною),
дорівнює 0,715 для повторної і 0,741 для безповторної вибірок.
б) Знайдемо граничні похибки повторної і безповторної вибірок за формулою (2.22), в якій
(знаходимо із співвідношення
).
.
| .
|
Тепер шуканий довірчий інтервал визначаємо за (3.8):
або .
|
або .
|
Таким чином, з надійністю 0,9545 середній виробіток робітників цеху знаходиться в межах від 117,33 до 121,07%, якщо вибірка повторна, і від 117,03 до 120,97%, якщо вибірка безповторна.►
Об’єм вибірки
Для проведення вибіркового спостереження досить важливо правильно визначити об’єм вибірки n, який значною мірою визначає необхідні при цьому часові, трудові і вартісні витрати. Для визначення n необхідно задати надійність (довірчу ймовірність) оцінки γ і точність (граничну похибку вибірки) Δ.
Об’єм вибірки знаходиться з формули, що виражає граничну похибку вибірки через дисперсію ознаки. Наприклад, для повторної вибірки фо-
рмула має вигляд:
, звідки
, де
. Аналогічно можуть бути отримані й інші формули об’єму вибірки, які зведемо в таблицю 3.2. Для визначення об’єму вибірки необхідно знати характеристики генеральної сукупності
або
, які невідомі, і для визначення яких передбачаєтся проведення вибіркового спостереження.
В якості цих характеристик зазвичай використовують вибіркові дані
або
попереднього дослідження в аналогічних умовах, тобто вважають
(або
) або
.
Таблиця 3.2
| Оцінюваний параметр | Повторна вибірка | Безповторна вибірка |
| Генеральне середнє | (3.14)
| (3.15)
|
| Генеральна частка | (3.16)
| (3.17)
|
При оцінці генеральної частки (якщо про неї нічого невідомо) замість проведення пробної вибірки можна в якості
взяти його максимально можливе значення, рівне 0,25, але при цьому необхідно враховувати, що знайдене значення об’єму вибірки буде більшим від мінімально необхідного для заданих точності та надійності оцінок.
◄ Приклад 3.4За умовою прикладу 3.3визначити об’єм вибірки, при якому із ймовірністю 0,9973 відхилення середнього виробітку робітників у вибірці від середнього виробітку всіх робітників цеху не перевищить 1% (за абсолютною величиною).
Розв’язання. В якості невідомого значення
для визначення об’єму вибірки беремо його спроможну оцінку
, знайдену раніше в прикладі 3.3. Враховуючи, що
і
, знайдемо об’єм повторної вибірки за (3.14), тобто
. Об’єм безповторної вибірки за (3.15):
.
Як бачимо, при одній і тій самій точності
і надійності 
оцінки, об’єм безповторної вибірки значно менший, ніж повторної. ►
, (3.4)
де
,
, (3.5)
де
,
(3.10)
(3.11)
(3.12)
(3.13)
.
.
або
.
або
.
(3.14)
(3.15)
(3.16)
(3.17)