Генеральної частки за великими вибірками

Теорема 3.1Ймовірність того, що відхилення вибіркового середньго (чи частки) не перевищить число Δ>0 (за абсолютною величиною), дорівнює:

, (3.4) де , , (3.5) де ,

- функція (інтеграл ймовірностей) Лапласа.

Доведення. Вибіркове середнє і вибіркова частка w повторної вибірки є сумою n незалежних випадкових величин , де має один і той самий закон розподілу – зі скінченним математичним сподіванням і дисперсією. Звідси, на основі теореми Ляпунова при розподіли і необмежено наближаються до нормальних (практично при розподіли і w можна вважати наближено нормальними). Для безповторної вибірки і w є сумою залежних випадкових величин. Можна показати, що і в цьому випадку при закон розподілу і w наближається до нормального.

Формули (3.4) і (3.5)випливають безпосередньо із властивості нормального закону . Ці формули отримали назву формул довірчої ймовірності для середнього та частки.

Означення 3.2 Середнє квадратичне відхилення вибіркового середнього та вибіркової частки власно-випадкової вибірки називається середньою квадратичною (стандартною) похибкою вибірки.

Наслідок 1 При заданій довірчій ймовірності γ гранична похибка вибірки дорівнює t-кратній величині середньої квадратичної похибки, де , тобто

,(3.6)

. (3.7)

Наслідок 2Інтервальні оцінки (довірчі інтервали) для генерального середнього і генеральної частки можуть бути знайдені за формулами:

(3.8)

(3.9)

Оскільки генеральні частка p і дисперсія невідомі, то в формулах табл. 3.1 заміняємо їх спроможними оцінками по вибірці – відповідно w і , бо при достатньо великому об’ємі вибірки n практично достовірно, що

 

Таблиця 3.1

Оцінюваний параметр Формули середніх квадратичних похибок вибірки
повторна вибірка безповторна вибірка
Середнє (3.10) (3.11)
Частка (3.12) (3.13)

 

 

При визначенні середньої квадратичної похибки вибірки для частки, якщо навіть w невідома, в якості pq можна взяти його максимально можливе значення .

◄ Приклад 3.3При дослідженні виробітку 1000 робітників цеху в звітному році у порівнянні з попереднім за схемою власно-випадкової вибірки було відібрано 100 робітників. Отримані наступні дані (див. перші дві графи табл. 1.1, розділ 1). Необхідно визначити: а) ймовірність того, що середній виробіток робітників цеху відрізняється від попереднього вибіркового не більше, ніж на 1% (за абсолютною величиною); б) межі, між якими з ймовірністю 0,9545 знаходиться середній виробіток робітників цеху. Розглянути випадки повторної і безповторної вибірки.

Розв’язання. а) Маємо , . Раніше в прикладі 1.8були обчислені , . Знайдемо середню квадратичну похибку вибірки для середнього:

для повторної вибірки для безповторної вибірки

Тепер шукану довірчу ймовірність знаходимо за (3.5):

(Значення знаходимо за стандартною таблицею, яку можна знайти в додатках будь – якої книжки, що запропонована у переліку використаної

літератури).

Отже, ймовірність того, що вибіркове середнє відрізняється від генерального середнього не більше, ніж на 1% (за абсолютною величиною),

дорівнює 0,715 для повторної і 0,741 для безповторної вибірок.

б) Знайдемо граничні похибки повторної і безповторної вибірок за формулою (2.22), в якій (знаходимо із співвідношення ).

. .

Тепер шуканий довірчий інтервал визначаємо за (3.8):

 

або . або .

Таким чином, з надійністю 0,9545 середній виробіток робітників цеху знаходиться в межах від 117,33 до 121,07%, якщо вибірка повторна, і від 117,03 до 120,97%, якщо вибірка безповторна.►

 

Об’єм вибірки

Для проведення вибіркового спостереження досить важливо правильно визначити об’єм вибірки n, який значною мірою визначає необхідні при цьому часові, трудові і вартісні витрати. Для визначення n необхідно задати надійність (довірчу ймовірність) оцінки γ і точність (граничну похибку вибірки) Δ.

Об’єм вибірки знаходиться з формули, що виражає граничну похибку вибірки через дисперсію ознаки. Наприклад, для повторної вибірки фо-

рмула має вигляд: , звідки , де . Аналогічно можуть бути отримані й інші формули об’єму вибірки, які зведемо в таблицю 3.2. Для визначення об’єму вибірки необхідно знати характеристики генеральної сукупності або , які невідомі, і для визначення яких передбачаєтся проведення вибіркового спостереження.

В якості цих характеристик зазвичай використовують вибіркові дані

або попереднього дослідження в аналогічних умовах, тобто вважають (або ) або .

 

 

Таблиця 3.2

Оцінюваний параметр Повторна вибірка Безповторна вибірка
Генеральне середнє (3.14) (3.15)
Генеральна частка (3.16) (3.17)

 

При оцінці генеральної частки (якщо про неї нічого невідомо) замість проведення пробної вибірки можна в якості взяти його максимально можливе значення, рівне 0,25, але при цьому необхідно враховувати, що знайдене значення об’єму вибірки буде більшим від мінімально необхідного для заданих точності та надійності оцінок.

 

◄ Приклад 3.4За умовою прикладу 3.3визначити об’єм вибірки, при якому із ймовірністю 0,9973 відхилення середнього виробітку робітників у вибірці від середнього виробітку всіх робітників цеху не перевищить 1% (за абсолютною величиною).

Розв’язання. В якості невідомого значення для визначення об’єму вибірки беремо його спроможну оцінку , знайдену раніше в прикладі 3.3. Враховуючи, що і , знайдемо об’єм повторної вибірки за (3.14), тобто . Об’єм безповторної вибірки за (3.15):

.

Як бачимо, при одній і тій самій точності і надійності

оцінки, об’єм безповторної вибірки значно менший, ніж повторної. ►



="5-72866.php">456
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • Далее ⇒