Тема 9. Вибіркове спостереження
Вибіркове спостереження – вид несуцільного спостереження, при якому обстежуються не всі елементи сукупності, що вивчається, а лише певним чином дібрана їх частина.
Сукупність, з якої вибирають елементи для обстеження, називається генеральною, а сукупність, яку безпосередньо обстежують, – вибірковою.
Статистичні характеристики вибіркової сукупності розглядаються як оцінки відповідних характеристик генеральної сукупності.
Об'єктивною гарантією того, що вибірка репрезентує (представляє) всю сукупність, є принцип випадковості вибору, який забезпечує всім елементам генеральної сукупності рівні можливості потрапити у вибірку.
Оскільки вибіркова сукупність не точно відтворює склад генеральної, то вибіркові оцінки не збігаються з відповідними характеристиками генеральної сукупності. Розбіжності між ними називають похибками репрезентативності: для середньої – це різниця між генеральною та вибірковою середніми, для частки – різниця між генеральною і вибірковою частками тощо.
Розрізняють два типи оцінок параметрів генеральної сукупності – точкові та інтервальні.
Точкова оцінка – це значення параметра за даними вибірки: вибіркова середня
або вибіркова частка р.
Інтервальна оцінка – це інтервал значень параметра, розрахований за даними вибірки для певної імовірності (довірчий інтервал).
Межі довірчого інтервалу визначають на основі точкової оцінки та граничної помилки вибірки (
):
- для середнього значення ознаки:

,
де
– середнє значення ознаки в генеральній сукупності;
– середнє значення ознаки у вибірці;
– гранична помилка вибірки для середнього значення.
- для частки ознаки:

,
де Р – частка ознаки в генеральній сукупності;
р – частка ознаки у вибірці;
– гранична помилка вибірки для частки.
Гранична помилка – найбільша помилка, яка може виникнути при заданій імовірності:
,
де
– середня (стандартна помилка);
– коефіцієнт довіри для заданого рівня імовірності:
- для імовірності 0,683
= 1;
- для імовірності 0,954
= 2;
- для імовірності 0,997
= 3.
Можливі формули середньої помилки наведено в таблиці:
| Повторна вибірка | Безповторна вибірка | |
| Для середнього значення ознаки |
|
|
| Для частки ознаки |
|
|
де
– дисперсія (для частки обчислюється за формулою дисперсії альтернативної атрибутивної ознаки);
n – обсяг вибірки;
N – обсяг генеральної сукупності.
Під час проведення вибіркового спостереження визначають мінімальний обсяг вибірки, за якого вибіркові оцінки можуть репрезентувати основні властивості генеральної сукупності:
- для повторного відбору:
;
- для безповторного відбору:
.
1. За даними 10%-го безповторного вибіркового обстеження отримано такий розподіл робітників за стажем їх роботи:
| Стаж роботи, років | Кількість робітників, чол. |
| До 4 | |
| 4–8 | |
| 8–12 | |
| 12 і більше | |
| Разом |
Визначити:
1) середній стаж роботи у вибірці,
2) межі довірчого інтервалу для середнього стажу роботи у генеральній сукупності (з імовірністю 0,954),
3) частку робітників у вибірці, стаж роботи яких не перевищує 8 років,
4) межі довірчого інтервалу для частки робітників у генеральній сукупності, стаж яких не перевищує 8 років (з імовірністю 0,954).
Всі необхідні обчислення виконати в таблиці:
| Стаж роботи, років | Кількість робітників, чол. ( f ) | Середина інтервалу ( х ) | х f |
|
| До 4 | ||||
| 4–8 | ||||
| 8–12 | ||||
| 12 і більше | ||||
| Разом | х |
1. Обчислити середнє значення стажу роботи у вибірці за формулою середньої арифметичної зваженої:

2. Межі довірчого інтервалу для середнього стажу роботи у генеральній сукупності обчислити на основі формули:
,
причому значення
– з пункту 1,
– граничну помилку безповторної вибірки обчислити за формулою:
=
Для підстановки в наведену вище формулу невідоме значення дисперсії стажу роботи обчислити за формулою:
=
За виконаними розрахунками побудувати довірчий інтервал:

.
Висновок: з імовірністю 0,954 можна стверджувати, що середній стаж роботи в генеральній сукупності знаходиться в межах від _______ років до ________ років.
3. Частку робітників у вибірці, стаж роботи яких не перевищує 8 років, знайти за формулою відносної величини структури як співвідношення кількості робітників перших двох груп та загальної кількості робітників:

4. Межі довірчого інтервалу для частки робітників у генеральній сукупності, стаж роботи яких не перевищує 8 років:
,
де Р – частка ознаки в генеральній сукупності;
р – частка ознаки у вибірці;
– гранична помилка вибірки для частки.
Визначити граничну помилку безповторної вибірки для частки ознаки:
,
де
– коефіцієнт довіри для заданої імовірності. Для імовірності 0,997
= ____.
– дисперсія частки,
– обсяг вибірки = 68 робітників,
– частка вибірки. За умовою
= 10 % = 0,1.
Спочатку дисперсію частки знайти за формулою дисперсії альтернативної атрибутивної ознаки:

=
На підставі виконаних розрахунків побудувати довірчий інтервал:


.
Висновок:з імовірністю 0,997 можна стверджувати, що частка робітників, стаж роботи яких не перевищує 8 років, у генеральній сукупності знаходиться в межах від _______ до ________ .
2. Проведено 5 %-не вибіркове обстеження робітників заводу щодо їх заробітної плати. Одержано такий розподіл робітників:
| Заробітна плата, грн | Кількість робітників, чол. |
| До 1200 | |
| 1200 – 1400 | |
| 1400 – 1600 | |
| 1600 – 1800 | |
| 1800 і більше |
З імовірністю 0,954 побудувати довірчі інтервали:
- для середнього розміру заробітної плати;
- для частки робітників, заробітна плата яких не перевищує 1400 грн.
Розв’язок задачі аналогічний розв’язку задачі № 1. Всі необхідні обчислення виконати в таблиці:
| Разом |
Висновок:
3. З 3000 спеціалізованих магазинів необхідно відібрати певну їх кількість для визначення середньої кількості покупців на 1 магазин. Гранична помилка вибірки з імовірністю 0,954 становить 20 чол. за середньоквадратичного відхилення 45 чол. Визначити достатню чисельність вибірки.
Висновок: достатньо відібрати ____________ магазини.