Поняття дизайну вибірки. Способи формування вибірки

 

Після визначення необхідного обсягу вибірки здійснюють розробку її дизайну. Дизайн (план) вибірки – це організаційно-логічна модель структури вибіркової сукупності та принципи її формування.

Розробка дизайну вибірки передбачає з’ясування таких основних запитань:

- стратифікація генеральної сукупності;

- схема ротації одиниць вибірки;

- обсяг вибірки;

- механізм формування вибірки.

Основою дизайну вибірки є спосіб її формування. В залежності від основи вибірки у практиці вибіркових обстежень використовують різні способи формування вибіркових сукупностей, зокрема:

· простий випадковий,

· механічний (систематичний),

· розшарований (районований, типовий, стратифікований),

· серійний.

Суть та особливості кожного з цих способів, а також формули, за якими обчислюють похибки вибірки при їх застосуванні наведені у таблиці 4.

У практиці вибіркових обстежень найпоширенішими є багатоступеневі вибірки, які поєднують різні способи добору: механічний і серійний, розшарований і механічний, простий випадковий і серійний. Поєднання способів добору забезпечує високу репрезентативність результатів з найменшими витратами на організацію та проведення досліджень. Той чи інший спосіб відбору або схема багатоступеневої вибірки можуть бути вибрані тільки після попереднього ознайомлення з генеральною сукупністю і її частинами.

 


Таблиця 4

Способи формування вибірки, що забезпечують її репрезентативність

 

Назва та суть способу Обчислення похибок вибірки
Простий випадковий відбір   Класичний спосіб формування вибіркової сукупності, на якому ґрунтується теорія вибіркового методу. Здійснюється шляхом жеребкування, використання таблиці випадкових чисел чи програми-генератора випадкових чисел або ж за допомогою прикладних програм (наприклад, табличного редактора Microsoft Excel (інструмент “Вибірка” в Аналізі даних) Випадкового відбір передбачає попередню нумерацію одиниць генеральної сукупності.   Для повторного відбору   Для безповторного добору   де t – квантиль розподілу ймовірностей (довірче число для заданого значення ймовірності Р, див. табл. 8.1); стандартна похибка вибірки; - дисперсія, обчислена за даними вибірки; n та N – обсяг вибіркової та генеральної сукупностей відповідно, p – частка значень альтернативної ознаки, обчислена за даними вибірки, q=1-p.  

Продовження таблиці 4

 

Назва та суть способу Обчислення похибок вибірки
Механічний (систематичний) відбір   Одиниці генеральної сукупності необхідно спочатку упорядкувати та пронумерувати. Добір елементів здійснюють через однакові інтервали, шириною 1/D=N/n. Початковий елемент добору визначають як випадкове число всередині першого інтервалу жеребкуванням (іноді розпочинають із середини інтервалу), другий елемент залежить від початкового числа і кроку інтервалу. За циклічних коливань значень ознаки, цикл коливань яких збігається з інтервалом, можливе зміщення похибки.  
Розшарований (стратифікований)   Передбачає попередню стратифікацію генеральної сукупності та незалежний добір елементів у кожній страті. У якості ознак стратифікації на основі попереднього факторного аналізу вибирають ті, що найбільше впливають на варіацію досліджуваних ознак в обстеженні. Обсяг розшарованої вибірки – це сума частинних вибірок nj, тобто – середня з групових дисперсій:

Продовження табл. 4

 

Назва та суть способу Обчислення похибок вибірки
, де m кількість складових частин ( районів, страт) вибірки. Найчастіше використовують пропорційний добір, який передбачає однакове для всіх складових частин представництво у вибірці. Обсяг частинних вибірок у цьому випадку визначається як , де D=n/N – частка вибірки. Оптимальним щодо мінімізації похибки вибірки за розшарованого добору є добір, пропорційний чисельності групи Nj і середньому квадратичному відхиленню ознаки, яка вивчається у цій групі sj. Обсяг частинних вибірок визначається при цьому за формулою . Розшарування (типізація) сукупності зменшує похибку вибірки. Чим щільніший зв’язок між ознаками, яка вивчається у вибірці і за якою проводиться розшарування генеральної сукупності, тим помітніше зменшення похибки вибірки. Наприклад, у вивченні середнього доходу малих підприємств їх стратифікують за видами діяльності.  

Закінчення табл. 4