Вибіркове спостереження, причини та умови його застосування

Так як статистика має справу з масовими яви­щами та процесами, то в ряді випадків їх дослідження може виявитись досить трудомістким. Крім того, ок­ремі методи контролю або випробувань пов'язані з руйнуванням зразків, що досліджуються. Виникає пи­тання про заміну суцільного спостереження вибір­ковим. Теорія і практика вказують на можливість і до­цільність такої заміни.

Вибіркове спостереження — науково об­грунтований засіб несуцільного спостереження, при якому досліджується лише частина сукупності, відіб­рана за певними правилами вибірки, і який забезпечує результати, що характеризують усю сукупність в цілому.

Сукупність, з якої провадять вибір одиниць, нази­вають генеральною, а відібрану частину ви­біркою.

Характеристики вибіркової сукупності є оцін­ками відповідних параметрів генеральної сукупності. Але вибірка не точно відтворює генеральну сукупність, і тому оцінки не співпадають із самими параметрами. Розбіжності між ними називаються помилками репрезентативності. Вони бувають систематич­ними та випадковими. Систематичні помилки виникають, коли при формуванні вибіркової сукуп­ності не був дотриманий принцип випадковості відбору, який забезпечує всім елементам генеральної сукупності рівні можливості потрапити у вибірку. Сис­тематичні помилки для всіх елементів сукупності ма­ють односторонній напрям і тому їх називають по­милками зміщення. На відміну від них, помилки, які неминуче виникають і при додержанні принципу ви­падковості відбору, але не носять тенденційного ха­рактеру, мають назву випадкових і не ведуть до зміщення оцінок.

При проведенні вибіркового обстеження важливо уникнути систематичних помилок; властиві вибір­ковому спостереженню випадкові помилки неминучі, проте теорія дає можливість з певною імовірністю ви­значити їх межі.

Вибірка буде репрезентативною не тільки тоді, ко­ли кожна одиниця матиме однаковий шанс потрапити до неї, а й коли обсяг її є достатнім.

 

 

Види та схеми відбору.

Існують різні види та схеми відбору, їх особли­вості впливають на розмір помилки та методи її об­числення.

Розрізняють такі види відбору.

Простий випадковий відбір здійснюють за допомогою жереба або таблиць випадкових чисел. По­требує для свого проведення ретельної підготовки.

Систематичний (механічний) відбір передбачає представлення усієї сукупності у вигляді спи­ску, упорядкованому за деякою нейтральною одини-їею. Вибір елементів здійснюється через рівні нтервали. Так, якщо необхідно провести 10-процентну вибірку студентів, то складається список прізвищ за алфавітом і механічно відбирається кожний десятий студент. Початковий елемент вибирають як випадкове число з першого інтервалу, наприклад б, Тоді вибираємо елементи: 6, 16, 26, і т. д. Можна ска­зати, що цей метод являє собою різновид поперед нь-ого, але його легше організувати.

Типовий (розшарований)відбір орієнтований на забезпечення представництва у вибірці відповідних типових груп генеральної сукупності. При цьому вся сукупність розбивається (розшаровується) на одно­типні, однорідні групи. Потім з кожної групи за од­ним із вказаних вище методів відбирається кількість одиниць, пропорційних питомій вазі групи в загальній сукупності.

Серійний відбір полягає в тому, що відбираються не окремі одиниці, а цілі групи (серії, гнізда), відіб­рані випадковим або механічним методом. У кожній такій групі провадять суцільне обстеження, а резуль­тати розповсюджують на всю сукупність. Такий спосіб відбору застосовують, наприклад, при перевірці якості продукції того чи іншого цеху (підприємства).

Застосування того чи іншого способу формування вибіркової сукупності залежить від мети вибіркового обстеження, умов його організації та проведення. Найбільш поширені є комбіновані вибірки.

Схемивідбору бувають такими.

Повторнийвідбір — при цьому кожна відібрана одиниця повертається у сукупність і може знову по­трапити у вибірку.

Безповторнийвідбір — кожна відібрана оди­ниця не повертається у сукупність.

На практиці широко застосовують моментні спостереження, при яких обстеженню підлягають усі елементи сукупності (суцільне спостереження), але на певні моменти часу. Тому поняття генеральної і ви­біркової сукупності відносяться до часу спостере­ження, а не до сукупності, яка вивчається. Моментні спостереження широко застосовуються при вивченні структури витрат робочого часу.

 

 

Помилки вибірки

Спочатку наведемо основні умовні позначення. Чисельність одиниць генеральної сукупності позна­чимо через N, вибіркової — п. Узагальнюючі характе­ристики генеральної сукупності - середня, дисперсія, частка — називаються генеральнимиі відповідно позначаються х , а2, р, де р - відношення числа М одиниць, що мають дану ознаку, до загальної чисель­ності генеральної сукупності (N), р = M/N.

Узагальнюючі характеристики вибіркової сукуп­ності мають назву вибіркових і відповідно познача­ються х , W, де W=m/n.

Теорія обчислення випадкових помилок базується на працях видатних вчених Я. Бернуллі, С. Пуассона, П.Л. Чебишева, А.А. Маркова, A.M. Ляпунова та ін.

Закон великих чисел- загальний принцип, згідно з яким сукупна дія великого числа незалежних факторів призводить до результату, який майже не за­лежить від випадку. В соціально-економічній стати­стиці це може бути сформульовано так: кількісні за­кономірності, які властиві масовим явищам, виразно проявляються лише при достатньо великому числі спостережень.

У кожній окремій вибірці із усіх можливих випад­кова помилка вибірки може приймати різні зна­чення. При великій кількості спостережень розподіл випадкових помилок середньої величини і частки на­ближається до нормального.

Отже, можна вести мову про середнюпомилку вибірки. Доведено, що при простому випадковому відборі, проведеному за системою повторного відбору:

Якщо вибіркове спостереження застосовується для визначення частки ознаки, то середня помилка частки обчислюється за формулою

Використовуючи функцію нормального розподілу, можна обчислити імовірність граничної помилки пев­ного розміру. Так, імовірність того, що в окремій ви­бірці помилка не перевищить 2 µ, становить 0,954, а не перевищить 3 µ — 0,997.

У наведених формулах та pq - характеристики генеральної сукупності, котрі при вибірковому спосте­реженні невідомі. На практиці їх замінюють вибірко­вими характеристиками.

При безповторному відборі середня помилка ви­бірки дорівнює:

а помилка частки:

Для вирішення практичних завдань обчислення се­редньої помилки вибірки недостатньо, тому визнача­ють граничний для певної імовірності розмір ви­біркової помилки , де t — квантиль нормаль­ного розподілу, який називають коефіцієнтом довіри.

Розглянемо приклади визначення граничної по­милки середньої та частки.

Приклад 4.1

З отари овець загальною чисельністю 1000 голів (N) вибірковій контрольній стрижці було піддано 100 голів (n) середній настриг вовни при цьому становив 4,2 кг на одну вівцю при середньому квадратичному відхиленні 1,5 кг. Визначити межі, в яких знаходиться середній настриг вовни для усіх 1000 голів з імовірні­стю 0,954 (t = 2).

У даному разі маємо простий випадковий відбір, до того ж, зрозуміло, безповторний. Підставимо дані у відповідні формули:

кг

кг

Тоді одне із можливих значень, в межах яких може знаходитись середній настриг вовни, розраховуєтся за формулою

У загальному вигляді це записується таким чином:

= 4,2 ± 0,284,

що дорівнює:

3,92 х 4,48.

Таким чином, на підставі проведеної вибірки га­рантуємо, що у 954 випадках із 1000 середній настриг вовни буде знаходитися в межах: від 3,9 до 4,4 кг на одну вівцю.

Приклод 4.2

Для визначення якості продукції відібрано 500 одиниць з 10 000. Серед них виявлено 50 виробів тре­тього сорту. Визначити граничну помилку частки з імовірністю 0,997.

Маємо, що частка виробів третього сорту становить

W= 50/500 = 0,1,

тоді частка першого та другого сортів становить

p=l-W=l-0,1 =0,9.

Підставимо дані в формулу для простого випадко­вого безповторного відбору:

р = 0,9 ±3-0,0131.

Таким чином, на підставі проведеної вибірки вста­новлено, що середній відсоток виробів третього сорту становить 10 % з можливим відхиленням в той чи інший бік на 3,9 %. З імовірністю 0,997 можна ствер­джувати, що середній відсоток виробів третього сорту в усій партії буде знаходитись у межах

р = 10% ± 3,9%, тобто 6,1% ÷ 13,9%.

Наведені вище формули середньої та граничної помилки вибірки застосовують при випадковому та механічному відборах.

При типовому відборі гранична помилка визна­чається за такими формулами (табл. 4.1).

Таблиця 4.1

Граничні помилки вибірки при типовому відборі

Схема відбору Гранична помилка вибірки
Для середньої Для частки
повторний
безповторний

 

Якщо порівняти їх з формулами для випадкового відбору, то виявиться, що замість дисперсії і частки, що визначаються для вибіркової сукупності в цілому, при типовому відборі необхідно обчислити середні з групових дисперсій і частки, що отримані для кожної групи:

 

Приклад 4.3

Проведена 10-процентна типова вибірка, пропор­ційна чисельності відібраних груп робітників (табл. 4.2).

Визначити з імовірністю 0,954 межі, в яких знахо­диться середній відсоток виконання норм робітниками в цілому. Вибірка безповторна.

Таблиця 4.2

Характеристика вибірки робітників

Групи робітників за спеціальністю Чисельність, чол. Середнє вико­нання норми,% Середнє квадратичне відхилення.%
Т
С
ф

 

Обчислимо загальний середній відсоток виконання норми робітниками, які потрапили у вибірку:

Визначимо середню із групових дисперсій:

Гранична помилка вибіркової середньої для ти­пового відбору:

Де N = 1 500, так як вибірка 10-процентна.

Таким чином, з імовірністю 0,954 можна стверджу­вати, що середній відсоток виконання норм робіт­никами заводу в цілому знаходиться в межах

= 103,7 ±0,581,

звідси

103,1 ≤х≤ 104,3.

При серійному відборі з рівновеликими серіями гранична помилка визначається за формулами наведе­ними в табл. 4.3, де S — загальне число серій у су­купності. У даному випадку кожна серія являється одиницею сукупності, і мірою коливання буде міжсерійна вибіркова дисперсія:

де — середня для кожної серії; — загальна вибір­кова середня, s — число відібраних серій.

Таблиця 4.3

Граничні помилки вибірки при серійному відборі

Схема відбору Гранична помилка вибірки
Для середньої Для частки
повторний
безповторний

 

Якщо порівняти їх із формулами для випадкового відбору, то виявиться, що замість дисперсії і частки, які визначаються для вибіркової сукупності в цілому, при серійному відборі необхідно обчислити міжгру-пову дисперсію середньої і частки.

 

Приклад 4.4

Для визначення середньої врожайності цукрового буряка в області проведена 20-процентна серійна вибірка, до якої відійшло 5 районів із 25. Середня врожайність для кожного району становила: 250, 260, 275, 280, 300 ц/га з площі 800, 1000, 1200, 1200 і 2800 га відповідно. Визначити з ймовірністю 0,954 межі, в яких буде знаходитись середня врожайність цукрового буряка по області.

Спочатку знайдемо загальну середню:

ц/га

Визначимо міжсерійну дисперсію:

Розрахуєм граничну помилку серійного безповторного вибору:

ц/га

Отже, з ймовірністю 0,954 можна стверджувати, що середня врожайність цукрового буряка по області буде знаходитись в межах від 272,66 ц/га до 287,34 ц/га. Таким чином розраховуються середня і гранична по­милки для частки.