Переваги вибіркового методу
1. Дозволяє суттєво економити на витраті ресурсів (матеріальних, трудових, часових);
2. Являється єдино можливиму випадку нескінченної генеральної сукупності чи у випадку, коли дослідження пов’язане зі знищенням об’єктів, за якими ведеться спостереження (наприклад, дослідження довговічності електричних лампочок, граничних режимів роботи приладів і т.п.);
3. При тих самих витратах ресурсів дає можливість проведення поглибленого дослідження за рахунок розширення програми дослідження;
4. Дозволяє знизити похибки реєстрації, тобто розбіжності між істинним та зареєстрованим значеннями ознаки.
Основний недолік вибіркового методу – похибки дослідження, чи похибки репрезентативності (представництва).
Для того, щоб за даними вибірки мати можливість робити висновки про генеральну сукупність, вона повинна бути вибрана випадково. Випадковість відбору елементів у вибірку досягається дотриманням принципу рівної можливості всім елементам генеральної сукупності бути відібраними. На практиці це досягається тим, що постачання елементів у вибірку проводиться методом жеребкування (лотереї) чи за допомогою випадкових чисел, що містяться у спеціальних таблицях, чи вироблених ЕОМ за допомогою датчика випадкових чисел.
Вибірка називається репрезентативною(представницькою), якщо вона достатньо добре відтворює генеральну сукупність.
Розрізняють наступні види вибірок:
1. власно-випадкова вибірка, утворена випадковим вибором елементів
без роздроблення на частини чи групи;
2. механічна вибірка, в яку елементи з генеральної сукупності вибира-
ються через певний інтервал. Наприклад, якщо об’єм вибірки має складати 10% (10%-на вибірка), то відбирається кожний 10-й її елемент і т.д.;
3. типова (стратифікована) вибірка, в яку випадковим чином відбира-
ються елементи з типових груп, на які за деякою ознакою розбивається генеральна сукупність;
4. серійна (гніздова) вибірка, в яку випадковим чином відбираються не
елементи, а цілі групи сукупності (серії), а самі серії підлягають загальному спостереженню.
Використовують два способи утворення вибірки:
- повторний відбір(за схемою поверненої кулі), коли кожен елемент, випадково відібраний і досліджений, повертається у загальну сукупність і може бути повторно відібраним;
- безповторний відбір(за схемою неповерненої кулі) , коли відібраний елемент не повертається у загальну сукупність.
Математична теорія вибіркового методу базується на аналізі власно-випадкової вибірки. Розглядом цієї вибірки ми і обмежимось.
Позначимо
– значення ознаки (випадкової величини
);
N та n – об’єми генеральної та вибіркової сукупностей;
та
– кількість елементів генеральної та вибіркової сукупностей зі значеннями ознаки
;
та
– кількість елементів генеральної та вибіркової сукупностей, що мають дану ознаку.
Середні арифметичні розподілу ознаки в генеральній та вибірковій сукупностях називаються відповідно генеральним та вибірковим середнім,
а дисперсії цих розподілів – генеральною та вибірковою дисперсіями.
Відношення кількості елементів генеральної та вибіркової сукупностей, що мають певні ознаки
, до їх об’ємів, називаються відповідно генеральною і вибірковою частками. Всі формули зведемо в таблицю 2.1.
Таблиця 2.1
| Найменування характеристики | Генеральна сукупність | Вибірка |
| Середнє | (2.1)
| (2.2)
|
| Дисперсія | (2.3)
| (2.4)
|
| Частка | (2.5)
| (2.6)
|
Найважливішим завданням вибіркового методує оцінка параметрів (характеристик) генеральної сукупності за даними вибірки. Теоретичною основою застосування вибіркового методу є закон великих чисел, згідно з яким при необмеженому збільшенні об’єму вибірки практично вірогідно, що випадкові вибіркові характеристики як завгодно близько наближаються (збігаються за ймовірністю) до певних параметрів генеральної сукупності.
Поняття оцінки параметрів
Нехай розподіл ознаки X – генеральної сукупності – задається функцією ймовірностей
(для дискретної випадкової величини X) або густиною ймовірностей
(для неперервної випадкової величини X), яка містить невідомий параметр θ. Наприклад, це параметр λ в розподілі Пуассона чи параметри a та
для нормального закону розподілу і т.д. Про параметр θ намагаються судити по вибірці, що складається із значень (варіант)
. Ці значення можна розглядати як частинні значення (реалізації) n незалежних випадкових величин
,кожна з яких має той самий закон розподілу, що й сама випадкова величина X.
Означення 2.1Оцінкою
параметра θ називають кожну функцію результатів спостереження над випадковою величиною X ( по-іншому – статистику), за допомогою якої роблять висновки про значення параметра θ:
.
Оскільки
– випадкові величини, то і оцінка
(на відміну від параметра, що оцінюється – величини невипадкової) є випадковою величиною, яка залежить від закону розподілу випадкової величини X та числа n.
Завжди існує множина функцій від результатів спостережень
(від n «екземплярів» випадкової величини X), які можна запропонувати в якості параметра θ. Наприклад, якщо параметр θ є математичним сподіванням величини X, тобто генерального середнього
, то в якості його оцінки
по вибірці можна взяти: середнє арифметичне результатів спостережень – вибіркове середнє
, моду
, медіану
, півсуму найбільшого і найменшого значень у вибірці, тобто
і т.д. Про якість оцінки слід судити не за її індивідуальними значеннями, а лише за розподілом її значень у великій мережі дослідів, тобто за вибірковим розподілом оцінки. Для того, щоб значення
було близьким до θ, необхідно поставити вимогу, щоб розкид випадкової величини
відносно θ (що виражається, наприклад, математичним сподіванням квадрата відхилення оцінки від параметра, що оцінюється
) був найменшим. Така основна умова, яку має задовольняти «найкраща» оцінка.
Властивості оцінок
Означення 2.2 Оцінка
параметра θ називається незміщеною, якщо її математичне сподівання рівне параметру, що оцінюється, тобто
.В іншому випадку оцінка називається зміщеною.
Вимога незміщеності гарантує відсутність систематичних похибок при оцінюванні. Якщо при скінченному об’ємі вибірки n
, тобто зміщення оцінки
, але
, то така оцінка
називається асимптотично незміщеною.
Означення 2.3 Оцінка
параметра θ називається спроможною,якщо вона задовольняє закону великих чисел, тобто збігається за ймовірністю до параметра, що оцінюється:
,
У випадку використання спроможних оцінок виправдовується збільшення об’єму вибірки, оскільки при цьому стають малоймовірними значні похибки при оцінюванні. Тому практичне значення мають тільки спроможні оцінки. Якщо оцінка
параметра θ є незміщеною, а її дисперсія
при
, то оцінка
є також спроможною.Це безпосередньо випливає з нерівності Чебишова
.
Означення 2.4 Незміщена оцінка
параметра θ називається ефективною, якщо вона має найменшу дисперсію серед усіх можливих незміщених оцінок параметра θ, обчислених за вибірками одного і того самого об’єму n.
Оскільки для зміщеної оцінки
існує дисперсія
, то ефективність є вирішальною властивістю, яка визначає якість оцінки.
Ефективність оцінки
визначають співвідношенням:
,
де
та
–відповідно дисперсії ефективної та даної оцінок. Чим ближчим є e до 1, тим ефективнішою є оцінка. Якщо
при
, то така оцінка називається асимптотично ефективною.
В якості статистичних оцінок параметрів генеральної сукупності бажано використовувати оцінки, що задовольняють одночасно вимогам незміщеності, спроможності та ефективності. Однак, досягнути цього вдається не завжди.
Методи знаходження оцінок
Метод моментів,запропонований К. Пірсоном.
У цьому методі визначена кількість вибіркових моментів (початкових
чи центральних
, або тих та інших) прирівнюється до відповідних
теоретичних моментів розподілу (
чи
) випадкової величини X.
,
- дискретна випадкова величина з функцією ймовірностей
;
,
- для неперервної випадкової величини з густиною ймовірностей
, де
.
◄ Приклад 2.1Знайти оцінку методом моментів для параметра λ закону Пуассона.
Розв’язання. В даному випадку для знаходження єдиного параметра λ достатньо прирівняти теоретичний
та емпіричний
початкові моменти першого порядку.
– математичне сподівання випадкової величини X. Для випадкової величини, розподіленої за законом Пуассона,
. Момент
,згідно з формулою для початкових моментів, дорівнює
. Звідси, оцінка методом моментів параметра λ закону Пуассона є вибіркове середнє
.►
Оцінки методом моментів параметра зазвичай спроможні, однак за ефективністю вони не є «найкращими».
Метод максимальної правдоподібності, запропонований Р. Фішером.
Основу методу складає функція правдоподібності, що виражає густину ймовірностей (ймовірність) сумісної появи результатів вибірки
:
, або
.
Згідно з методом максимальної правдоподібності в якості оцінки невідомого параметра θ приймається таке значення
, яке максимізує функцію L.
Пошук оцінки
спрощується, якщо максимізувати не саму функцію L, а
, оскільки максимум обох функцій досягається при одному і тому
самому значенні θ. Тому
,
. Потім знаходимо точку максимума функції.
◄ Приклад 2.2 Знайти оцінку методом максимальної правдоподібності для ймовірності p настання деякої події A за даним числом m появи цієї події в n незалежних випробуваннях.
Розв’язання. Складемо функцію правдоподібності:
, або
.
Тоді
і
, звідки
. Можна показати, що при
виконується достатня умова екстремуму функції L.
Таким чином, оцінкою методом максимальної правдоподібності ймовірності p події A буде частота
цієї події.►
◄Приклад 2.3Знайти оцінки методом максимальної правдоподібності для параметрів a і
нормального розподілу за даними вибірки.
Розв’язання. Густина ймовірності нормально розподіленої випадкової величини
. Тоді функція правдоподібності має вигляд:
.
Прологарифмуємо та отримаємо:
.
Для знаходження параметрів a і
необхідно прирівняти до нуля частинні похідні по параметрах a і
, тобто розв’язати систему рівнянь правдоподібності: 
звідки оцінки максимальної правдоподібності рівні:
,
.
Таким чином, оцінками методу максимальної правдоподібності математичного сподівання a і дисперсії
нормально розподіленої випадкової величини є відповідно вибіркове середнє
і вибіркова дисперсія
.►
Важливість методу максимальної правдоподібності пов’язана із його оптимальними властивостями. Так, якщо для параметра θ існує ефективна оцінка
, то оцінка максимальної правдоподібності єдина і рівна
. Крім цього, при достатньо загальних умовах оцінки максимальної правдоподібності є спроможними, асимптотично незміщеними, асимптотично ефективними і мають нормальний розподіл.
Основний недолік методу максимальної правдоподібності – важкість обчислення оцінок.
Метод найменших квадратів – один із найбільш простих прийомів побудови оцінок. Він полягає у тому, що оцінка визначається з умови мінімізації суми квадратів відхилень вибіркових даних від шуканої оцінки.
◄Приклад 2.4Знайти оцінку методом найменших квадратів
для генерального середнього
.
Розв’язання. Згідно із методом найменших квадратів знайдемо оцінку
з умови мінімізації суми:
Використовуючи необхідну умову екстремуму, прирівняємо до нуля похідну
, звідки
і
, тобто оцінка методом найменших квадратів генерального середнього
є вибірковим середнім
.►
Метод найменших квадратів , по-перше, не потребує знання закону розподілу вибіркових даних; по-друге, достатньо добре розроблений в плані обчислювальної реалізації.
(2.1)
(2.2)
(2.3)
(2.4)
(2.5)
(2.6)