Статистичні гіпотези. Критерії оцінки гіпотез

Визначення ► Гіпотеза – форма мислення, що становить собою припущення про існування певного закономірного зв’язку між явищами, причини виникнення яких невідомі.

Статистичні гіпотези, які будуть розглядатися в даному курсі, поділяються на направлені і ненаправлені, які, в свою чергу, поділяються на нульові і альтернативні.

Визначення ► Нульова гіпотеза (Н0) – гіпотеза про відсутність різниць в значеннях порівнювальних ознак. Наприклад Н0: ( x1 – x2 = 0, де x1, x2 – порівнювальні значення ознак).

Увага Нульова гіпотеза – це те, що треба спростувати, якщо перед нами стоїть завдання довести значущість різниць.
Визначення ►     · Альтернативна гіпотеза (Н1) – гіпотеза про значущість різниць в значеннях порівнювальних ознак. · Експериментальна гіпотеза – це альтернативна гіпотеза, яку ми хочемо довести. Наприклад, Н1: (х1 ≠ х2; х1, х2 – порівнювальні значення ознак). · Направленігіпотези: Н0: х1≤х2; (х1 відрізняється (менше або дорівнює) від х2), Н1: х12. · Ненаправленігіпотези. Н0: х1 не відрізняється від х2 12); Н1: х1 відрізняється від х2 1≠х2).
Увага Перевірка гіпотез здійснюється за допомогою критеріїв оцінки відмінностей ознак.
     

Існують параметричні і непараметричні критерії статистичної оцінки відмінностей ознак.

Визначення ► Статистичні критерії – це правила, що забезпечують надійну поведінку порівнювальних ознак (тобто прийняття істинної та відхилення хибної гіпотези) з високою ймовірністю.

Висновки · Із співвідношень емпіричного і критичного (яке визначається з таблиць) значень критерію ми можемо судити про те, чи підтверджується або не підтверджується нульова гіпотеза. (Наприклад, якщо χ2емп > χ2кр, то Но відхиляється (гіпотеза про відсутність різниць). · У більшості випадків для того, щоб ми признали різницю значущою, необхідно, щоб емпіричне значення критерію перебільшувало критичне (виключення представляють критерій знаків – G; критерій Манна-Уітні – U; Т – Вілкоксона). · У більшості випадків одне і те ж емпіричне значення критерію може визнаватися значущим або незначущим у залежності від: а) кількості спостережень у досліджуваній вибірці (n); б) кількості ступенів свободи (ν), що дорівнює числу класів варіаційного ряду мінус число умов, при яких він сформований, причому до числа умов відносяться: об’єм вибірки (n), середнє ( ) та дисперсія (S2).

Статистичні критерії поділяються на параметричні і непараметричні.

Визначення ► · Параметричні критерії – критерії, що засновані на нормальному розподілі генеральної сукупності, або які включають у формули розрахунку параметри розподілу, тобто середнє ( ) і дисперсію (S2) або стандартне відхилення. · Непараметричні критерії – критерії, що не базуються на припущенні про тип розподілу генеральної сукупності і які не включають у формулу розрахунку параметри розподілу, а засновані на оперуванні частотами або рангами з використанням порядкових та інтервальних шкал.  

Можливості та обмеження параметричних і непараметричних критеріїв

Параметричні критерії Непараметричні критерії
1. Дозволяють безпосередньо оцінити розбіжності, що отримані в двох вибірках (t – критерій Ст’юдента).     2. Дозволяють прямо оцінити розбіжності в дисперсіях (критерій φ*– Фішера).   3. Дозволяють виявити тенденції змін ознаки при переході від умови до умови (дисперсійний однофакторний аналіз), але лише за умов нормального розподілу ознаки.   4. Дозволяють оцінити взаємодію одного і більше факторів і їх взаємного впливу на зміни ознаки (двофакторний дисперсійний аналіз).     5. Експериментальні дані повинні відповідати двом, а іноді трьом умовам: а) значення ознаки виміряні в інтервальній шкалі;   б) розподілення ознаки є нормальною;     в) в дисперсійному аналізі повинна виконуватися вимога рівності дисперсії в ячейках комплексу.   6. Математичні розрахунки доволі складні.   7. Якщо умови, перераховані в п.5, виконуються , параметричні критерії стають дещо більш міцними, ніж непараметричні. Дозволяють оцінити лише середні тенденції, наприклад, відповісти на запитання, чи частіше зустрічаються у вибірці А більш високі, а у вибірці Б – більш низькі значення ознаки (критерії Q – Розенбаума, U – Манна-Уітні, φ* – Фішера та ін.).   Дозволяють оцінити лише розбіжності в діапазонах варіативності ознаки (критерій φ*–Фішера).   Дозволяють виявити тенденції змін ознаки при переході від умови до умови при будь-якому розподіленні ознаки (критерії тенденцій L – Пейджа і S – Джонкіра).     Ця можливість відсутня.   Експериментальні дані можуть не відповідати жодній з цих умов:   а) значення ознаки можуть бути представлені в будь-якій шкалі, починаючи від шкали найменувань; б) розподіл ознаки може бути будь-яким і збіг його з певним теоретичним законом розподілення не обов’язковий, і для нього не потрібна перевірка; в) вимога рівності дисперсій відсутня.   Математичні розрахунки в більшій частині прості і не вимагають багато часу (за виключенням критеріїв – Фрідмана і λ – Колмогорова-Смирнова).   Якщо умови, перераховані в п.5, не виконуються, непараметричні критерії стають більш міцними, тому що вони менш чутливі "до забруднення".

Дослідження таблиці 8 дають можливість зробити наступні висновки.