Рівні статистичної значущості. Потужність критерію

Визначення ► · Рівень статистичної значущості як характеристика критерію, – це імовірність того, що ми вважаємо різниці значень ознак суттєвими, а вони насправді випадкові. · Рівень значущості – це імовірність відхилення нульової гіпотези Н0 в той час, як вона вірна (зв’язку немає).
Увага Коли ми вказуємо, що відмінності достовірні на 5% рівні значущості, (або при ρ ≤ 0,05), то маємо на увазі, що ймовірність того, що відмінності все таки достовірні, складає 0,05.
     

Саме статистична значущість (ρ – рівень значущості) є кількісною оцінкою надійності зв’язку: чим менша ця ймовірність, тим надійніший зв’язок.

Отже, перевіряючи статистичну гіпотезу, слід врахувати можливі помилки, які можуть статися з різних причин. Розглянемо таку схему.

 

Для генеральної сукупності правильна гіпотеза У результаті застосування критерію прийнята гіпотеза
нульова (Н0) альтернативна (Н1)
Нульова (Н0) Немає помилки Помилка першого роду
Альтернативна (Н1) Помилка другого роду Немає помилки

 

Як бачимо, можливі чотири варіанти співвідношення реальної ситуації в генеральній сукупності і висновків процедури тестування. У двох з них висновки збігаються з реаліями і тому правильні. В інших двох випадках висновки будуть неправильними.

Традиційно розрізняють похибки першого та другого роду.

Визначення ► Похибка, яка полягає у тому, що ми відхилили Но у той час, як вона вірна, називається похибкою першого роду. Імовірність похибки першого роду позначається α і називають її рівнем значущості критерію.

Висновки · Якщо імовірність похибки – α, то імовірність вірного рішення (1–α). · Чим менше α, тим більша імовірність правильного рішення.

Відхилення нульової гіпотези (про відсутність відмінностей) і прийняття альтернативної гіпотези (про статистичну достовірність відмінностей) здійснюється за правилом.

Правила 1) Якщо емпіричне значення критерію дорівнює критичному значенню (Х2емп ≥ Х2кр) (відповідно для ρ ≤ 0,05), або перевищує його, то Н0 відхиляється, але ми ще не можемо виразно прийняти Н1 (існує ймовірність похибки α). 2) Якщо емпіричне значення критерію дорівнює критичному значенню (Х2емп ≥ Х2кр) (для ρ ≤ 0,01), або перевищує його, то Н0 відхиляється і приймається Н1.

 

Увага Виключення складають критерій знаків – G, критерій Т – Вілкоксона і критерій U – Манна–Уітні, що встановлюють зворотні співвідношення.
Визначення ► · Потужність критерію – це його спроможність виявляти розбіжності, якщо вони є, тобто це здатність критерію відхиляти Н0 (про відсутність розбіжностей), якщо вона невірна. · Похибка, яка полягає у тому, що ми прийняли Н0 у той час, як вона невірна, називається похибкою другого роду. Імовірність похибки другого роду позначається – β. · Потужність критерію – це його здатність не допустити похибку другого роду, тобто потужності критерію відповідає величина (1 – β).
     

Часто, для наочності та полегшення процесу прийняття рішення, можна викреслити "вісь значущості". Покажемо це на наступному прикладі.

Наприклад, виходячи із сформульованих правил відхилення Н0 і прийняття Н1 , для критерію Q – Розенбаума розділимо вісь значущості на три зони (рис. 7):

1. зона незначущості (для Qемп ≤ Qкр = Q0,05): (Н0 відхиляється, а Н1 не приймається);

2. зона значущості (для Qемп ≥ Qкр = Q0,01): (Н0 відхиляється, а Н1 приймається);

3. зона невизначеності для Q0,05 ≤ Qемп ≤ Q0,01.

 

 

 

 


Висновок Двосторонній критерій є більш строгим, оскільки він перевіряє різниці в обидва боки.

 

Питання 2. Класифікація задач практичної психології і методів

Їх вирішення

Класифікація задач і методів їх вирішення представлена у таблиці 9, яка дозволяє співставити:

§ групи досліджень з будь-якої ознаки, щоб виявити різниці між ними за цією ознакою;

§ те, що було "до" з тим, що стало "після" наших впливів, щоб визначити ефективність цих впливів;

§ емпіричний розподіл значень ознаки з будь-яким теоретичним або емпіричним розподілом з тим, щоб довести невипадковість вибору альтернатив або різниць у формі розподілів;

§ дві ознаки, що виміряні на одній і тій самій вибірці досліджених для того, щоб установити ступінь погодженості їх змін або кореляцію між ними;

§ індивідуальні значення, що отримані при різних комбінаціях будь-яких суттєвих умов з тим, щоб висвітити характер взаємодії впливів на індивідуальні значення ознаки.

Таблиця 9

Класифікація задач та методів їх рішення

Задачі Умови Методи
1. Виявлення розбіжностей в рівні досліджуваної ознаки а) 2 вибірки досліджуваних Q – критерій Розенбаума; U – критерій Манна-Уітні; φ* – критерій (кутове перетворення Фішера).
б) 3 і більше вибірок досліджуваних S – критерій тенденцій Джонкіра; H – критерій Крускала-Уолліса.
2. Оцінка зсуву значень досліджуваної ознаки а) 2 заміри на одній і тій же вибірці досліджуваних T – критерій Вілкоксона; G – критерій знаків; φ* – критерій (кутове перетворення Фішера).
б) 3 і більше замірів на одній і тій же вибірці досліджуваних χr2 – критерій Фрідмана; L – критерій тенденцій Пейджа.
3. Виявлення розбіжностей в розподіленні ознаки а) при співставленні емпіричного розподі-лення з теоретичним χ2 – критерій Пірсона; λ – критерій Колмогорова-Смирнова; m – біноміальний критерій.
б) при співставленні двох емпіричних розподілень χ2 – критерій Пірсона; λ – критерій Колмогорова-Смирнова; φ* – критерій (кутове перетворення Фішера).
4. Виявлення ступеня узгодженості змін а) двох ознак rs – коефіцієнт рангової кореляції Спірмана.
б) двох ієрархій або профілів rs – коефіцієнт рангової кореляції Спірмана.
5. Аналіз змін ознаки під впливом умов, що контролюються а) під впливом одного фактору S – критерій тенденцій Джонкіра; L – критерій тенденцій Пейджа; Однофакторний дисперсійний аналіз Фішера.
б) під впливом двох факторів одночасно Двофакторний дисперсійний аналіз Фішера.

Питання 3. Умови оптимізації вибору методів математичної обробки емпіричних даних

Прийняття рішення про задачу та метод обробки на стадії, коли дані вже отримані дає перший алгоритм.

П Е Р Ш И Й А Л Г О Р И Т М 1. По першому стовпчику табл. 9 визначаємо, яка з задач ставиться у дослідженні. 2. По другому стовпчику табл. 9 визначаємо, які умови вирішення Вашої задачі, скільки вибірок обстежено, або, на яку кількість груп Ви можете поділити досліджувану вибірку. 3. По алгоритму прийняття рішення про вибір критерію визначаємо, який метод або критерій Вам краще використати.  

Якщо Ви знаходитесь лише на стадії планування дослідження, то прийняття рішення про формулювання задачі та метод математичної обробки краще здійснити за другим алгоритмом.

Д Р У Г И Й     А Л Г О Р И Т М     1. Визначте, яка модель більш за все підходить для доведення Ваших наукових досліджень. 2. Уважно ознайомтесь з описом методу та задачами, які підтверджують ефективність цього метода. 3. Якщо Ви з’ясували, що даний метод Вам підходить, зверніть увагу на розділ "Обмеження критерію" і вирішите, чи зможете Ви зібрати дані, які будуть відповідати цим обмеженням (великий об’єм вибірки, наявність декількох вибірок і т.і.). 4. Проведіть дослідження, а потім обробіть отримані результати за допомогою вибраного алгоритму, якщо Вам вдалося виконати обмеження. 5. У випадку невиконання обмежень, зверніться до першого алгоритму.