Критерій Фішера при проведенні дисперсійного аналізу

Щоб оцінити істотність відмінностей між середніми і сформулювати висновки з перевірки нульової гіпотези (як нульову гіпотезу рекомендується висувати гіпотезу про відсутність відмінностей між середніми – Н0 : х1= х2 = ... = хn), у дисперсійному аналізі використовується своєрідний норматив -критерій F, закон розподілу якого встановив Р.Фішер. Цей критерій являє собою відношення двох дисперсій: факторної , породжуваної впливом досліджуваного фактора, і залишкової , зумовленої дією випадкових причин:

 

Це дисперсійне відношення американський статистик Снедекор (Стьюдент) запропонував позначати буквою Fна честь винахідника дисперсійного аналізу Р.Фішера.

Якщо в експерименті перевіряють вплив кількох факторів (А, В, С і т.д.) на результативну ознаку одночасно, то дисперсія, зумовлена дією кожного з них, має бути порівнянною з внутрішньогруповою. Якщо значення факторної дисперсії значно більше залишкової, то вважають, фактор істотно впливає на результативну ознаку, і навпаки.

Обчислюючи фактичне значення критерію F, у чисельнику беруть більшу із дисперсій кожного фактора, тому завжди F > 1. Очевидно, що чим більше критерій F, тим значнішим є розбіжності між дисперсіями. Якщо ж F = 1, то питання про оцінку істотності відмінностей дисперсій знімають.

Для визначення меж випадкових коливань відношення дисперсій Р.Фішер розробив спеціальні таблиці F – розподілу, які називають таблицями розподілу Фішера. Критерій Fфункціонально зв'язаний з ймовірністю і залежить від числа ступенів свободи варіації k1 і k2 двох порівнюваних дисперсій. Звичайно використовуються дві таблиці, які дають змогу робити висновки про гранично високе значення критерію F: для рівнів значущості 0,05 і 0,01. Рівень значущості 0,05 (або 5%) означає, що тільки в 5 випадках із 100 критерій Fможе набувати значення, що дорівнює вказаному в таблиці або вище його тобто рівень достовірності проведеного статистичного аналізу становить 95%. Зниження рівня значущості з 0,05 до 0,01 приводить до збільшення значення критерію Fміж двома дисперсіями через дію тільки випадкових причин.

Значення критерію Fтакож залежить безпосередньо від числа ступенів свободи двох порівнюваних дисперсій. Якщо число ступенів свободи варіації прямує до нескінченності (k ®¥), то відношення Fдля двох дисперсій прямує до одиниці.

Розглянемо порядок визначення числа ступенів свободи в дисперсійному аналізі. Число ступенів свободи, що відповідає загальній сумі квадратів відхилень, розкладається на відповідні компоненти аналогічно розкладу сум квадратів відхилень згідно правила розкладання дисперсій та варіацій, тобто загальне число ступенів свободи (k0) розкладається на число ступенів свободи для міжгрупової (k1) і внутрішньогрупової (k2) варіацій.

Так, якщо вибіркова сукупність, що складається із N спостережень, поділена на т груп (кількість варіантів досліду) і п підгруп (кількість повторень), то число ступенів свободи (k) відповідно становитиме:

а) для загальної суми квадратів відхилень загальної варіації Wзаг :

kо = т • п-1= N -1;

б) для міжгрупової суми квадратів відхилень – міжгрупової варіації Wм.гр:

k1 = т -1;

в) для внутрішньогрупової суми квадратів відхилень – внутрішньогрупової варіації Wвн.гр:

Тоді згідно з правилом додавання варіації:

.

Нульову гіпотезу На за критерієм F перевіряють так само, як і за t-критерієм Стьюдента. Щоб прийняти рішення з перевірки Н0, потрібно обчислити фактичне значення критерію Fфакт, а також порівняти його з табличним значенням Fтабл для прийнятого рівня значущості a і відповідного числа ступенів свободи k1 і k2для двох дисперсій.

Значення Fтабл або Fa знаходять за таблицями розподілу Фішера на перетині відповідного стовпця (число ступенів свободи для більшої дисперсії k1) і рядка (число ступенів свободи для меншої дисперсії k2).

Якщо Fфакт > Fтабл, то згідно з прийнятим рівнем значущості можна зробити висновок, що відмінності вибіркових дисперсій визначаються не лише випадковими факторами; вони істотні. Нульову гіпотезу в цьому разі відхиляють, і є підстава стверджувати, що фактор істотно впливає на результативну ознаку. Якщо ж нерівність не виконується, то нульову гіпотезу приймають, і є підстава вважати, що відмінність між порівнюваними дисперсіями перебуває в межах можливих коливань: дія фактора на результативну ознаку не є істотною.

Критерій F дає змогу встановлювати наявність або відсутність істотних зв'язків між груповими середніми в цілому, однак він не показує, між якими середніми різниця є істотною, а між якими неістотною.

Тому, якщо проведений дисперсійний аналіз призвів до відмови від нульової гіпотези, що передбачає рівність середніх, та показав істотність впливу перевірочного фактора на результативну ознаку, то цей загальний висновок слід доповнити перевіркою істотності відмінностей між парами середніх. Тому для перевірки гіпотези про надійність відмінностей між парами середніх застосовують ряд інших критеріїв: Q-критерій Тьюкі, t -критерій Стьюдента, метод Шефе.