Поняття про двофакторний дисперсійний аналіз
Припустимо, що в розглянутій задачі про якість різних (m) партій вироби виготовлялися на різних (l) верстатах і потрібно з'ясувати, чи є суттєві відмінності в якості виробів по кожному фактору: А - партія виробів, В - верстат. В результаті ми приходимо до задачі двофакторного дисперсійного аналізу.
Усі наявні дані представимо у вигляді табл. 5.4, в якій по рядках - рівні
фактора А, по стовпцях - рівні
чинника В, а у відповідних комірчинах таблиці знаходяться значення показника якості виробів 
Двофакторна дисперсійна модель має вигляд:
, (5.14)
де
- значення спостереження в осередку ij з номером k;
- загальна середня;
- ефект, обумовлений впливом i-го рівня фактора А;
- ефект, обумовлений впливом j-го рівня фактора В ;
- ефект, обумовлений взаємодією двох факторів, тобто відхилення від середнього за спостереженнями у клітинці ij від суми перших трьох доданків в моделі (5.14);
- збурення, обумовлене варіацією змінної в середині окремої комірки.
Таблиця 5.4
| В А |
|
| … |
| … |
|
|
|
| … |
| … |
|
|
|
| … |
| … |
|
| … | … | … | … | … | … |
|
|
| … |
| … |
|
| … | … | … | … | … | … |
|
|
| … |
| … |
|
Вважаємо, що
має нормальний закон розподілу
, а всі математичні сподівання
дорівнюють нулю. Групові середні знаходяться за формулами:
по клітинці –
(5.15)
по рядку –
(5.16)
по стовпцю –
(5.17)
Загальне середнє -
(5.18)
Таблиця 5.5 – таблиця дисперсійного аналізу.
Можна показати, що перевірка нульових гіпотез
про відсутність впливу на розглянуту змінну факторів А, В та їх взаємодії АВ здійснюється порівнянням відношень
(для моделі I з фіксованими рівнями факторів) або відношень
(для випадкової моделі ІІ) з відповідними табличними значеннями F- критерію Фішера-Снедекора. Для змішаної моделі III перевірка гіпотез щодо факторів із фіксованими рівнями проводиться так само, як у моделі II, а факторів із випадковими рівнями - як в моделі I.
Якщо n = 1, тобто при одному спостереженні в осередку, то не всі нульові гіпотези можуть бути перевірені, оскільки випадає компонента
із загальної суми квадратів відхилень, а з нею і середній квадрат
, бо в цьому випадку не може бути мови про взаємодію чинників.
Таблиця 5.5
| Компоненти дисперсії | Сума квадратів | Число степенів вільності | Середні квадрати |
| Міжгрупова (фактор А) |
| m-1 |
|
| Міжгрупова (фактор В) |
| l-1 |
|
| Взаємодія (АВ) |
| (m-1)(l-1) |
|
| Залишкова |
| mln-ml |
|
| Загальна |
| mln-1 |
◄ Приклад 5.2. У табл. 5.6 наведені добові прирости (г) відібраних для дослідження 18 поросят в залежності від методу утримання поросят (фактор А) та якості їх годівлі (фактор В). Необхідно на рівні значущості
= 0,05 оцінити суттєвість (достовірність) впливу кожного фактора і їх взаємодії на добовий приріст ваги поросят.
Розв’язання. Маємо m = 3, l = 2, n = 3. Визначимо (в г) середні значення приросту ваги:
в осередках – за (5.15):
;
і аналогічно,
Таблиця 5.6
| Кількість голів в групі (фактор А) | Вміст протеїну в кормі, г (фактор В) | |
| Кількість голів в групі (фактор А) | В1=80 | В2=100 |
| А1 = 30 | 530, 540, 550 | 600, 620, 580 |
| А2 = 100 | 490, 510, 520 | 550, 540, 560 |
| А3 = 300 | 430, 420, 450 | 470, 460, 430 |
;
по рядках – за (5.16): 
і, аналогічно

по стовпцях - за (5.17): 
і, аналогічно 
Загальний середній приріст - за (5.18):

Всі середні значення приросту (г) відобразимо у табл. 5.7. З таблиці 5.7 випливає, що зі збільшенням кількості голів у групі середній добовий приріст поросят у середньому зменшується, а при збільшенні вмісту протеїну в кормі - в середньому збільшується. Але чи є ця тенденція достовірною або пояснюється випадковими причинами? Для відповіді на це питання за формулами табл. 5.5 обчислимо необхідні суми квадратів відхилень:


Середні квадрати знаходимо діленням отриманих сум на відповідну їм кількість степенів вільності m-1= 2, l-1 = 1; (m-1) (l -1) = 2; mln - ml = 18-6 = 12; mln-1 = 18-1 = 17.


Таблиця 5.7
| Кількість голів у групі (фактор А) | Вміст протеїну в кормі, г (фактор В) | ||
|
|
| |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Результати зведемо в табл. 5.8.
Очевидно, дані фактори мають фіксовані рівні, тобто ми знаходимося в рамках моделі I. Тому для перевірки істотності впливу факторів А, В та їх взаємодії АВ необхідно знайти відношення:

і порівняти їх з табличними значеннями відповідно
.
Таблиця 5.8
| Компонента дисперсії | Суми квадратів | Число степенів вільності | Середні квадрати |
| Міжгрупова (фактор А) Міжгрупова (фактор В) Взаємодія (АВ) |
|
| |
| Залишкова |
|
| |
| Загальна |
|
Оскільки
і
, то вплив методу утримання поросят (фактору А) та якості їх годівлі (фактора В) є істотним. В силу того що
, взаємодія зазначених факторів незначна. ►
Зауваження. З точки зору техніки обчислень для знаходження сум квадратів
доцільніше використовувати формули:
(5.19)
(5.20)
(5.21)
(5.22)
. (5.23)
Так, у розглянутому прикладі 5.2:





і за формулами (5.19) - (5.23):





При вирішенні реальних завдань методом дисперсійного аналізу використовуються статистичні програмні пакети.
Відхилення від основних передумов дисперсійного аналізу - нормальності розподілу досліджуваної змінної і рівності дисперсій в осередках (якщо воно не надмірне) - не позначається істотно на результатах при рівному числі спостережень в осередках, але може бути дуже чутливим при нерівному їх числі . Крім того, при нерівному числі спостережень в осередках різко зростає складність апарату дисперсійного аналізу. Тому рекомендується планувати схему з рівним числом спостережень в осередках, а якщо зустрічаються відсутні дані, то відшкодовувати їх середніми значеннями інших спостережень в осередках. При цьому, проте, штучно введені відсутні дані не слід враховувати при обчисленні степенів вільності.
Контрольні питання
1. В чому полягає сутність дисперсійного аналізу?
2. За яких умов застосовують однофакторний дисперсійний аналіз?
3. За яких умов застосовують двофакторний дисперсійний аналіз?
4. Як інтерпретувати результати дисперсійного аналізу?
РОЗДІЛ 6