Інтервальна оцінка функції регресії
Основні положення регресійного аналізу. Парна
Регресійна модель. множинний регресійний аналіз
Завданнями регресійного аналізу є встановлення форм залежності між змінними, оцінка функцій регресії, оцінка невідомих значень залежної змінної. В регресійному аналізі розглядається одностороння залежність випадкової залежної змінної Y від однієї (або декількох) невипадкової незалежної змінної X, яка часто називається пояснюючою змінною. Вказана залежність Y від X може бути представлена також у вигляді модельного рівняння регресії (6.1). За рахунок впливу неврахованих випадкових факторів і причин окремі спостереження у будуть у більшій або меншій мірі відхилятися від функції регресії
В цьому випадку рівняння взаємозв’язку двох змінних (парна регресійна модель) може бути представлене в вигляді:
де
- випадкова змінна, яка характеризує відхилення від функції регресії. Цю змінну будемо називати збуреною або просто збуренням. Розглянемо лінійний регресійний аналіз, для якого функція
лінійна відносно оцінюваних параметрів:
(7.1) Припустимо, що для оцінки параметрів лінійної функції регресії (7.1)
взято вибірку, яка містить n пар значень змінних (
), де i = 1,2, …, n.
В цьому випадку лінійна парна регресійна модель має вигляд:
. (7.2)
Основні положення регресійного аналізу:
1. В моделі (7.2) збурення
(або залежна змінна
) є величина випадкова, а пояснювальна змінна
– величина невипадкова.
2. Математичне сподівання збурення
рівне нулю:
;
3. Дисперсія збурення
(або залежної змінної
) постійна для довільного i:
.
4. Збурення
і
(або змінні
і
) не корельовані:
,
.
5. Збурення
(або залежна змінна
) є нормально розподілена випадкова величина.
Оцінка моделі (7.2) по вибірці є рівнянням регресії
=
. Параметри цього рівняння
і
визначаються на основі методу найменших квадратів. Вплив неврахованих випадкових факторів і помилок спостережень в моделі (7.2) визначається за допомогою дисперсії збурення (помилок) або залишкової дисперсії
. Незміщеною оцінкою цієї дисперсії є вибіркова залишкова дисперсія
=
,
де
- групове середнє, знайдена з рівняння регресії;
=
- вибіркова оцінка збурення
або залишок регресії. В знаменнику виразу оцінки стоїть число степенів вільності n-2, а не n, оскільки два степеня вільності губляться при визначенні двох параметрів прямої
.
Інтервальна оцінка функції регресії
Побудуємо довірчий інтервал для функції регресії, тобто для умовного математичного сподівання
, яке із заданою надійністю
накриває невідоме значення
. Знайдемо дисперсію групового середнього
, що є вибірковою оцінкою
: рівняння дисперсії запишемо у вигляді:
. (7.3)
На рис. 7.1 лінія регресії зображена графічно. Для довільного значення
, що спостерігається, виділені його складові: середнє
, приріст
, що утворюють значення
і збурення
.
Рис. 7.1
Дисперсія групового середнього дорівнює сумі дисперсій двох незалежних доданків:
.
Дисперсія вибіркового середнього
:
. Для знаходження дисперсії
представимо коефіцієнт регресії у вигляді:
. Тоді 
Знайдемо оцінку дисперсії групових середніх, замінюючи
її груповою оцінкою
:
. Виходячи з того, що статистика
має
розподіл Стьюдента із
степенями вільності, можна побудувати довірчий інтервал для умовного математичного сподівання
,
де
- стандартна помилка групового середнього
.
Екстраполяція кривої регресії, тобто її використання поза границями знайденого діапазону значень пояснюючої змінної може привести до значних похибок. При визначені довірчого інтервалу для деякого індивідуального значення
необхідно враховувати ще і розсіювання навкруги лінії регресії: оцінка дисперсії індивідуального значення
при
дорівнює
, а відповідний довірчий інтервал для прогнозування індивідуальних значень
буде визначатися за формулою
.
◄Приклад 7.1Маємо данні про видобуток вугілля на одного робітника Y (т) і потужності шару Х (м), що характеризують процес видобування вугілля в 10 шахтах (табл. 7.1).
Таблиця 7.1
| і | ||||||||||
| ||||||||||
|
Оцінити середній видобуток вугілля на одного робітника для шахт із потужністю шару 8 м. Знайти 95%-вий довірчий інтервал для індивідуального і середнього значень видобутку вугілля на 1 робітника для таких шахт.
Розв’язання. Складемо рівняння регресії:
,
,
,
,
, рівняння
, тобто при збільшенні потужності шару Х на 1м видобуток вугілля на одного робітника Y збільшується в середньому на 1,016 т.
Потрібно оцінити умовне математичне сподівання
. Вибірковою оцінкою
є групове середнє
, яке знайдемо за рівнянням регресії:
.
Для побудови довірчого інтервалу для
необхідно знайти дисперсію його оцінки
. Складемо допоміжну таблицю 7.2, враховую-чи те, що
, а значення
визначаються за отриманим рівнянням регресії.
Таблиця 7.2
|
| ||||||||||
| 1,96 | 2,56 | 6,76 | 0,16 | 1,96 | 1,96 | 0,16 | 0,16 | 1,96 | 6,76 | 24,4 |
| 5,38 | 8,43 | 9,44 | 6,39 | 5,38 | 5,38 | 6,39 | 6,39 | 5,38 | 9,44 | - |
| 0,14 | 2,48 | 0,31 | 0,37 | 0,14 | 0,39 | 0,15 | 1,94 | 0,39 | 2,08 | 8,39 |
Отже,
,
,
. За таблицею значень
критерію Стьюдента
. Шуканий довірчий інтервал

або
(т).
Отже, середній видобуток вугілля на одного робітника для потужності шару 8 м з надійністю 0,95 знаходиться в межах від 4,38 до 6,38 т.
Щоб побудувати довірчий інтервал для індивідуального значення
, знайдемо дисперсію його оцінки
і
(т).
Шуканий довірчий інтервал
і
. Отже, індивідуальний видобуток вугілля на одного робітника для шахт із потужністю шару 8 м із надійністю 0,95 знаходиться в межах від 2,81 до 7,95 т.►