Теоретичне порівняння оцінок

Всі три оцінки незміщені, що можна перевірити методами теорії ве-роятность. Визначимо дисперсії оцінок:

1 = D( ) = ,

2 = D( max xi ) = ,

3 = D(x(k) + x(k+1)) » ,

Звідки зрозуміло, що â2 — наибільш точна оцінка, а â3 — найменш.

Пояснимо наведені формули для дисперсій.

Перша :

1 = = = = .

Друга. Визначимо функцію розподілу статистики max xi:

F(z) º P{max xi < z} = P{x1 < z, ..., xn < z} = = ; щільність розподілу

(z) = F¢(z) = , zÎ[0, a].

Дальше

2 = M( max xi ) = = ,

22 = M = ,

2 = Mâ22 — (Mâ2)2=

Третя. Використовуємо теорему Крамера, згідно якої вибіркова p - квантиль має дисперсю, рівну наближено , де xp — істинна p-квантиль, f(x) - щільність розподілу спостережень вибірки. У нашому випадку (при n = 2k) статистика

0.5 (x(k) +x (k+1) ) º m

є вибірковою медіаною (p = 0.5) , f(x0.5) = 1/a , â3 = 2m, і тому

 

3=Dm = = .

 

Статистичне порівняння оцінок

Не завжди вдається аналітично обчислити дисперсію оцінки. Як експериментально визначити, якою з оцінок користуватися? За однією вибіркою не можна судити про розкид значень оцінки, оскільки значення всього одне; необхідно мати декілька вибірок, наприклад, k = 20, (або хоча би 5 ¸ 10) оцінити розкид значень для кожної оцінки і віддати перевагу тій оцінці (тому способу оцінювання), для якої розкид менше. Якщо ж вибірка всього одна, то слід (якщо n досить велике) розбити її випадковим чином на кілька вибірок, і по них порівнювати якість оцінок.

Сформуємо k =20 вибірок із розподілу R[0, a=10] об’єму n для різних n=10, 40, 160 і визначимо розкид оцінок. Характеристиками розкиду значень а1,...,аk оцінки â будемо вважати розмах

w = max ai - min ai

і средньоквадратичне відхилення (скВ)

Sa= , .

В якості прикладу в табл.5.1 і на рис.5.1 приведені результати порівняння трьох оцінок.

Порівняння значень розмахів w і скВ Sа для 3 оцінок показує, що оцінка â21, ... , хn) найбільш точна, а оцінка â31, ... , хn) - найменш.

Наведені результати експериментального порівняння 3 способів обробки спостережень показують наступне.

1. Значення оцінок концентруються в околиці оцінюваного параметра (прояв властивості незміщеності оцінок).

2. З ростом числа спостережень точність (величина розкиду) оцінок поліпшується (прояв властивості спроможності).

3. Різні оцінки розрізняються по величині середньої помилки, звідки ясно, що різні способи обробки спостережень потрібно порівнювати за величиною середнього значення деякого критерію якості, наприклад, середовищ-нього значення квадрата помилки.

 

Таблиця 5.1 – Розкид значень оцінок.

    â1 â2 â3
  amin 7.98 9.21 6.04
n = 10 amax 13.80 10.98 15.69
  w 5.82 1.77 9.65
  Sa 1.51 0.53 2.35
  amin 8.59 9.77 7.02
n = 40 amax 11.35 10.24 12.89
  w 2.76 0.47 5.86
  Sa 0.84 0.14 1.56
  amin 9.12 9.85 8.67
n = 160 amax 11.26 10.06 12.24
  w 2.14 0.21 3.57
  sa 0.50 0.05 0.94

 

Порівняння значень розмахів w і скВ Sа для 3 оцінок показує, що оцінка â21, ... , хn) найбільш точна, а оцінка â31, ... , хn) - найменш.

Наведені результати експериментального порівняння 3 способів обробки спостережень показують наступне.

1. Значення оцінок концентруються в околиці оцінюваного параметра (прояв властивості незміщеності оцінок).

2. З ростом числа спостережень точність (величина розкиду) оцінок поліпшується (прояв властивості спроможності).

3. Різні оцінки розрізняються по величині середньої помилки, звідки ясно, що різні способи обробки спостережень потрібно порівнювати за величиною середнього значення деякого критерію якості, наприклад, середовищ-нього значення квадрата помилки.

 

ПОСТАНОВКА ЗАДАЧІ

Порівняти статистично на вибірках обсягу n = 10 дві оцінки: оцінку максимальної правдоподібності та медіанні оцінку

1) середнього нормального розподілу і

2) параметра показового розподілу.

 

ПОСЛІДОВНІСТЬ ВИКОНАННЯ РОБОТи в пакеті STATISTICA

Оцінювання по вибірках об’єму n = 10

Сформуємо k =20 вибірок об’єму n =10 і визначимо значення оцінок a1, a2, a3 кожної вибірки.

Запустимо пакет Statistica for Windows, вибравши в меню Basic Statistic/Tables. Cancel на пропоновані запити (якщо вони будуть).