Задачі для самостійного розв’язку .

Постановка задачі.

Нехай – випадкова вибірка об’єму із генеральної сукупності .

Розглянемо задачу перевірки простої статистичної гіпотези про те, що функція розподілу випадкової величини співпадає з деякою відомою функцією .

 

(17.1.1)

 

Альтернативна гіпотеза

 

(17.1.2)

 

Зауважимо, вид закону розподілу обирається з фізичного змісту випадкової величини . Вид гістограми, а також співвідношення між числовими характеристиками випадкових величин, дозволяють зробити припущення відносно теоретичного розподілу. Наприклад, якщо середнє вибіркове співпадає з вибірковою дисперсією, можна припустити, що випадкова величина розподілена за законом Пуассона. Якщо середнє вибіркове близьке до середньоквадратичного відхилення, то має місце показниковий розподіл. Якщо асиметрія і ексцес близькі до нуля, можна припустити, що має місце нормальний закон розподілу.

 

Критерії згоди

Як би добре не був обраний теоретичний розподіл , між ним і емпіричними даними завжди існує розбіжність. Пояснюється ця розбіжність випадковими обставинами, наприклад, недостатнім об’ємом спостережень, чи вони є істотними і пов’язані з тим, що невдало підібрано теоретичний розподіл? Необхідно перевірити, чи узгоджується емпіричний розподіл з гіпотезою про розподіл за теоретичним законом .

У будь-якому критерію згоди розглядається деяка випадкова величина , що є мірою розбіжності між емпіричними та теоретичними частотами. Якщо перевищує деяке критичне значення , то основну гіпотезу відкидають, у протилежному випадку – приймають.

 

17.3 Критерій Пірсона

Емпіричний розподіл задано у вигляді послідовності рівновіддалених варіантів і відповідних їм частот.

 

 

(17.3.1)

 

Використовуючи критерій Пірсона , перевірити гіпотезу про нормальний розподіл випадкової величини.

Правило.Для того, щоб при заданому рівні значущості перевірити гіпотезу про нормальний розподіл генеральної сукупності, треба:

1. Обчислити середнє вибіркове і середнє вибіркове квадратичне відхилення .


(17.3.2)

 

(17.3.3)

 

2. Обчислити теоретичні частоти

(17.3.4)

 

де – об’єм вибірки (сума всіх частот),

- крок (різниця між сусідніми варіантами)

(17.3.5)

(17.3.6)

 

3. Порівняти емпіричні і теоретичні частоти за допомогою критерія Пірсона. Для цього:

а) обчислити вибіркове значення критерію

 

(17.3.7)

 

Величина – є мірою розбіжності між статистичними і теоретичними частотами, розподілена за законом

б) за таблицею критичних точок розподілу , за заданим рівнем значущості і числу ступенів свободи ( – число груп вибірки), знаходять критичну точку правосторонньої області.

Якщо , то немає підстав відхиляти основну гіпотезу про нормальний розподіл випадкової величини.

Якщо , основну гіпотезу про нормальний відхиляють. Іншими словами, емпіричні й теоретичні частоти відрізняються значущо.

Зауваження. Частоти, де треба об’єднати з сусідніми.

Приклад. Використовуючи критерій Пірсона , на рівні значущості перевірити, чи узгоджується гіпотеза про нормальний розподіл генеральної сукупності з емпіричним розподілу вибірки об’єму .

 

 

Розв’язання.

1. За формулою (18.3.2)

За формулою (18.3.3)

2. Обчислимо теоретичні частоти за формулою (18.3.4), де ;

 

Складемо таблицю

 

=
-1,62 0,1074 9,1
-1,90 0,1942 16,5
-0,77 0,2966 25,3
-0,35 0,3752 32,0
0,08 0,3977 33,9
0,51 0,3503 29,8
0,93 0,2589 22,0
1,36 0,1582 13,5
1,78 0,0818 7,0

 

Значення функції знаходимо за таблицею значень функції щільності нормального стандартного розподілу.

3. Порівняємо емпіричні і теоретичні частоти. Складемо розрахункову таблицю і знайдемо

 

 

9,1 5,9 34,81 3,8
16,5 9,5 90,25 5,5
25,3 -0,3 0,09 0,0
32,0 -2,0 4,00 0,1
33,9 -7,9 62,41 1,8
29,8 -8,8 77,44 2,6
22,0 2,0 4,00 0,2
13,5 6,5 42,25 3,1
7,0 6,0 36,00 5,1

 

За таблицею критичних точок розподілу за рівнем значущості і числом ступенів свободи знайдемо – критичну точку правосторонньої області

 

 

Так як , то гіпотезу про нормальний розподіл генеральної сукупності відхиляємо на рівні значущості . Іншими словами, емпіричні й теоретичні частоти відрізняються значущо.

Приклад. Результати іспитів на міцність наведено в таблиці.

 

міцність деталі в кг 120-140 140-160 160-180 180-200 200-220 220-240 240-260 260-280
кількість деталей

 

1. Знайти вид закону теоретичного розподілу.

2. Знайти параметри розподілу

3. Перевірити, чи узгоджується обраний теоретичний розподіл з емпіричними даними

Розв’язання. Побудуємо гістограму частот (рис. 17.3.1). Для цього в прямокутній системі координат значення ознаки (міцності деталі в кг) відкладемо на осі абсцис, а частоти ( ) – на осі ординат (масштаб обирається довільно). Потім на відрізках осі абсцис, відповідних побудованим інтервалам, як на основах будуємо прямокутники, висота яких (в обраному масштабі) дорівнює частоті даного інтервалу.

 


 

рис. 17.3.1

 

У тому випадку, коли інтервали різні, на осі ординат відкладаємо значення абсолютної щільності розподілу

 

(17.3.8)

де – ширина інтервалу,

– частота інтервалу

 

По вигляду гістограми можна зробити припущення, що випадкова величина X (міцність деталі), що розглядається, розподілена за нормальним законом.

Розрахуємо методом моментів середнє вибіркове , дисперсію вибірки , середньоквадратичне відхилення , вибіркові коефіцієнти асиметрії A й ексцесу E.

Середнє вибіркове обчислюємо за формулою

(17.3.9)

 

де

 

(17.3.10)

 

(17.3.11)

 

– довільне число, але для спрощення обчислень за приймається число, близьке до , частіше середина інтервалу з найбільшою частотою; для даної задачі ; – довжина інтервалу, в даному випадку .

Дисперсія обчислюється за формулою:

 

(17.3.12)

 

де

 

(17.3.13)

 

Середньоквадратичне відхилення

 

(17.3.14)

 

Коефіцієнт асиметрії обчислюється за формулою

 

(17.3.15)

 

де

 

(17.3.16)

 

(17.3.17)

 

Ексцес обчислюємо за формулою

 

(17.3.18)

 

де

 

(17.3.19)

 

(17.3.20)

 

(17.3.21)

 

Всі обчислення зручно звести в таблицю

 

Інтервали міцності (кг) Середини інтервалів Частоти
120-140 -3 -3 -27
140-160 -2 -8 -32
160-180 -1 -10 -10
180-200
200-220
220-240
240-260
260-280
     

 

Підставляючи значення сум зі стовпчиків 6, 7, 8, 9 відповідно у формули (17.3.9) – (17.3.21), отримаємо:

 

 

Невелике й додатне значення асиметрії говорить про невелику правосторонню асиметрію, а мале від’ємне значення ексцесу говорить про низковершинність розподілу, близького до нормального. Вид гістограми, а також значення асиметрії і ексцесу, дають можливість припустити, що випадкова величина, що аналізується, розподілена за нормальним законом зі щільністю

 

(17.3.22)

 

За оцінки параметрів візьмемо відповідне вибіркове середнє і середньоквадратичне відхилення , тобто

 

 

Таким чином,

 

 

Теоретична частина попадання в інтервал дорівнює ймовірності попадання цієї величини в інтервал , домноженої на (об’єм вибірки).

 

 

,

 

де – функція Лапласа

 

Необхідні значення зведемо в таблицю

 

Інтервали
120-140 -2,64 -1,94 -0,4958 -0,4738 0,0220 1,1 1
140-160 -1,94 -1,24 -0,4738 -0,3925 0,0813 4,06 4
160-180 -1,24 -0,53 -0,3925 -0,2019 0,1906 9,59 10
180-200 -0,53 0,17 -0,2019 0,0674 0,2694 13,42 13
200-220 0,17 0,87 0,0674 0,3078 0,2404 12,02 12
220-240 0,87 1,57 0,3078 0,4417 0,1340 6,70 7
240-260 1,57 2,27 0,4417 0,4884 0,0466 2,33 2
260-280 2,27 2,98 0,4884 0,4985 0,0102 0,51 1
- - - - 0,9945 49,72 50

 

 

Користуючись критерієм Пірсона , перевіримо, чи узгоджуються дані, наведені в таблиці з гіпотезою про нормальний розподіл з параметрами . Для цього обчислимо величину за формулою

 

 

Обчислення зведемо в таблицю

 

Інтервали
120-140
140-160
160-180
180-200 0,077
200-220
220-240 -1 0,143
240-260
260-280
- - - - 0,22

 

Характер величини потребує, щоб необхідні частоти були не малими. Якщо вони є малими, то вони об’єднуються з сусідніми.

В даному прикладі об’єднують перші дві і дві останні в одну.

 

 

Знайдемо ;

- число груп емпіричного розподілу,

- число параметрів, які входять до теоретичного закону розподілу з числом додаткових співвідношень.

, так як емпіричні частоти задовольняють трьом співвідношення:

1) Сума частот дорівнює об’єму вибірки

2) Частоти мають бути такими, що

3) Частоти мають бути такими, що

Таким чином, квантиль розподілу рівня , який залежить від 3 ступенів свободи, знаходимо за таблицею критичних точок розподілу .

 

Можна зробити висновок, що різниця між теоретичними і емпіричними даними випадкова, а гіпотеза про нормальний розподіл випадкової величини (міцності деталі) приймається за різні значущості .

 

Контрольні запитання.

1. Які критерії називають критеріями згоди?

2. В чому полягає завдання порівняння емпіричного й теоретичного законів розподілу випадкової величини?

3. Яка статистика використовується в критерії Пірсона ? Якому закону вона підпорядковується?

4. На основі яких даних будується гіпотеза про теоретичний закон розподілу випадкової величини? Як діє критерій Пірсона ?

Задачі для самостійного розв’язку .

· Провести попередній аналіз результатів експериментальних даних. Сформулювати гіпотезу про нормальний розподіл генеральної сукупності Х. Використовуючи критерій Пірсона , на рівні значущості =0,05 перевірити, чи узгоджується гіпотеза про нормальний розподіл генеральної сукупності Х з заданим емпіричним розподілом?

1. Вимірювалась жирність молока корів (%) із навмання обраної ферми

Границі інтервалів 1,0-1,2 1,2-1,4 1,4-1,6 1,6-1,8 1,8-2,0 2,0-2,2 2,2-2,4 2,4-2,6 2,6-2,8 2,8-3,0 3,0-3,2
частоти 5 12 18 22 36 24 19 15 11 9 2

 

2. Вимірювався рівень води навесні під час повені (см)

Границі інтервалів 0-24 24-48 48-72 72-96 96-120 120-144 144-168 168-192 192-216
частоти 1 2 4 6 12 16 6 3 1

 

3. Вимірювалось відхилення діаметру валика від його номінального розміру (мм)

Границі інтервалів -20 - -10 -10 - 0 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50
частоти 20 47 80 89 40 16 8


4. Вимірювався діаметр кульок верстатом-автоматом (мм)

Границі інтервалів 1-3 3-5 5-7 7-9 9-11 11-13 13-15 15-17 17-19 19-21 21-23
частоти 2 4 6 10 18 20 16 11 7 5 1

 

5. Вимірювався час неперервного горіння електролампочок (год), виготовлених фірмою, до виходу їх з ладу

Границі інтервалів 6-16 16-26 26-36 36-46 46-56 56-66 66-76 76-86
частоти 8 7 16 35 15 8 6 5

 

6. Вимірювалась урожайність цукрових буряків у певному районі південного регіону України (ц/га)

Границі інтервалів 5-10 10-15 15-20 20-25 25-30 30-35 35-40 40-45 45-50
частоти 7 8 15 18 23 19 14 10 6

 

7. Розподіл швидкості автомобілів (км/год)

Границі інтервалів 61-65 65-69 69-73 73-77 77-81 81-85 85-89 89-93 93-97 97-101
частоти 1 4 5 8 14 9 6 1 1 1

 

Границі інтервалів 49-52 52-55 55-58 58-61 61-64 64-67 67-70
частоти 3 6 11 30 21 19 10

8. Сумарне число балів у спортивних змаганнях

 

9. Розподіл границь міцності зразків зварного шва (Н/мм2)

Границі інтервалів 28-30 30-32 32-34 34-36 36-38 38-40 40-42 42-44
частоти 8 15 20 30 20 15 10 5
Границі інтервалів 0,00-0,02 0,02-0,04 0,04-0,06 0,06-0,08 0,08-0,10 0,10-0,12 0,12-0,14 0,14-0,16
частоти 9 15 29 35 32 19 8 3
Границі інтервалів 8,95-9,05 9,05-9,15 9,15-9,25 9,25-9,35 9,35-9,45 9,45-9,55 9,55-10,05
частоти 4 8 11 7 5 3 2


10. Розподіл відхилення напруги від номіналу (мВ)


11. Час виконання вправи (с)

 

12. Горизонтальне відхилення від цілі (м) для 200 іспитів ракет

 

Границі інтервалів -40 - -30 -30 - -20 -20 - -10 -10 -0 0 - 10 10 -20 20 -30 30 -40 40 -50 50 -60
частоти 7 11 15 24 49 41 26 17 7 3

 

 

Границі інтервалів 40-50 50-60 60-70 70-80 80-90 90-100 100-110 110-120
частоти 5 9 13 24 20 15 8 5

13. Результати лабораторного аналізу зразків сланцевих порід на вміст окису кремнію (у. о.)

 

14. Результати лабораторного аналізу зразків сланцевих порід на вміст окису алюмінію (у. о.)

 

Границі інтервалів 10-11 11-12 12-13 13-14 14-15 15-16 16-17 17-18
частоти 6 10 14 25 21 16 9 6

 

15. Величина опору партії резисторів (кОм)

Границі інтервалів 6-7 7-8 8-9 9-10 10-11 11-12 12-13 13-14
частоти 5 9 15 30 18 14 8 5

 

Границі інтервалів -13,5 – -8,5 -8,5 – -3,5 -3,5 – 1,5 1,5 – 6,5 6,5 – 11,5 11,5 – 16,5 16,5 – 21,5 21,5 – 26,5
частоти 5 9 13 24 20 15 8 5

16. Результати вимірів ємності конденсаторів дали відхилення від номіналу (пкФ)

 

17. Заміри амплітуди коливань (мм) приладу дали такі результати

 

Границі інтервалів 60-65 65-70 70-75 75-80 80-85 85-90 90-95 95-100
частоти 7 10 15 30 25 15 8 7
Границі інтервалів 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80
частоти 5 9 14 30 16 9 7 5

18. Результати вимірів часу відновлення діодів (нс)

 

 

Границі інтервалів 6-8 8-10 10-12 12-14 14-16 16-18 18-20 20-22
частоти 5 9 13 24 20 15 8 5

19. Діаметри шариків, виготовлених станком автоматом (мм)

 

20. Точність наладки станка автомата характеризується дисперсією довжини деталі (мкм2)

 

Границі інтервалів 200-250 250-300 300-350 350-400 400-450 450-500 500-550 550-600
частоти 10 15 18 27 17 13 10 5
Границі інтервалів -3,00 – -2,5 -2,5 – -2,0 -2,0 – -1,5 -1,5 – -1,0 -1,0 – -0,5 -0,5 – 0,0 0,0 – 0,5 0,5 – 1,0
частоти 5 9 13 24 20 15 8 5

21. Результати відхилення розмірів деталей від номіналу (мм)

22. Вимірювання відхилення величини опору від номіналу для партії однотипних резисторів дало такі результати (Ом)

Границі інтервалів -2,00 – -1,5 -1,5 – -1,0 -1,0 – -0,5 -0,5 – 0,0 0,0 – 0,5 0,5 – 1,0 1,0 – 1,5 1,5 – 2,0
частоти 5 9 13 24 20 15 8 5

 

Границі інтервалів -3,0 – -2,0 -2,0 – -1,0 -1,0 – 0,0 0,0 – 1,0 1,0 – 2,0 2,0 – 3,0 3,0 – 4,0 4,0 – 5,0
частоти 4 10 15 25 20 15 6 5

23. Виміри деякої величини дали такі похибки (мм)

 

Границі інтервалів 60-65 65-70 70-75 75-80 80-85 85-90 90-95 95-100
частоти 5 10 15 25 20 15 10 5

24. Виміри амплітуди коливань приладу дали такі результати (мм)

 

 

Границі інтервалів 50-55 55-60 60-65 65-70 70-75 75-80 80-85 85-90
частоти 5 10 15 30 20 15 10 5

25. Результати вимірів часу відновлення діодів (нс)