Неперервні випадкові величини

Неперервні випадковівеличини найчастіше задають функцією щільності розподілу. Ймовірність того, що неперервна випадкова величина Х набуде значення з деякого інтервалу (a; b), дорівнює визначеному інтегралу від її щільності розподілу f(x) з межами інтегрування a і b:

.

Рис. 1
Нормальний розподіл (розподіл Гауса).Закон розподілу неперервної випадкової величини X називається нормальним, якщо щільність розподілу дорівнює:

.

Графік розподілу Гауса описується симетричною відносно a = M(Х) кривою (див. рис. 1), s має зміст серед­ньоквадратичного відхилення

.

Із зменшенням збільшується ордината вершини. Зміна a при постійному не змінює форму кривої, а викликає лише її паралельне зміщення вздовж осі абсцис. Площа, що знаходиться під кривою нормального розподілу, завжди дорівнює одиниці. Нормальний розподіл – один з найважливіших розподілів ймовірності– він описує сукупність більшості антропологічних, фізіологічних та біохімічних показників живих організмів, багато соціальних та економічних явищ.

Нормальний розподіл з параметрами a = 0 та s = 1 називають стандартним (нормованим). Щільність розподілу в такому випадку дорівнює

.

Значення функції φ(x) наведені в спеціальних таблицях .

Припустимо, що випадкова величина розподілена за нормальним законом. Тоді ймовірність того, що X набуде значення з інтервалу (a, b), дорівнює

.

Оскільки вказаний інтеграл не береться в елементарних функціях, то потрібно перетворити останній вираз таким чином, щоб можна було користуватись готовими таблицями, складеними для таких обчислень у випадку стандартного (нормованго) розподілу. Той факт, що нормальний розподіл повністю описується математичним сподіванням M(Х)=a і середнім квадратичним відхиленням s , дозволяє це зробити за допомогою нескладних перетворень і шукати ймовірність попадання нормально розподіленої величини в інтервал (a, b) за формулою:

Ф( ) – Ф( ) = Ф(t2) – Ф(t1) (1)

Функція Ф(Х) називається функцією Лапласа. Значення функції Лапласа подано в табл. 1.

Основні властивості функції Лапласа.

1. Ф(х) визначена при всіх значеннях х є R.

2.Ф(х) – непарна, тобто Ф(–х) = – Ф(х).

3.Ф(0) = 0.

4.Ф(х) – монотонно зростаюча функція.

Часто потрібно знайти ймовірність того, що відхилення нормально розподіленої випадкової величини Х від її математичного сподівання за абсолютною величиною не перевищуватиме заданого додатного числа δ. Враховуючи (1) і непарність функції Ф(Х), матимемо:

. (2)

Оскільки мірою розкиду значень випадкової величини є середнє квадратичне відхилення s, то на практиці часто використовують значення δ, які кратні s. Обчислимо:

;
;
.

Остання рівність свідчить, що майже достовірно (P = 0,997) випадкова величина, яка має нормальний закон розподілу, не відхилиться від математичного сподівання за модулем більше, ніж на 3s. Це твердження називають правилом трьох сигм. На практиці цей факт часто використовують для нівелювання грубих похибок, промахів. Рис.2 ілюструє проведені обчислення

 

Рис 2

Приклад 1. Випадкова величина X має нормальний закон розподілу з параметрами а = 2, s = 4. Визначити ймовірність того, що значення X лежить у межах інтервалу від 0 до 8.

Розв’язок. Щоб скористатися таблицею значень функції Лапласа, спочатку знайдемо t1 та t2:

t1 = (0 – 2)/4 = –1/2, t2 = (8 – 2)/4 = 3/2.

За табл. 1 з урахуванням непарності функції Лапласа Ф(t1) = –0.191, а Ф(t2) = 0.433. Тоді P(0 < X < 8) = Ф(t2) – Ф(t1) = 0.433+0.191=0.624.

Приклад 2.Значення показника рівня цукру в крові при деякому захворюванні підпорядковується нормальному закону розподілу із середнім значенням 6,5 ммоль/л і стандартним відхиленням 1,5 ммоль/л. Оцінити, який відсоток хворих мають значення показника вище 8,0 ммоль/л.

Розв’язок. Спочатку знайдемо t1 та t2:

t1 =(8–6,5)/1,5= 1 , t2 =(¥–6,5)/1,5= ¥

За таблицею 1 Ф(t1) = 0, 34134, а Ф(t2) = 0.5. Тоді P(8,0 ммоль/л < X < ¥) = Ф(t2) – Ф(t1) = 0.5 – 0, 34134≈0,16.

Таким чином, майже 16 відсотків хворих мають значення показника рівня цукру в крові вищі, ніж 8,0 ммоль/л.

Приклад 3. Маса таблетки при її виготовлені – випадкова величина з нормальним законом розподілу, параметри якого a =100 мг, s2 = 1/900 мг2. Знайти ймовірність браку, якщо допустимі значення (100 ±0,05) мг.

Використавши (2), знайдемо ймовірність попадання випадкової величини в інтервал (100 – δ; 100 + δ), де δ = 0,05:

За табл. 2 додатку Ф(1,5) = 0,4332. Тому Р(|X a| < d) = 2 × 0,4332 = 0,8664. Ймовірність браку

 

Метод малих вибірок

 

Припустимо, що потрібно вивчити сукупність об’єктів однієї природи (цю множину називають генеральною сукупністю) відносно деякого якісного або кількісного параметра. Якщо суцільне обстеження неможливе, то з усієї сукупності вибирають для вивчення частину об’єктів.

Множина випадково відібраних з генеральної сукупності об’єктів називається вибіркою.

Число об’єктів генеральної сукупності та вибірки називають відповіднооб’ємом генеральної сукупності та об’ємом вибірки.

Властивості об’єктів вибірки повинні правильно відображати властивості об’єктів генеральної сукупності, тобто вибірка повинна бути репрезентативною (представницькою). Вважається, що вибірка репрезентативна, якщо всі об’єкти з однаковою ймовірністю можуть попасти у вибірку.

Звичайно, в розпорядженні дослідника є лише дані вибірки, через які потрібно оцінити параметри генеральної сукупності. Припустимо, з теоретичних міркувань вдалось встановити, до якого типу розподілу відноситься ознака Х. Природно, виникає задача оцінити (приблизно визначити) параметри, які характеризують цей розподіл. Наприклад, якщо відомо, що ознака Х має нормальний розподіл, то потрібно оцінити математичне сподівання а та середнє квадратичне відхилення, σ.Щоб статистичні оцінки давали “добре” наближення, вони повинні задовольняти певним вимогам, а саме: бути незміщеними, ефективними і спроможними. Такою оцінкою математичного сподівання є вибіркова середня :

(3)

Цілком очевидно, що вибіркова дисперсія Dв даватиме занижене значення дисперсії усієї генеральної сукупності, тому використовують поняття виправлена дисперсія s2., яку отримують, помноживши вибіркову дисперсію на дріб n/(n – 1),

. (4)

Для оцінки середнього квадратичного відхилення користуються “виправленим” середнім квадратичнимs:

(5)

Варто зазначити, що при досить великих об’ємах вибірки вибіркова дисперсія та виправлена (а, отже, і “виправлене” середнє квадратичне) відрізняються мало. “Виправленим” середнім квадратичним на практиці користуються у випадках, коли n < 30.