Числові характеристики вибірки

Математичне сподівання характеризує середнє значення, біля якого групуються можливі значення випадкової величини, а дисперсія характеризує степінь розсіювання (розкидання) цих значень відносно середнього (див. лк.24, §2). Аналогічні числові характеристики існують і для статистичних розподілів. Аналогією математичного сподівання випадкової величини Х є середнє арифметичне спостережуваних значень випадкової величини:

, (1).де хі – значення випадкової величини, - число випробувань (об’єм вибірки). Цю характеристику називають статистичним середнім, або вибірковою середньою.

При великому числі спостережень середнє арифметичне наближається (збігається за ймовірністю) до математичного сподівання і може бути взяте наближено рівним йому.

При вивченні дискретної генеральної сукупності вводиться поняття генеральної середньої:

, (2)

де , якщо ж всі значення x1,x2,…xN різні, то

. (3)

Аналогією дисперсії випадкової величини є статистична дисперсія, або вибіркова дисперсія

, (4)

тобто середнє арифметичне квадратів відхилень спостережуваних значень від їх середнього значення .

Якщо всі значення x1,x2,…xn вибірки об’єму n різні, то

. (5)

Крім того, вводиться ще одна характеристика – вибіркове середнє квадратичне відхилення

. (6)

При вивченні генеральної сукупності вводиться генеральна дисперсія

. (7)

Якщо всі значення x1,x2,…xN різні, то

. (8)

Генеральним середнім квадратичним відхиленням називається .

 

Зауважимо, що при збільшенні числа спостережень вибірки всі статистичні характеристики будуть збігатись за ймовірністю до відповідних числових характеристик генеральної сукупності.

Структурними середніми вибірки є мода і медіана.

Мода (Мо) – значення варіанти, що має найбільшу частоту. Для дискретного ряду знаходження Мо випливає безпосередньо з означення. Для інтервального ряду аналогічно знаходиться лише модальний інтервал. Вибір значення в цьому інтервалі за моду можна здійснити лише при додаткових припущеннях відносно розподілу значень ознаки всередині інтервалу.

Медіана (Ме) – значення варіанти, відносно якої сукупність ділиться на дві рівні за об’ємом частини. Для знаходження медіани дискретного варіаційного ряду користуються рядом накопичених частот . Нехай nr+1(x) – перша накопичена частота, яка перевищує половину об’єму вибірки, тобто . Тоді і за медіану приймають значення ознаки, якому відповідає nr(x). Для інтервального варіаційного ряду аналогічно знаходиться медіанний інтервал. Знаходження Ме в цьому випадку пов’язане з додатковими припущеннями відносно розподілу значень ознаки всередині інтервалу. З означення медіани випливає, що вона не залежить від значень ознаки, які лежать по обидві сторони від неї. Тому медіану доцільно застосовувати для характеристики розподілів, в яких крайні варіанти невизначені або ж несуттєві. Медіана має таку екстремальну властивість: сума абсолютних величин відхилень варіант Х від Ме є найменшою в порівнянні з сумою абсолютних значень відхилень цих варіант від інших значень xj, тобто

,

Коефіцієнтом варіації вибірки називається відношення:

Розмахом варіації називається R=Xmax – xmin .

 



"5-41621.php">35
  • Далее ⇒