Числові характеристики вибірки
Математичне сподівання характеризує середнє значення, біля якого групуються можливі значення випадкової величини, а дисперсія характеризує степінь розсіювання (розкидання) цих значень відносно середнього (див. лк.24, §2). Аналогічні числові характеристики існують і для статистичних розподілів. Аналогією математичного сподівання випадкової величини Х є середнє арифметичне спостережуваних значень випадкової величини:
, (1).де хі – значення випадкової величини, - число випробувань (об’єм вибірки). Цю характеристику називають статистичним середнім, або вибірковою середньою.
При великому числі спостережень середнє арифметичне наближається (збігається за ймовірністю) до математичного сподівання і може бути взяте наближено рівним йому.
При вивченні дискретної генеральної сукупності вводиться поняття генеральної середньої:
, (2)
де , якщо ж всі значення x1,x2,…xN різні, то
. (3)
Аналогією дисперсії випадкової величини є статистична дисперсія, або вибіркова дисперсія
, (4)
тобто середнє арифметичне квадратів відхилень спостережуваних значень від їх середнього значення .
Якщо всі значення x1,x2,…xn вибірки об’єму n різні, то
. (5)
Крім того, вводиться ще одна характеристика – вибіркове середнє квадратичне відхилення
. (6)
При вивченні генеральної сукупності вводиться генеральна дисперсія
. (7)
Якщо всі значення x1,x2,…xN різні, то
. (8)
Генеральним середнім квадратичним відхиленням називається .
Зауважимо, що при збільшенні числа спостережень вибірки всі статистичні характеристики будуть збігатись за ймовірністю до відповідних числових характеристик генеральної сукупності.
Структурними середніми вибірки є мода і медіана.
Мода (Мо) – значення варіанти, що має найбільшу частоту. Для дискретного ряду знаходження Мо випливає безпосередньо з означення. Для інтервального ряду аналогічно знаходиться лише модальний інтервал. Вибір значення в цьому інтервалі за моду можна здійснити лише при додаткових припущеннях відносно розподілу значень ознаки всередині інтервалу.
Медіана (Ме) – значення варіанти, відносно якої сукупність ділиться на дві рівні за об’ємом частини. Для знаходження медіани дискретного варіаційного ряду користуються рядом накопичених частот . Нехай nr+1(x) – перша накопичена частота, яка перевищує половину об’єму вибірки, тобто . Тоді і за медіану приймають значення ознаки, якому відповідає nr(x). Для інтервального варіаційного ряду аналогічно знаходиться медіанний інтервал. Знаходження Ме в цьому випадку пов’язане з додатковими припущеннями відносно розподілу значень ознаки всередині інтервалу. З означення медіани випливає, що вона не залежить від значень ознаки, які лежать по обидві сторони від неї. Тому медіану доцільно застосовувати для характеристики розподілів, в яких крайні варіанти невизначені або ж несуттєві. Медіана має таку екстремальну властивість: сума абсолютних величин відхилень варіант Х від Ме є найменшою в порівнянні з сумою абсолютних значень відхилень цих варіант від інших значень xj, тобто
,
Коефіцієнтом варіації вибірки називається відношення:
Розмахом варіації називається R=Xmax – xmin .