Дискретний варіаційний ряд часток

Варіанти, хі x1 x2 xm
Частки, wi w1 w2 wm

 

де wі = fi /nчастка варіантихі, п – обсяг сукупності.

Групувати статистичну сукупність у д. в. р. зручно, коли число т порівняно невелике: m<<n, що характерно для дискретної ознаки. Тому у статистиці зазвичай прийнято для дискретної ознаки будувати д. в. р.

Якщо д. в. р. w будується для дискретної ознаки, то його можна розглядати як статистичний аналог закону розподілу генеральної сукупності, з якої вибрана статистична сукупність, що згрупована в даний д. в. р. w.

Інтервальний варіаційний ряд (або і. в. р. ) може мати два види: і. в. р. частот та і. в. р. часток.

Інтервальним варіаційним рядом частот(або і. в. р. f) називається упорядкована послідовність пар “інтервал-частота”, розташованих у порядку зростання меж інтервалів: , де т – кількість інтервалів; fi – частота і-го інтервалу, тобто кількість елементів статистичної сукупності (або з.в.р.), які належать і-му інтервалу; та – відповідно ліва і права межі і-го інтервалу; < .

Інтервали і. в. р. f можуть бути рівними або нерівними, а крайній лівий або правий можуть не мати відповідно лівої та правої меж. В останньому випадку крайні інтервали і. в. р. f називаються відкритими. Надалі розглядатимемо побудову і. в. р. f з рівними закритими інтервалами.

Усі інтервали, крім останнього, вважаються замкненими зліва і незамкненими справа. Останній інтервал ‑ замкненим і справа.

Для побудови і. в. р. f спочатку необхідно вибрати або знайти число інтервалів т. Число т може вибиратись дослідником суб’єктивно на основі його власного досвіду, а може обчислюватись за однією з формул: , або m=1+[log2n], або , або m≈1+ log2n, де [х] – ціла частина числа х. Оскільки т натуральне число, то праві частини останніх двох рівностей повинні округлюватись до цілих. Зауважимо, що

Після вибору числа т знаходимо ширину h інтервалів за формулою

, (1.9)

де та ‑ довільні числа, для яких виконуються умови: , , де та – відповідно найменше та найбільше значення варіант: =у1, =уп. При цьому бажано, щоб відхилення та від відповідно та було якомога меншим і хоча б наближено виконувалась рівність = .

Іноді зручно ширину інтервалу обчислювати за формулою

.

Якщо при цьому не виникає необхідність округлення величини h, то це означає, що = , = . Якщо величину h треба округлювати, то округлення необхідно робити тільки з надлишком, інакше число уп може не потрапити в останній інтервал. При цьому бажано, щоб похибка округлення не перевищувала 0,1h. Після округлення величини h значення та необхідно змінити так, щоб рівність (1.9) виконувалась точно.

Після обчислення числа h знаходимо межі інтервалів:

Будується і. в. р. f зазвичай у вигляді таблиці з двома рядками або стовпцями. У верхньому рядку або лівому стовпцю записуються інтервали, у нижньому рядку або правому стовпцю – частоти (табл. 1.3).

Таблиця 1.3