Ряди розподілу, аналіз варіацій та форми розподілу

1. Ряди розподілу, їх види. Варіаційний ряд розподілу, його елементи і графічне зображення.

2. Характеристика центру розподілу.

3. Абсолютні та відносні показники варіацій.

4. Види дисперсій, способи їх обчислення.

5. Характеристика та властивості форм розподілу.

 

1.Статистична сукупність формується під впливом причин та умов, з одного боку – типових, спільних для всіх елементів сукупності, а з іншого – випадкових, індивідуальних. Ці чинники пов’язані, а їх спільна взаємодія визначає як індивідуальні значення ознаки, так і розподіл ознак у межах сукупності. Характерні властивості статистичної сукупності відбиваються в рядах розподілу.

Ряд розподілу – це упорядкована послідовність пар елементів.

Елементи рядів розподілу:

1) варіанта – значення ознаки, за якою здійснюється групування – хі;

2) частота – кількість повторень варіанти в сукупності – mi.

У рядах розподілу частоти варіант можуть задаватися в наступних формах:

- у формі абсолютної величини – абсолютна частота mi – кількість повторень варіанти в сукупності;

- у формі відносної величини – відносна частка di = mi/ mi(*100%) – частка абсолютних частот варіант ряду розподілу у загальному обсязі сукупності;

- кумулятивна частота (частка) – Smi – результат послідовного об’єднання груп і підсумування відповідних їм частот – нагромадження послідовне абсолютних (відносних) частот:

Sm1=m1, Sm2=m1+m2, ……, Smn=Smn-1+mn=m1+m2+….+mn.

В залежності від способу подання варіант виділяють такі види рядів розподілу:

* атрибутивні, тобто утворені за атрибутивною ознакою, яка виражається словесно (наприклад, поділ населення Закарпаття за національністю: українці – 52%, росіяни – 10%, угорці – 16%, словаки – 12%, інші – 10%);

* варіаційні, побудовані за кількісними ознаками:

- дискретні – ознака є неперервна послідовність кількісних значень;

- інтервальні – ознака є відкритим, закритим, рівним та нерівним інтервалом

Саме у співвідношенні варіант і частот в рядах розподілу і виявляється закономірність розподілу. Базою аналізу закономірностей розподілу є варіаційні дискретні ряди та варіаційні інтервальні ряди з рівними інтервалами. Поглиблений аналіз закономірностей розподілу передбачає характеристику деяких особливостей статистичних сукупностей, зокрема:

1. визначення типового рівня ознаки, який є центром розподілу;

2. вимірювання варіації ознаки, тобто ступеня згрупованості індивідуальних значень ознаки навколо центру розподілу;

3. оцінювання особливостей варіації, тобто ступеня відхилення від симетрії;

4. оцінювання нерівномірності розподілу значень ознаки між окремими елементами сукупності, тобто ступінь її концентрації.

Для графічного зображення рядів розподілу використовують такі методи:

1) побудова полігону розподілу;

2) побудова гістограми;

3) побудова комуляти.

Полігон – це графічне зображення варіаційного ряду в прямокутній системі координат, коли ознака відкладається на осі абсцис (вісь Х), а частоти або частки – на осі ординат. Частіше за все полігон застосовують для зображення дискретного варіаційного ряду, однак його можна використовувати і для інтервального ряду, для чого необхідно визначити середину інтервалу.

Гістограма – це графічне зображення інтервального варіаційного ряду.

Кумулятивні діаграми (комуляти) використовуються для графічного порівняння двох або більше варіаційних розподілів з рівними чи нерівними інтервалами. Для їх побудови використовують прямокутну систему координат, де на осі абсцис відкладають відрізки інтервалів групувань, а на осі ординат – нагромаджені частоти або частки. Кумулятивна крива називається кумулятивним полігоном.

 

2.Характеристиками центру розподілу виступають наступні статистичні показники:

1. середня величину;

2. статистична мода;

3. статистична медіана.

Виділяють також додаткові характеристики центру розподілу:

1) квартилі;

2) децилі.

(Характеристика даних статистичних показників та методика їх розрахунку подана в темі: "Статистичні показники: середні величини").

 

3.В одних сукупностях індивідуальні значення ознаки щільно групуються навколо центра розподілу, інші – значно відхиляються. Чим менші відхилення, тим однорідніша сукупність, а отже, тим більше надійні і типові характеристики центру розподілу, передусім середня величина. Вимірювання ступеня коливання ознаки, її варіації – невід’ємна складова аналізу закономірностей розподілу.

Для вимірювання та оцінювання варіації використовують показники варіації – показники, які визначають міру коливання значень ознаки від центру розподілу, які в свою чергу поділяються на абсолютні та відносні характеристики.

Абсолютні характеристики – визначають межі, в яких змінюється значення ознаки та різноманітні відхилення індивідуальних значень ознаки від центру розподілу. До них відносяться:

- розмах варіації;

- середнє лінійне відхилення;

- дисперсія;

- середнє квадратичне відхилення.

Відносні характеристики – характеризують співвідношення абсолютних характеристик варіації і центру розподілу та використовуються при порівнянні варіації різних ознак однієї сукупності та однієї ознаки в різних сукупностях. До них відносяться:

· коефіцієнт варіації (лінійний, квадратичний);

· коефіцієнт концентрації (осциляції).

Абсолютні характеристики:

1) розмах варіації: R = хmax - хmin, де хmax – максимальне значення ознаки;

хmin – мінімальне значення ознаки.

Характеризує діапазон варіації, тобто межі, в яких змінюється значення ознаки х. Якщо частоти першої і останньої варіант надто малі, то вважають, що розмах неадекватно характеризує варіацію, тому використовуються розмахи:

- квартильний: RQ = Q3 – Q1;

- децильні: RД = Д9 – Д1;

2) всі інші абсолютні характеристики враховують всі відхилення значень ознаки від центра розподілу, представленого середньою величиною:

а) середнє лінійне відхилення характеризує відхилення кожного індивідуального значення ознаки від середнього значення і тим самим визначає однорідність статистичного ряду. Визначається за формулами:

– для дискретного ряду розподілу;

– для інтервального ряду розподілу.

б) дисперсія – ² або Д (середній квадрат відхилення) – характеризує загальну варіацію ознаки навколо загального значення середньої під впливом всіх умов і причин; одиниць виміру немає. Визначається за формулою:

– для дискретного ряду;

– для інтервального ряду.

в) середнє квадратичне відхилення виступає мірилом надійності середньої величини: чим менше значення середнього квадратичного відхилення, тим точніше середнє значення відображає всю сукупність. Загальна формула розрахунку: = ²

– для дискретного ряду;

– для інтервального ряду.

Середнє квадратичне відхилення і дисперсію використовують при побудові багатьох моделей математичної статистики, які використовуються в економіці, для оцінки інноваційних інвестиційних проектів, для прийняття правильних рішень про доцільність вкладання коштів (перевагу буде мати проект в якого дисперсія, середнє квадратичне відхилення будуть мати найменше значення), для прогнозування доходів фірми (хпрог = ±), ризиків при страхуванні, для порівняння ступеня варіації при вибірковому спостереженні соціально-економічних явищ.

Відносні характеристики

Відносні характеристики варіації розраховують як відношення абсолютних характеристик до центру розподілу. Виділяють наступні види відносних показників варіації:

1) лінійний коефіцієнт варіації:

2) квадратичний коефіцієнт варіації:

Даний показник використовується як критерій для оцінки однорідності сукупності, тобто надійності і типовості середньої величини. Вважають сукупність однорідною, а середню типовою для сукупності, якщо коефіцієнт варіації квадратичний: V 33%

3) коефіцієнт концентрації (осциляції):

4) квартальний коефіцієнт варіації використовується тоді, коли центр розподілу поданий статистичною медіаною:

5) коефіцієнт децильної диференціації використовується для оцінки ступеня варіації:

Задача 1. Розрахувати абсолютні та відносні характеристики варіації на основі наступних даних про розподіл житлової площі в розрахунку на одного члена сім’ї:

Житлова площа на 1 члена сім’ї, м2 х Число сімей,   m     хсер х- х- *m (x- )2 (x- )2*m
до 5 -5,5 30,25
5-7 -3,5 12,25 416,5
7-9 -1,5 70,5 2,25 105,75
9-11 0,5 0,25 12,5
11-13 2,5 6,25 162,5
13-15 4,5 20,25 364,5
більше 15 6,5 84,5 42,25 549,25
Разом

 

R = 16-4= 12 м2 Vl =2,56/9,5*100= 26,89%

l = 511/200= 2,56 м2 V = 3,14/9,5*100= 33%

² = 1974/200= 9,87 VR = 12/9,5*100= 126,32%

= 9,87= 3,14 м2

Висновки: варіація житлової площі на одного члена сім’ї за середнім лінійним відхиленням – 2,56 м2 при загальній середній 9,5 м2, середня житлова площа на одного члена сім’ї становить 9,5 м2 при середньому квадратичному відхиленні 3,14 м2; на основі розрахованого квадратичного коефіцієнта варіації можна зробити висновок, що сукупність однорідна (V 33%).

4.Дисперсія (або середній квадрат відхилення) – характеризує загальну варіацію ознаки навколо загального значення середньої під впливом всіх умов і причин.

Розрізняють наступні види дисперсій:

* групова дисперсія;

* міжгрупова дисперсія.

Групова (часткова) дисперсія дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи від середньої арифметичної відповідної групи і характеризує варіацію ознаки стосовно групової середньої ( і – середня групова):

проста:

зважена:

або спрощений її розрахунок: .

Ця дисперсія відображає варіацію ознаки лише за рахунок умов і причин, які діють в середині групи.

Середня з групових (часткових) дисперсій показує результат впливу інших факторів, окрім групувального і обчислюється за формулою:

.

Міжгрупова дисперсія – це міра варіації групових середніх навколо загальної середньої. Дорівнює середньому квадрату відхилень групових середніх і від загальної середньої :

.

Міжгрупова дисперсія характеризує варіацію досліджуваної ознаки під впливом фактора, покладеного в основу групування.

Між наведеними типами дисперсій існує певне співвідношення: загальна дисперсія дорівнює сумі середньої з групових дисперсій та міжгрупової дисперсії:

або .

Ця рівність в статистиці називається правилом додавання. За допомогою даного правила, знаючи два види дисперсій, завжди можна визначити невідомий третій вид. Правило додавання дисперсій використовують при проведенні вибіркового спостереження, для спрощеного обчислення дисперсій громіздкого варіаційного ряду, вимірювання сили зв’язку між явищами та ін.

Дисперсія для альтернативної ознаки визначається як добуток часток:

, де d1 –частка елементів сукупності, яким властива ознака;

d0 – частка решти елементів.

Задача 2. За даними хронометражних спостережень затрати часу на обробку деталі на верстатах становили, хвилин:

в І зміну: 26 24 23 28 25 24;

в ІІ зміну: 28 30 29 33.

Визначити групову дисперсію, середню з групових, міжгрупову дисперсію, загальну дисперсію затрат часу на обробку деталі, показати взаємозв’язок дисперсій.

І зміна ІІ зміна
№ п. п Затрати часу, хв.   х- 1 (х- 1)2   х2 № п. п Затрати часу, хв.   х- 2   (х- 2)2   х2
-2
-1
-2 -1
         
-1          
Разом        

1= 150/6 = 25 хв. 2 = 120/4 = 30 хв.

²1= 16/6= 2,67 ²2= 14/4= 3,5

або ²1= 3766/6 - 252 = 2,67 або ²2= 3614/4 - 302= 3,5

2сер =

= (150+120)/10= 27 хв.

2х =

²= 3,002+6 = 9,002або ² =

 

Кожна з обчислених дисперсій має свій смисл. Загальна дисперсія характеризує загальну варіацію затрат часу на виготовлення деталі в І та ІІ зміни. Вона відображає сумарний вплив усіх можливих чинників: кваліфікацію робітників, технічний стан верстатів, забезпеченість інструментами та ін. Внутрішньогрупові дисперсії вказують на розмір варіації, зумовлені всіма чинниками, окрім відмінностей у змінах роботи. Середня з внутрішньогрупових дисперсій характеризує варіацію, зумовлену всіма факторами (крім зміни), але в середньому для всієї сукупності. Міжгрупова дисперсія характеризує варіацію групових середніх, спричинену різними змінами роботи.

Отже, чим більший внесок міжгрупової дисперсії в загальну дисперсію, тим сильніший вплив групувальної ознаки. У статистичному аналізі широко використовують показник, що виражає частку міжгрупової дисперсії в загальній дисперсії – емпіричний коефіцієнт детермінації (2 – "ета в квадраті"). Визначається як відношення міжгрупової дисперсії до загальної:

.

У наведеному вище прикладі коефіцієнт детермінації дорівнює:

2 = 6/ 9,002= 0,6665 або 66,65%.

Це означає, що 66,65% загальної дисперсії затрат часу на виробництво деталі зумовлені тим, в яку зміну проводилося виробництво. Решта 33,35% загальної дисперсії зумовлена варіацією решти факторів (технічний стан верстатів, кваліфікацією робітників та ін.).

 

5.Різноманітність статистичних сукупностей є передумовою різних форм співвідношення частот і значень ознаки (варіант). За своєю формою ряди розподілу поділяються на:

1) за кількістю вершин:

- одновершинні (одна Мо);

- двовершинні (дві Мо);

- багатовершинні (безліч Мо)

Мода є вершиною ряду розподілу, оскільки це значення варіанти з максимальною частотою mmax. Графічне зображення:

 

 

Тип асиметрії. Якщо частоти варіант рівновіддалені від центра значень ознаки, то такий варіаційний ряд називається симетричним. Основна ознака симетричного ряду розподілу: =Мо=Ме.

 

 

Якщо вершина розподілу зміщена, тобто частоти по обидва боки від центру змінюються неоднаково, тоді варіаційний ряд називають асиметричним тобто скошеним. Розрізняють два види асиметрії – напрям протилежний зміщенню вершини:

а) правостороння асиметрія: >Ме>Мо б) лівостороння асиметрія: <Ме<Мо

(вершина зміщена вліво) (вершина зміщена вправо)

 

 

Тип вершини.Виділяють наступні види рядів розподілу залежно від типу вершини:

· гостровершинні (високо розташована вершина);

· плосковершинні (низько розташована вершина).

Тип вершини характеризує крутість ряду розподілу. Іншими словами характеризує тісноту скупченості індивідуальних значень ознаки до центру розподілу (вершини).

 

 

Для характеристики форми розподілу використовують наступні величини:

1) відносне відхилення (А) – характеризує напрям та міру асиметрії в ряді розподілу:

Або .

На практиці це відхилення за значенням коливається в межах від -3 до +3. Якщо:

А>0 – правостороння асиметрія;

А<0 – лівостороння асиметрія;

А=0 – симетричний ряд розподілу.

2) комплексне оцінювання асиметрії виконується на базі центральних моментів розподілу. Центральний момент – це середня арифметична j-вого ступеня відхилення індивідуальних значень ознаки від центру розподілу:

.

Момент третього порядку (j=3) характеризує асиметрію. Якщо:

М3 = 0 – ряд симетричний;

М3 = чим більше число, тим більше виражена асиметрія.

4) для порівняння ступеня асиметрії різних рядів розподілу використовують стандартизований момент. Вважають, якщо АS <0,25 – асиметрія низька, якщо АS не перевищує 0,5 – середня і при АS більшому за 0,5 – висока:

.

Якщо:

АS>0 – правостороння асиметрія;

АS<0 – лівостороння асиметрія;

АS=0 – ряд розподілу симетричний.

5) для характеристики типу вершини використовують ексцес:

.

Якщо:

Е<3 – плосковершинний ряд розподілу;

Е>3 – гостровершинний ряд;

Е=3 – ряд розподілу симетричний.

Задача 3. Визначити тип, ступінь асиметрії, тип вершини використовуючи дані задачі 1.

х- (x- )3 (x- )3*m (x- )4 (x- )4*m
-5,5 -166,38 -1996,5 915,06 10980,75
-3,5 -42,88 -1457,75 150,06 5102,13
-1,5 -3,38 -158,63 5,06 237,94
0,5 0,13 6,25 0,06 3,13
2,5 15,63 406,25 39,06 1015,63
4,5 91,13 1640,25 410,06 7381,13
6,5 274,63 3570,13 1785,06 23205,81
Разом   2010,0   47926,52

 

А = А =

А>0 – правостороння асиметрія.

М3 =

АS = Е =

АS>0 – середня асиметрія Е<3 – плосковершинний ряд розподілу.

Висновки: даний ряд розподілу асиметричний, середній ступінь асиметрії, правостороння асиметрія, плосковершинний ряд розподілу.