Характеристики форми розподілу

Однорідність сукупності є передумовою використання інших статистичних методів (середніх величин, регресійного аналізу тощо). Однорідними є такі сукупності, елементи яких мають спільні властивості і належать до одного типу, класу.

За формою ряди розподілу поділяються на:

= одновершинні;

= двовершинні;

= багато вершинні.

Наявність двох і більше вершин свідчить про неоднорідність сукупності, про поєднання в ній групи з різними рівнями ознаки. Багатовершинність свідчить про неоднорідний склад сукупності, про різнотиповість окремих складових. У такому разі необхідно перегрупувати дані, виокремити однорідні групи. Критерієм однорідності сукупності вважається квадратичний коефіцієнт варіації, який завдяки властивостям середнього квадратичного відхилення в симетричному розподілі становить 0,33.

Розподіл якісно однорідних сукупностей переважно одновершинні. Серед одновершинних розподілів є симетричні та асиметричні, гостро- та плосковершинні.

Якщо варіанти рівновіддалені від центра значень ознаки, такий варіаційний ряд є симетричним. Якщо вершина розподілу зміщена, тобто частоти по обидва боки від центру змінюються неоднаково, тоді варіаційний ряд є асиметричним або скошеним. Якщо вершина зміщена ліворуч, маємо правосторонню асиметрію, та навпаки.

Центром тяжіння статистичної сукупності є типовий рівень ознаки, узагальнююча характеристика всього розмаїття її індивідуальних значень. Такою характеристикою є середня величина, яка може бути арифметичною, модою, медіаною. Крім того, в аналізі розподілу використовують квартилі та децилі.

Квартилі – це варіанти, які поділяють обсяги сукупності на чотири рівні частини, а децилі – на десять рівних частин. Ці характеристики визначаються на основі кумулятивних частот за аналогією з медіаною.

У разі чіткої асиметрії ряду для вивчення економічних явищ середнє значення ознаки доповнюється модою чи медіаною.

В асиметричному розподілі між середньою арифметичною. Медіаною та модою є певні розбіжності:

= при правосторонній асиметрії: ;

= при лівосторонній - .

Стандартизовані відхилення характеризують напрям і міру якісності розподілу. Коефіцієнт асиметрії А є відношенням різниці між середньою арифметичною і модою чи медіаною до середнього квадратичного відхилення:

або

коефіцієнт асиметрії коливається в межах від -3 до +3. в симетричному розподілі А = 0, при правосторонній – А > 0, при лівосторонній – А < 0.

Крутість варіаційного ряду, тобто його високовершинність (гостровершинність) або низьковершинність (плосковершинність) називають ексцесом, тобто це ступінь розосередження елементів сукупності навколо центра розподілу.

Позитивний ексцес відповідає гостровершинним рядам, а від’ємний – більш плосковершинним.

Узагальнюючою характеристикою є моменти, що є середньою арифметичною k-го ступеню відхилень варіантів х від деякої сталої А:

.

Для порівняння ступеня асиметрії різних розподілів використовують стандартизований момент: . Вважають, якщо А < 0,25 – асиметрія низька, якщо А не перевищує 0,5 – середня, при А більшому за 0,5 – висока.

Для вимірювання ексцесу використовують стандартизований момент четвертого порядку: . В симетричному розподілі Е = 3, в разі гостровершинного – Е > 3, для плоско вершинного – Е < 3.

Для визначення міри концентрації елементів сукупності обчислюють наступний коефіцієнт концентрації:

,

де xd jобсяг ознаки;

dj – частка розподілу елементів сукупності.

За умови рівноправного розподілу К = 0, при повній концентрації К = 1, а в решті випадків цей коефіцієнт є тим більший, чим вищий ступінь концентрації.

Закони розподілу дають узагальнюючу характеристику варіації в однорідній сукупності. Фактичні розподіли можна зобразити графічно кривою розподілу. Аналіз рядів варіації рядів розподілу дає змогу розкрити закономірності співвідношення варіантів і частот за допомогою теоретичної кривої. Серед найпоширеніших графічних зображень є крива нормального розподілу. Її використовують як стандарт для порівняння інших розподілів, а аткож під час вибіркового, кореляційно-регресійного, факторного та інших статистичних методів дослідження.

Нормальний розподіл подібний до інших одновершинних розподілів, а тому його часто застосовують як перше наближення в разі статистичного моделювання.

Частоти теоретичної кривої нормального розподілу визначають за формулою:

Інтегральна функція розподілу має вигляд:

,

де π – відношення довжини кола до діаметру,

е – основа натуральних логарифмів (е » 2,1782).

Функція F(X) табульована, її значення знаходять за спеціальною таблицею.

Нормоване відхилення знаходиться за формулою:

де σ – середнє квадратичне відхилення.

Після обчислення теоретичних частот виникає потреба перевірити висунуту гіпотезу про відповідність або невідповідність того чи іншого теоретичного закону розподілу, прийнятого за математичну модель для емпіричного розподілу. Статистика використовує кілька показників, за допомогою яких можна оцінити, наскільки фактичний розподіл узгоджується з нормальним. Такі показники називаються критеріями згоди. Критерії згоди – це певна величина, що оцінює досліджуване явище з певною ймовірністю.

Статистика застосовує критерії згоди Пірсона, Колмогорова, Ястремського, Романовського, Фішера, Вілконсона та інші.

Одним із основних та найпоширеніших показників є критерії Пірсона та Колмогорова.

Англійський вчений К. Пірсон запропонував критерій, статистичну характеристику якого обчислюють за формулою:

,

де f, f – відповідно фактичні та теоретичні частоти.

За спеціальними таблицями визначають імовірність досліджуваного значення χ2 залежно від числа ступенів вільності:

k = m – r,

де т – число груп, r – число обмежених зв’язків.

Якщо фактичне χ2 менше за табличне, то це означає, що при прийнятому рівні значущості розбіги між фактичними та теоретичними частотами вважають випадковими, приймають гіпотезу про закон розподілу.

 


Розглянемо доведення гіпотези про правильність добору типу розподілу на прикладі за допомогою критерію Пірсону.

Урожайність культури, ц/га Кількість господ­дарств х f (t) f f – f (f – f)2
40-42 5,72 2,22 0,0339 2,00
42-44 3,72 1,44 0,1415 -4 1,45
44-46 1,72 0,67 0,3187 0,36
46-48 0,28 0,11 0,3965 0,52
48-50 2,28 0,88 0,2709 -5 1,19
50-52 4,28 1,66 0,1006 -2 0,50
52-54 6,28 2,43 0,0208 2,00
Разом - - - - - - 8,02

Обчислимо:

Висновок: оскільки фактичний критерій набагато менший, ніж табличне значення (8,02 < 13,28), то з імовірністю 0,99 можна вважати доведеним, що тип розподілу добрано правильно, тобто розподіл господарств за врожайністю культури нормальний.

 

Критерій згоди Колмогорова λ оцінює близькість фактичного та теоретичного розподілів за величиною D, тобто за максимальною різницею нагромаджених (кумулятивних) часток (частот) фактичного і теоретичного розподілів.

Критерій Колмогорова визначають за формулою:

,

де D – абсолютна максимальна різниця кумулятивних часток або частот емпіричного та теоретичного розподілів;

п – число спостережень (кількість одиниць сукупності).

Якщо розподіл задано в частотах, то

.

 

Розглянемо методику даного показника на прикладі:

Номер групи Нагромаджені частоти Відхилення
емпіричні Sf теоретичні Sf

Знаходимо:

За спеціальною таблицею ймовірностей для критерію згоди Колмогорова бачимо, що значенню 0,5 відповідає ймовірність 0,9639, тобто з імовірністю 0,9639 можна стверджувати про нормальний розподіл господарств за врожайністю культури.

 

Отже, для перевірки гіпотези про відповідність чи невідповідність теоретичного закону розподілу емпіричному можна використовувати будь-який з наведених критеріїв. Які забезпечують дослідження законів розподілу з різною точністю, надійністю і трудомісткістю.