Обчислення узагальнюючих показників варіації

Таблиця 5.1

Назва показників варіації Формули показників варіації:
    для незгрупованих даних для згрупованих даних
Середнє лінійне відхилення    
Середній квадрат відхилень (дисперсія)    
Середнє квадратичне відхилення
   

Середнє квадратичне відхилення (стандартне відхилення) є мірилом надійності се­редньої. Чим менше середнє квадратичне відхилення, тим об'єк­тивніше середня арифметична відображує всю сукупність.

Показник середнього лінійного відхилення більш обґрунтований порівняно з розмахом варіації. він не залежить від випадкових коливань крайніх значень, оскільки спирається на всі значення ознаки, враховує всю суму відхилень індивідуальних варіантів від середньої арифметичної та частоти. Однак і цей показник має суттєві недоліки. Основним є те, що в ньому не враховуються знаки (спрямованість) відхилень. Довільне відкидання алгебраїчних знаків призводить до того, що математичні властивості цього показника є далеко не елементарними, а це значно ускладнює використання середнього лінійного відхилення при розв’язуванні задач, пов’язаних з ймовірнісними розрахунками. Тому середнє лінійне відхилення використовують дуже рідко.

Намагання скласти показник варіації, який би усунув недоліки розмаху варіації та середнього лінійного відхилення призводить до дисперсії та середнього квадратичного відхилення. Змістовне значення середнього квадратичного відхилення таке ж саме, як і середнього лінійного відхилення. Воно показує, на скільки в середньому відхиляються індивідуальні значення варіант від їх середнього значення.

Усі розглянуті показники варіації — розмах варіації, се­реднє лінійне відхилення, середній квадрат відхилень та середнє квадратичне відхилення — завжди виражають у одиницях вихідних даних ряду та середньої величини. Всі вони є абсолют­ним виміром варіації. А це означає, що безпосередньо порівню­вати абсолютні показники варіації у варіаційних рядах різних явищ не можна. Для того, щоб забезпечити їх порівняння, потрібно обчислити показники, які характеризують варіацію, ви­ражену в стандартних величинах, наприклад, у відсотках. Відно­шення абсолютних характеристик варіації до середньої величини називаються коефіцієнтами варіації. Коефіцієнти варіації розра­ховують за формулами:

- лінійний

- квадратичний

- осциляції

Коефіцієнти варіації дозволяють порівнювати варіацію різних ознак або варіацію однієї ознаки у різних сукупностях. Для порівняння варіацій найчастіше використовують квадратич­ний коефіцієнт варіації. Цей показник вживається для оцінки од­норідності сукупності, тобто надійності і типовості середньої ве­личини. Розрізняють такі значення відносних коливань:

V<10% - незначне коливання

V= від 10% до 30% - середнє коливання

V>30% - велике коливання

Вважають, що сукупність є однорідною, а середня типовою, коли коефіцієнт не перевищує 33%.

Лінійний коефіцієнт варіації або відносне лінійне відхилення характерезує частку середнього значення абсолютних відхилень від середньої величини.

Квадратичний коефіцієнт варіації свідчить про коливання індивідуальних значень відносно середнього рівня вцілому по сукупності.

З вище наведеного можна зробити наступні висновки:

1. Середня величина (середня арифметична) має важливе пізнавальне значення, однак вона не завжди об'єктивно і не завжди із однаковим ступенем достовірності відображує внутрішній стан статистичної сукупності. При однаковому значенні середньої статистичні сукупності можуть бути досить нерівно­цінні за рівнем коливань (варіації).

2. Чим менше відхилення, тим типовіша середня, тим більш однорідна сукупність.

3. Універсальним показником варіації є коефіцієнт варіації, цінність якого полягає в тому, що ним можна користу­ватись для характеристики і порівняння варіації різних сукупно­стей і різних явищ.

 

2. Структурні характеристики варіації (мода, медіана…)

Крім перелічених вище середніх, у статистичному аналізі, як узагаль­нюючі характеристики сукупності, використовують такі значення ознаки, які відрізняються особливим розташуванням у варіаційному ряду розподілу. Це так звані структурні (позиційні) середні.Із них найчастіше застосову­ють моду і медіану.

Величина моди і медіани залежить лише від характеру частот, тобто від структури розподілу. Якщо величина середньої арифметичної залежить від усіх значень ознаки, то величина моди і медіани не залежить від крайніх зна­чень ознаки. Це особливо важливо для рядів розподілу, в яких крайні зна­чення ознаки мають нечітко виражені межі (до і понад).

Модоюназивають значення ознаки, що має найбільшу частоту в ста­тистичному ряду розподілу. Спосіб обчислення моди залежить від того, в якому вигляді дано значення ознаки: дискретного чи інтервального ряду роз­поділу. В дискретних варіаційних рядах моду обчислюють без додаткових розрахунків за значенням варіанти з найбільшою частотою. Модальною ціною на той або інший продукт на ринку є та ціна, яка спо­стерігається найчастіше.

В інтервальному варіаційному ряду розподілу модою наближено вва­жають центральний вараінт так званого модального інтервалу, тобто того інтервалу, який має найбільшу частоту. В межах інтервалу необхідно знайти те значення ознаки, яке є модою.

В інтервальних варіаційних рядах розподілу моду визначають за фор­мулою:

де х0 - нижня (мінімальна) межа модального інтервалу; h - величина інтер­валу; f1 - частота передмодального інтервалу; f2 - частота модального ін­тервалу;f3 - частота післямодального інтервалу.

Формула ґрунтується на припущенні, що відстані від нижньої межі мо­дального інтервалу до моди і від моди до верхньої межі модального інтерва­лу прямо пропорційні різницям між чисельностями (частотами) модального інтервалу і інтервалів, що прилягають до нього.

Медіаноюназивають таке значення ознаки, яке поділяє ранжирований ряд розподілу на дві рівні частини, тобто значення, яке перебуває всередині ряду розподілу. Якщо в дискретному варіаційному ряду 2 т + 1 випадків, то значення ознаки у випадку т + 1 є медіанним. Якщо в ряду парне число 2 т випадків, медіану визначають як середню арифметичну з двох серединних значень. Наприклад, якщо 15 комбайнерів держгоспу розташувати у поряд­ку зростання, тобто в ранжирований ряд за кількістю намолоченого ними зерна, то намолот зерна у восьмого комбайнера буде медіанним. Якщо ж число комбайнерів буде 16 чол., то медіаною буде середнє значення намолоту зерна восьмого і дев'ятого комбайнерів.

В інтервальному варіаційному ряду розподілу медіану визначають за формулою:

де x0 - нижня (мінімальна) межа медіанного інтервалу; h - величина інтер­валу; 0,5 - половина суми частот інтервального ряду розподілу; Sme-1 - сума нагромаджених частот інтервалу, що передує ме­діанному; fme - частота медіанного інтервалу.

Для визначення медіани в інтервальному варіаційному ряду розподілу треба обчислити нагромаджені частоти і відшукати медіанний інтервал. Під нагромадженими частотамирозуміють наростаючий підсумок частот, по­чинаючи з першого інтервалу. Медіанним є той інтервал, на який припадає перша нагромаджена частота, що дорівнює або перевищує половину всього обсягу су­купності.

В одномодальних симетричних рядах розподілу середня арифметична, мода і медіана збігаються.

Для помірно асиметричних розподілів К. Пірсон встановив таке наближене співвідношення між цими характеристиками:

; або .

Моду і медіану застосовують звичайно в тих випадках, коли визначати середню арифметичну недоцільно. Так, немає сенсу обчислювати середній розмір одягу і взуття, що їх виробляють фабрики. Для цього досить знати модальні розміри одягу і взуття, тобто ті, які користуються найбільшим по­питом у населення з тим, щоб фабрики, плануючи своє виробництво, мог­ли якомога краще задовольнити попит покупців саме на ці розміри одягу і взуття.

Медіана широко використовується при проектуванні місць будівни­цтва об'єктів масового обслуговування населення (шкільних та дошкільних закладів, кінотеатрів, підприємств служби побуту і торгівлі тощо). Наприк­лад, продовольчий магазин у сільському селищі доцільно розташувати в та­кій точці, щоб він обслуговував половину кількості мешканців селища, а не розташовувався точно всередині його.

Додатково до медіани для характеристики структури варіаційного ряду розподілу обчислюють квартилі, які поділяють ранжирований ряд на 4 рів­ні частини, і децилі, які поділяють ранжирований ряд на 10 рівних частин. Другий квартиль Q2 дорівнює медіані, а перший – Q1 третій - Q3 обчислю­ють аналогічно розрахунку медіані, тільки замість медіанного інтервалу беруть для першого квартиля інтервал, в якому знаходиться варіанта, що відокремлює 1/4 кількості частот, а для третього квартиля - інтервал, в яко­му знаходиться варіанта, що відокремлює 3/4 кількості частот.

В інтервальному ряду розподілу перший і третій квартиль розрахову­ють за такими формулами:

де х0 - нижні (мінімальні) межі квартальних інтервалів; h - величина інтервалу; - сума нагромаджених частот ряду розподілу; і - нагромаджені частоти інтервалу, що передує інтервальному відповідно для першого і третього квартилів; і - частоти квартильних інтервалів.

 

3. Математичні властивості дисперсії та її види

Дисперсія (середній квадрат відхилень) має певні матема­тичні властивості, урахування яких дає змогу суттєво спростити її обчислення.

1. Якщо всі значення варіант зменшити на будь-яке стале чис­ло А, то середній квадрат відхилень від цього не зміниться.

2. Якщо всі значення варіант поділити на будь-яке стале чис­ло і, то дисперсія зменшиться внаслідок цього в і2 разів, а середнє квадратичне відхилення — в і разів.

З. Якщо обчислити квадрат відхилень від будь-якої величини А, що тією чи іншою мірою відмінна від середньої арифметич­ної , то він завжди буде більшим за середній квадрат відхи­лень (дисперсію) , обчислений від середньої арифметичної , - причому більший на певне значення — квадрат різниці між середньою і цією величиною, тобто на

або

Дисперсія від середньої величини має властивість мінімаль­ності, тобто вона завжди менша від дисперсії, обчисленої від будь-яких інших величин. У такому випадку, коли величину А прирівняти до нуля, то:

або .

Отже, дисперсія ознаки, або середній квадрат відхилень дорівнює різниці між середнім квадратом значень ознаки і квадратом середнього значення ознаки. Таким чином, не об­числюючи відхилень можна обчислити дисперсію.

На основі наведених математичних властивостей дисперсії базується спрощений спосіб розрахунку дисперсії та середнього квадратичного відхилення, який називається способом моментів, або спосіб відліку від умовного нуля. Він застосовується при умові рівних інтервалів. Використання цього методу є доцільним при великих вихідних значеннях інтервального ряду розподілу.

після відповідних перетворень дістанемо:

де - момент першого порядку;

- момент другого порядку;

А – центр центрального інтервалу;

і – ширина інтервалів ( інтервали повинні бути рівні)

Отже, дисперсія, обчислена за способом моментів, дорів­нює добутку квадрата інтервалу на різницю моменту другого по­рядку і квадрата моменту першого порядку:

.

Варіація ознаки формується під впливом різних факторів При вивченні дисперсії досліджуваної ознаки в межах даної сукуп­ності можна визначити три показники коливання ознаки: загальну дисперсію, міжгрупову дисперсію і середню із групових дисперсій.

Загальна дисперсія, яку вже було розглянуто, характеризує загальну варіацію ознаки під впливом усіх умов і причин, що зу­мовили цю варіацію.

Для визначення впливу постійного фактора на розмір варіації потрібно розбити всю сукупність на групи та знайти, як змінюється результат під дією чинника, покладеного в основу групування. Для цього попередньо необхідно обчислити для кожної групи середню величину ознаки, групові (часткові) дис­персії, середню з групових та міжгрупову дисперсію.

Групова (внутрішньогрупова) дисперсія дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи від середньої арифметичної відповідної групи. Вона характеризує варіацію ознаки, зумовлену не врахованими при групуванні факторами. Її можна обчислити як середню просту і як зважену за формулами:

або спрощеним способом .

Ця дисперсія відображує варіацію ознаки лише за рахунок умов і причин, що діють всередині групи.

Середня з групових дисперсій — це середня арифметична зважена з групових дисперсій: .

Міжгрупова (факторна) дисперсія дорівнює середньому квадрату відхилень групових середніх від загальної середньої :

де -середня кожної окремої групи; - загальна середня всієї сукупності; - частоти відповідних груп.

Міжгрупова дисперсія характеризує варіацію результативної ознаки за рахунок групувальної ознаки (під впливом досліджуваного фактора, покладеного в основу групування).

Між наведеними видами дисперсій існує певне співвідношення: загальна дисперсія дорівнює сумі середньої з групових та міжгрупової дисперсії. Це співвідношення називають правилом додавання диспер­сій, за яким, знаючи два види дисперсій, можна визначити третій.

Зіставленням міжгрупової та загальної дисперсій (відповідно до обсягів варіації) можна визначити ступінь впливу факторної ознаки , покладеної в основу групування, на коливання результативної ознаки. при цьому визначають так зване кореляційне відношення:

.

Воно характеризує частку варіації, зумовлену факторною ознакою.

4. Характеристики форми розподілу

Однорідність сукупності — це передумова використання інших статистичних методів (середніх величин, регресійного аналізу тощо). Однорідними вважаються такі сукупності, елемен­ти яких мають спільні властивості (риси) і належать до одного типу, класу. При цьому однорідність означає не повну то­тожність рис і властивостей елементів, а лише наявність у них за­гального в істотному, головному.

Формою розподілу статистичної сукупності прийнято нази­вати криву співвідношення частот і значень варіюючої ознаки. Різноманітність статистичних сукупностей — передумова різних форм співвідношення частот і варіюючої ознаки. За своєю фор­мою розподіли поділяють на такі види: одно-, дво- і багатовершинні. Наявність двох і більше вершин свідчить про неод­норідність сукупності, про поєднання в ній груп із різними рівня­ми ознаки. Розподіли якісно однорідних сукупностей, як прави­ло, одновершинні. Серед одновершинних розподілів є симет­ричні і асиметричні (скошені), гостро- і плосковершинні.

У симетричному розподілі рівновіддалені від центру значен­ня ознаки мають однакові частоти, а в асиметричному — верши­на розподілу зміщена. Напрям асиметрії протилежний напряму зміщення вершини. Якщо вершина зміщена вліво, то це правостороння асиметрія, і навпаки.

Найпростішою мірою асиметрії є відхилення між середньою арифметичною, модою і медіаною. В симетричному розподілі ха­рактеристики центру мають однакові значення = Ме = Мо ; в асиметричному між ними існують певні розбіжності. При правосторонній асиметрії > Ме > Мо, при лівосторонній, <Ме <Мо.

Асиметрія як відносна статистична характеристика дорівнює різниці між середнім значенням і медіаною або модою, поділени­ми на середнє квадратичне відхилення.

Стандартизовані відхилення або характеризують напрям і міру скошеності розподілу. Очевидно, що в симетричному розподілі А = 0, при правосторонній аси­метрії А > 0, при лівосторонній А < 0.

У симетричних та помірно асиметричних розподілах вимірюється ексцес розподілу.

Асиметрія та ексцес – це дві пов’язані з варіацією властивості форми розподілу. Комплексна їх оцінка виконується на основі центральних моментів розподілу. Алгебраїчно центральний момент розподілу – це середня арифметична k- того ступеня відхилення індивідуальних значень ознаки від середньої:

.

Очевидно, що момент 2-го порядку є дисперсією, яка харак­теризує варіацію. Моменти 3-го і 4-го порядку характеризують відповідно асиметрію та ексцес. У симетричному розподілі = 0. Чим більша скошеність ряду, тим більше значення . Для того, щоб характеристика скошеності не залежала від масштабу вимі­рювання ознаки, для порівняння ступеня асиметрії різних розпо­ділів використовується стандартизований момент При правосторонній асиметрії коефіцієнт Аs > 0, при лівосторонній Аs < 0. Звідси правостороння асиметрія називається додатньою, а лівостороння — від'ємною. Вважається, що при Аs < 0,25 асимет­рія низька, якщо Аs не перевищує 0,5 — середня, при Аs > 0,5 — висока.

Для вимірювання ексцесу використовується стандартизова­ний момент 4-го порядку Еk = У симетричному, близько­му до нормального розподілі Еk = 3. Очевидно, при гостровершинному розподілі Еk > З, при плосковершинному Еk < 3.

На відхиленнях часток двох розподілів — за кількістю елементів сукупності і обся­гом значень ознаки — грунтується оцінка концентрації. Як міра концентрації використовується півсума модулів відхилень:

Число К має назву коефіцієнта концентрації. При рівномір­ному розподілі К = 0, при повній концентрації К= 1. Звідси вип­ливає, що коефіцієнт концентрації змінюється у межах від 0 до 1.

Коефіцієнти концентрації широко використовуються в ре­гіональному аналізі для оцінки рівномірності територіального розподілу виробничих потужностей, фінансових ресурсів тощо.