ТЕМА 3. ЗВЕДЕННЯ І ГРУПУВАННЯ СТАТИСТИЧНИХ ДАНИХ

Базові поняття та терміни

Статистичне зведення - це процес упорядкування, систематизації і наукової обробки первинного статистичного матеріалу для виявлення типових рис і закономірностей явищ і процесів, що вивчаються.

Складові елементи статистичного зведення:

1. Розробка програми систематизації та групування даних, вибір групувальних ознак і встановлення меж групування;

2. Статистичне групування;

3. Обгрунтування і розробка системи показників для характе­ристики груп і сукупності в цілому;

4. Визначення технологічних схем обробки інформації, типів ЕОМ, програмного забезпечення;

5. Безпосереднє зведення, узагальнення, розрахунок системи показників;

6. Викладення результатів зведення у вигляді рядів розподілу, статистичних таблиць і графіків.

Централізоване зведення - це упорядкування, при якому матеріали статистичного спостереження надсилають у центральний орган державної статистики, де їх обробляють за певною, заздалегідь встановленою програмою.

Децентралізоване зведення передбачає обробку і підрахунок результатів спостереження на місцях, а уже зведені підсумки за певними адміністративними одиницями надсилають Держкомстату України.

Статистичне групування - це розподіл на групи за будь-якою істотною ознакою усієї сукупності інформації про суспільні явища, зібраної в процесі спостереження.

Типологічні групування дають можливість виділити із загаль­ного масиву інформації типові явища і процеси, з яких складається неоднорідна статистична сукупність, визначити істотні відмінності між ними, а також ознаки, що є спільними для усіх груп.

Структурні групування характеризують розподіл якісно одно­рідної сукупності на групи за певною ознакою.

Аналітичні групування застосовуються для вивчення взаємо­зв'язків між явищами, впливу однієї ознаки на іншу.

Ознака, яка впливає на інші та зумовлює їх зміни, називається факторною. Ознака, яка залежить від інших ознак і змінюється під їх впливом, називається результативною.

Просте групування - це розподіл на групи за будь-якою однією ознакою.

Складне групування може бути комбінаційним, якщо в його основі послідовно скомбіновано дві і більше ознак, або багатомірним, якщо воно проводиться за певною множиною ознак одночасно.

Первинне групування здійснюється на основі безпосереднього узагальнення первинних даних статистичного спостереження. Резуль­тат перегрупування називають вторинним групуванням. Перегрупу­вання здійснюється або об'єднанням, або розбиттям інтервалів пер­винного групування.

Групувальна ознака - це ознака, яка покладена в основу групування.

Атрибутивні ознаки не мають кількісного вираження і реєструються у вигляді текстового запису. Число груп, на які поділяється досліджувана сукупність, визначається кількістю різновидів цієї ознаки. Окремим видом атрибутивних групувань є групування за альтернативною ознакою, коли є лише два варіанти атрибутивної ознаки, причому один із них виключає інший.

Кількісні (варіюючі) ознаки - це ознаки, які набувають різних цифрових характеристик і виражаються числовими значеннями. Дискретні (перервні) кількісні ознаки виражаються в кожній групі" тільки цілими числами. Інтервальні або безперервні ознаки можуть набувати різного значення в певних межах і визначаються цілими одиницями та їх частками в межах від одного числа до іншого.

Інтервал групування (величина інтервалу) - різниця між максимальним і мінімальним значеннями ознаки в кожній групі.

Рівні інтервали застосовують тоді, коли кількісна ознака всередині сукупності змінюється рівномірно. Величину інтервалу при групуванні із застосуванням рівних інтервалів визначають за формулою: ,

де h - величина інтервалу;

- максимальне значення ознаки;

- мінімальне значення ознаки;

n - кількість груп.

Нерівними називають інтервали, в яких різниця між верхньою і нижньою межею неоднакова. Нерівні інтервали застосовують у тих випадках, коли варіація групувальної ознаки відбувається нерівно­мірно і в дуже широких межах; вони можуть бути зростаючими і спадними.

Розрізняють інтервали закриті і відкриті. Закритимиє інтервали, в яких визначені максимальні і мінімальні межі. Відкритими називаються інтервали, у яких максимальні або мінімальні значення ознаки заздалегідь невідомі. Тому при групуванні перший і останній інтервали залишаються відкритими.

Орієнтовно оптимальна кількість груп визначається за формулою Стерджеса, за допомогою якої можна намітити число груп п, якщо відома чисельність сукупності N:

N=1+3,322 lg N

Результати зведення і групування можна оформляти у вигляді рядів розподілу, статистичних таблиць і графіків.

Статистичний ряд розподілу - це ряд, який характеризує розподіл одиниць сукупності по групах за будь-якою ознакою, різно­видності якої розташовані у певному порядку.

Ряди розподілу складаються з двох елементів - варіантів і частот.

Варіанта — це окреме значення групувальної ознаки, а частоти - кількість елементів у групі з відповідним значенням ознаки. Частоти, які відповідають певній ознаці, можуть подаватись як в абсолютних значеннях, так і у відносних, виражених коефіцієнтом або відсотком (часткою). Накопичену частоту (частку) називають кумулятивною.

Ряд розподілу, утворений за якісною (атрибутивною) ознакою, називається атрибутивним.

Ряд розподілу сукупності за ознакою, що має кількісне вира­ження, називається варіаційним. Варіаційні ряди залежно від групу­вальної ознаки поділяють на дискретні та інтервальні.

Статистичні таблиці — це спосіб найбільш раціонального, наочного та систематизованого викладення результатів зведення і групування статистичних даних.