Поняття зведення та групування

Предмет, метод та основні завдання статистики

Предметом статистикиє вивчення кіль­кісного співвідношення масових явищ та процесів у нерозривному зв'язку з їхнім якісним змістом за пев­них умов місця та часу. Закономірність, в якій необ­хідність пов'язана в кожному окремому явищі з ви­падковістю і лише в сукупності явищ виявляє себе як закон, називається статистичною законо­мірністю.

Загальні методи наукового дослідження знаходять свій розвиток у специфічних методах тієї чи іншої науки. Можна виділити такі основні групи методів статистики:

• методи масового спостереження;

• методи зведення та групування;

• методи визначення узагальнюючих та синтетич­них показників (методи середніх та відносних вели­чин, аналізу рядів розподілу, вимірювання зв'язку та ін.).

Статистичниий показник, система показників

Статистичний показник- число в су­купності з набором ознак, що характеризують обста­вини, до яких воно відноситься (що, де, коли, яким чином підлягає вимірюванню). Статистичні дані- сукупність показників, отриманих внаслідок статистичного спостереження або обробки даних.

Інформація - дані, необхідні для вирішення конкретної задачі. Якщо дані не відносяться до ви­рішуваної задачі або вже відомі адресату, то вони не містять для нього інформації. Вірогідність статистич­ного показника визначається його адекватністью та точністю вимірювання.

За способом обчислення розрізняють первинні і похідні (вторинні) показники. Первинні отримують в результаті зведення даних статистичного спостере­ження і мають форму абсолютних величин (обсяг ви­робленої за квартал промислової продукції). Похідні обчислюються на базі первинних або похідних. Вони мають форму середніх або відносних величин (середня заробітна плата, питома вага працівників з вищою ос­вітою).

За ознакою часу показники діляться на інтервапьні та моментні (середня спискова чисельність робітників за 1995 p.; чисельність робітників за станом на 1 січня 1996 p.). Інтервальні та моментні показники можуть бути як первинними, так і похідними.

Складність та багатогранність соціально-економіч­них явищ вимагає для їхнього всебічного, комплек­сного вивчення використання системи статис­тичних показників.Така система пов'язана ло­гікою дослідження і часто являє собою ієрархічну структуру, де показники вищих рівнів обчислюются на основі показників нижчих рівнів.

Статистична сукупність.

Статистична сукупність- множина елементів, поєднаних певними спільними умовами та причинами. Сукупність складають окремі одиниці сукупності,які мають спільні риси або ознаки.

Так, всіх студентів інституту (курсу, групи, області) можна розглядати як статистичну сукупність. Кожен студент — елемент сукупності, який має спільні оз­наки: стать, вік, спеціальність, екзаменаційна оцінка і т. д. Але кожний елемент сукупності має своє, індивідуальне значення (рівень) певної ознаки. Так, конкретний студент П. має «своє» значення ознаки «вік», «спеціальність» та ін. В межах всієї сукупності окрема ознака може приймати в певних межах різні значення. Так «стать» може приймати два значення: «чоловіча», «жіноча»; «екзаменаційна оцінка» — чо­тири. Коливання значень ознаки в сукупності нази­вається варіацією.

Рівень значення ознаки в окремих елементів ви­мірюється за допомогою шкали — набору властивостей явища і відповідних їм значень (чисел). Виділяють три основні шкали.

Метрична- звичайна числова шкала, викори­стовується для вимірювання фізичних величин, або результатів обчислення. Для цієї шкали можуть вико­ристовуватись всі арифметичні дії. Для виміру індивідуального рівня значення ознаки «вік» буде ви­користана саме ця шкала. Зазначимо, що для певної сукупності студентів можна вести мову про мінімальне або середнє значення цієї ознаки в сукупності.

Номінальна шкала- шкала найменувань. За допомогою цієї шкали в нашому прикладі може ви­мірюватись ознака «спеціальність». Очевидно, не може бути й мови про якусь «середню» або «максимальну» для групи студентів спеціальність, арифметичні дії над числами, якими ми кодуємо окремі спеціальності, не мають сенсу. Можна лише говорити про спеціаль­ність, яка найчастіше зустрічається в сукупності. Далі таке значення будемо називати «мода».

Порядкова (рангова)шкала визначає не тіль­ки подібність елементів, а й послідовність типу «більше, ніж», «краще, ніж» тощо. Кожній точці шкали присвоюється бал (ранг). Так, отримана на іспиті із статистики оцінка «добре», яку звичайно позначають як «4», відповідає рівню знань, який вищий ніж «задовільно», але нижчий від знань, оцінених на «відмінно». Але, як відомо, дві «2» не є «4». Таким чи­ном, обчислення деканатом «середнього балу» є, з точки зору статистики, не коректним.

З огляду на названі шкали, ознаки можна поділити на кількісні (варіаційні) та атрибутивні (якісні).

Рівень кількісної ознаки вимірюється за допомогою метричної шкали. Для атрибутивної ознаки ви­мірювання означає реєстрацію наявності чи відсут­ності властивостей, тобто класифікація. Кожен клас помічається буквами або цифрами (проводиться оцифровка). Наприклад, атрибутивна ознака «стать»: два класи, позначка — «ч» і «ж», або — «1» і «2»; атри­бутивна ознака «оцінка»: чотири класи, позначка — «5», «4» і т. д., або - «відмінно», «добре» і т. д.

З точки зору взаємозв'язку, відношення «причина-наслідок», ознаки поділяють на факторні та результа­тивні (рівень кваліфікації — заробіток; кількість вне­сених добрив на 1 га — урожайність, ц/га).

У загальному випадку в будь-якому статистичному дослідженні присутні в тій чи іншій мірі такі етапи:

• збір статистичнних даних та їх первинна обробка (чистка);

• зведення, групування, обчислення середніх та відносних величин;

• аналіз варіації, взаємозв'язку, динаміки, пере­вірка гіпотез.

Аналіз, як правило, супроводжують побудовою ста­тистичних таблиць та графіків. Звернемо увагу на те, що якість оформлення тексту матеріалу (аналітичної записки) не тільки сприяє його сприйманню, а й ха­рактеризує кваліфікацію та культуру автора.

Вказана послідовність є лише загальною, а кон­кретний зміст того чи іншого етапу залежить від мети дослідження та характеру даних. На практиці часто доводиться повертатись до попередніх етапів, повто­рювати окремі з них та ін.

У спеціальній літературі часто окремо виділяють так званий «етап розвідувального статистичного ана­лізу», метою якого є ретельне попереднє вивчення первинних даних для подальшого обгрунтованого ви­бору необхідного математичного інструментарію [10].

Широкі можливості і певну специфіку надає стати­стичному дослідженню використання комп'ютерів та спеціальних програмних засобів. Це значно підвищує якість та швидкість виконання роботи - від форму­вання первинного масиву до підготовки та друкування тексту аналітичної записки, статистичних таблиць та графіків.

 

 

Статистичне спостереження

Статистичне спостереження— науко­во організований збір масових даних про явища та процеси, які відбуваються у суспільстві.

План спостереження передбачає мету, об'єкт та одиницю спостереження, джерела та засоби одер-ження даних, час (момент) спостереження та ін. Слід відрізняти одиницюстатистичного спостереження від елементу сукупності.

Одиниця — носій інформації; елемент — носій оз­нак. Так, під час перепису устаткування одиницею спостереження є окреме підприємство, а елементом — окремий верстат чи механізм.

Застосовують дві організаційні форми спостере­ження — звітність і спеціально організовані спостере­ження. До останньої належать переписи, одноразові обліки, вибіркові обстеження.

За охопленням одиниць сукупності спостереження поділяють на суцільне і несуцільне. Останнє буває кількох видів: спостереження основного масиву, ви­біркове, монографічне і анкетне.

При суцільномуобстеженні реєстрації під­лягають усі без винятку елементи сукупності.

Спостереження основного масивуохоплює пе­реважну частину елементів сукупності.

При вибірковомуспостереженні вивчається ли­ше частина сукупності, відібрана спеціальним мето­дом, який:

а) забезпечує рівний шанс для кожної одиниці су­купності потрапити у вибірку;

б) визначає достатню кількість відібраних одиниць. Виконання цих двох умов робить вибірку репрезен­тативною,представницькою.

Це дає можливість приписати, розповсюдити ха­рактеристики, які визначені для вибіркової сукупності (наприклад, середнє значення), на всю сукупність, яка має назву генеральної.

Монографічне спостереження передбачає де­тальний опис невеликої кількості або окремих оди­ниць сукупності, які можуть вважатися типовими.

Анкетніспостереження застосовуються, наприк­лад, при соціологічних дослідженнях.

І, нарешті, існують три способи одержання стати­стичних даних: безпосередній облік фактів, докумен­тальний облік і опитування респондентів.

Розбіжності між даними спостережень та реаль­ними даними називають помилками спостере­ження.

Розрізнюють два види таких помилок. Помилки реєстрації,які виникають внаслідок неправильного встановлення фактів або їх реєстрації. Помилки репрезентативностівластиві тільки вибір­ковому спостереженню і виникають в результаті неко­ректного формування вибіркової сукупності.

Питання для самоконтролю

1. Чим відрізняється поняття «статистика» від поняття «матема­тична статистика»?

2. Як ви розумієте процедуру «чистки» статистичних даних?

3. Назвіть послідовність етапів статистичного дослідження.

4. Чи є необхідною варіація ознаки, щоб множину одиниць на­звати статистичною сукупністю?

5. Назвіть умови використання натуральних та вартісних вимір­ників.

6. Чи можна вважати статистичною сукупністю усі підприємства м. Києва; кульки, добуті з одного підшипника?

7. Назвіть два "приклади ознак для кожної відомої вам шкали вимірювання.

8. Які види статистичного спостереження виділяють залежно від охоплення одиниць сукупності?

9. Які ви знаєте організаційні форми проведення спостере­ження?

10. Назвіть принципи формування вибіркової сукупності.

11. Від чого залежить обсяг вибіркової сукупності?

 

ТЕМА 2: Зведення та групування статистичних даних. Абсолютні та відносні величини

ПЛАН ЛЕКЦІЇ

2.1. Поняття зведення та групування.

2.2. Види групувань.

2.3. Методика проведення.

2.4. Статистичні таблиці та графіки.

2.5. Абсолютні та відносні величини.

 

Поняття зведення та групування.

У результаті статистичного спостереження отри­мують матеріал, який характеризує окремі елементи сукупності. За випадковим і несуттєвим криється за­кономірне та необхідне. Виникає потреба в спеці­альній обробці статистичних даних — зведенні мате­ріалів спостереження.

Зведення— комплекс дій по узагальненню кон­кретних індивідуальних даних, які утворюють сукуп­ність, з метою виявлення типових рис і законо­мірностей, властивих досліджуваному явищу в цілому. Зведення включає групування матеріалу, розробку або вибір показників, які характеризують типові групи та підгрупи, підрахунок групових і загальних підсумків, викладення результатів у вигляді статистичних таблиць та графіків. В основі зведення лежить метод групу­вання.

Статистичне групування— розподіл су­купності на групи за істотними для них ознаками.

 

Види групувань.

За допомогою статистичного групування ви­рішуються три основних завдання:

• Поділення неоднорідної сукупності на якісно од­норідні групи вирішується за допомогою типоло­гічних групувань (поділення працівників за рівнем освіти) (табл. 2.1).

Таблиця 2.1

Групування працівників, що займають посади керівників та спеціалістів, за рівнем освіти

Групи Освіта Кількість працівників, тис. Чол.
Керівники Вища Середня спеціальна 776,9 669,8
Спеціалісти Вища Середня спеціальна 1757,6 1899,6

 

• Вивчення структури та структурних зрушень в якісно однорідних сукупностях, їх розподіл за величи­ною варіюючої ознаки вирішується за допомогою структурних(варіаційних) групувань. Прикладом може бути розподіл працівників підприємства на вікові групи (до 20 років, 20-25 і так далі) (табл. 2.2).

Таблиця 2.2

Групування працівників підприємства на вікові групи

Групи за віком %
20-24
25-29
30-34
35-39
40-44

 

• Виявлення та вивчення взаємозв'язку між озна­ками здійснюється за допомогою аналітичних гру­пувань. Так, наприклад, виділивши окремі групи серед працівників однієї спеціальності за рівнем фаху (І розряд, II розряд і т. д.) та підрахувавши для кожної групи середній місячний заробіток, можна робити де­які припущення щодо наявності статистичного зв'язку між ознаками «фах—заробіток» (мається на увазі рівень фаху і рівень заробітку).

Таке поділення групувань на види досить умовне і на практиці не завжди можна провести чітку межу між ними. Групування за однією ознакою називаються простими. Коли ж для виділення груп беруть по дві і більше ознак, то такі групування називають комбіна­ційними. Наприклад, обстежувану кількість людей по­ділили на групи за кольором волосся, а потім кожну з них у свою чергу ще й за кольором очей (табл. 2.3). Таблиці такого типу мають назву таблиць співза-лежності, вони можуть бути використані при вивченні взаємозв'язку між двома якісними ознаками.

Таблиця 2.3

Розподіл студентів за кольором волосся та кольором очей (чол.)

Колір очей Колір волосся разом  
Світле Русяве Чорне  
Блакитні  
Сірі
Карі
Разом
                   

 

Дійсно, дані табл. 2.3 дають підставу зробити при­пущення, що темний колір очей в якійсь мірі пов'язаний з темним кольором волосся, частіше відповідає йому (якщо, звичайно, останнє не пофар­боване). Іншим прикладом комбінаційного групування є дані табл. 2.4.

 

Методика проведення.

На перший погляд може здаватися, що метод статистичного групування досить простий і з деякою «натяжкою» зветься науковим, але він займає в стати­стичному дослідженні особливе місце. Він допомогає виділити однорідні групи і тим самим визначає межі і можливості використання інших методів.

 

Таблиця 2.4

Залежність між матеріальним становищем працівників та їхнім соціальним статусом (чол.)

 

 

Матеріальне становище Групи респондентів
керівники Робітники і службовці підприємці Всього
Добре
Середне
Погано
Дуже погано
Разом

 

Передумовою використання методу є всебічний аналіз суті явища, чітке визначення істотних ознак та інтервалів групування таким чином, щоб утворені гру­пи складались із подібних одиниць сукупності, а ок­ремі групи суттєво відрізнялись одна від одної.

Якщо групування проводиться за атрибутивною оз­накою, то число груп відповідає числу її різновидів. Якщо ознака альтернативна, то можливі лише дві гру­пи.

При групуванні за варіаційною ознакою необхідно вибрати кількість груп та інтервали групування. Так, при групуванні працівників підприємства за віком інтервали групування, а можливо, і кількість груп бу­дуть відрізнятись від групування за віком студентів стаціонарної форми навчання. Якщо у першому ви­падку може бути ширина інтервалу в п'ять років, а групу працівників у віці, наприклад, 45-50 років слід вважати досить однорідною, то у другому випадку та­кий підхід навряд чи буде доцільним. У кожному ви­падку необхідно приймати до уваги те, скільки оди­ниць сукупності потрапляє в кожну групу.

Якщо інтервали будуть занадто малими, то утво­риться багато малочисельних груп, матеріал розпоро­шиться і не можна буде виявити масові законо- мірності. Якщо брати занадто широкі інтервали, то групи будуть складатись з одиниць, які якісно відріз­няються, вони будуть неоднорідними.

Особливе значення має коректний вибір інтервалів у випадку аналітичних групувань, оскільки невдалий або упереджений підхід може спотворити дійсний ха­рактер взаємозв'язку між явищами.

Відомі формальні правила виділення числа груп, наприклад формула Стерджеса, але нагадаємо, що ос­новну роль при цьому мають відігравати розуміння дослідником явищ, що вивчаються, його досвід та інтуїція.

Величина інтервалує різниця між макси­мальним та мінімальним значеннями ознаки в кожній групі. Інтервали можуть бути рівними і нерівними. Рівнізастосовуються тоді, коли ознака групування розподілена у сукупності більш-менш рівномірно. Ширину рівних інтервалів визначають за формулою

де хmax, xmin - відповідно максимальне і мінімальне значення ознаки в сукупності; п — кількість груп.

Прикладом групування з нерівнимиінтервалами може бути таке групування фірм по кількості пра­цівників: до 10 чол.; 10-30; 30-100; 100-200; 200-500; 500 чол. і більше. При цьому, як правило, нижню ме­жу вважають «включно», а верхню — «виключно». Тоб­то фірма з чисельністю 30 чол. потрапить в третю гру­пу. Перший та останній інтервали в цьому прикладі називаються відкритими.

Іноді, при невеликій кількості спостережень, засто­совують принцип рівнихчастот,при якому одиниці сукупності упорядковуються в порядку зро­стання, а кожна група містить їх однакову кількість. Це виключає утворення малочисельних груп.

В окремих випадках проводять перегрупування да­них з метою утворення нових груп на основі тих, що є, якщо останні не задовольняють мету аналізу.