Опис інформації та обчислення узагальнюючих параметрів

Найчастіше статистичні методи аналізу соціальної інформації використовують для:

— опису інформації та обчислення узагальнюючих параметрів (одновимірна статистика);

— виміру зв'язку між окремими ознаками, отрима­ними у відповідях на різні запитання анкети, якщо як метод збору даних застосовувалося опитування або контент-аналіз текстів ЗМІ, якщо використовувався метод аналізу документів (двовимірна статистика);

— проведення складних математичних процедур, які дають змогу проаналізувати водночас кілька взає­мопов'язаних ознак (багатовимірна статистика).

Застосування методів математичної статистики за­безпечує:

— стислий опис первинної соціологічної інформації, обчислення одновимірних розподілів, наочне уявлення її у вигляді таблиць, графіків, діаграм;

— обчислення зв'язків між ознаками досліджувано­го суспільного явища, оцінку їх за допомогою статистич­них коефіцієнтів зв'язку, застосування кореляційного, регресійного аналізу тощо;

- встановлення латентних (прихованих) факторів, 1КІ визначають взаємозв'язки всередині групи, ознак досліджуваного явища (факторний, латентно-структур­ний аналіз);

— класифікацію ознак та об'єктів, побудову типоло­гій (кластерний аналіз, дискримінантний аналіз, фак­торний аналіз);

— перевірку (підтвердження чи спростування) вихід­них гіпотез дослідження, формулювання нових проблем;

— вироблення коротко- і довгострокових прогнозів щодо функціонування та розвитку певного суспільного явища.

 

Використання методів математичної статистики пе­редбачає певний набір попередніх процедур, до яких на­лежать: підготовка анкети, іншого первинного матеріа­лу до оброблення, яка може здійснюватися вручну чи автоматизовано; вибір рівня майбутнього аналізу (опи­совий чи пояснювальний); вибір конкретних статистич­них процедур для оброблення інформації.

В емпіричному дослідженні соціолог вивчає певну множину об'єктів, наприклад колектив працівників підприємства. Кожному елементу множини притаманні певні властивості (ознаки), скажімо стать, вік, задово­леність умовами праці. Кожний об'єкт має певне зна­чення за кожною ознакою. Так, працівник має одне з двох можливих значень ознаки «Стать» (чоловіча або жіноча), одне з трьох можливих значень ознаки «За­доволеність умовами праці» (задоволений, не зовсім за­доволений, незадоволений), певне значення ознаки «Вік» (число повних років від 18 до 80) та ін.

Як правило, для спрощення оброблення всі значен­ня ознак кодують числами, тому дані для оброблення становлять прямокутну таблицю (матрицю) чисел. Кожний рядок цієї таблиці відповідає одному об'єкту, а кожний стовпчик — певній ознаці. На перетині певного рядка та стовпчика цієї таблиці знаходиться значення певної ознаки певного об'єкта.

 

Ознаки поділяють на якісні та кількісні. Якісні оз­наки не мають кількісного виразу («Стать», «Задоволеність умовами праці»). Кількісні ознаки мають одиниці вимірювання. Наприклад, одиницею вимірювання кількісної ознаки «Вік» є рік, «Заробітна плата» — гривня. Ці ознаки ще називають ознаками, заданими у метричній шкалі.

При кодуванні значень якісної ознаки числами можливі два суттєво відмінні варіанти. У першому значеним якісної ознаки можна впорядковувати, тобто для будь-якої пари значень можна зазначити, яке з них відпові­дає сильнішому виявленню ознаки. Наприклад, зна­чення «Задоволений» відповідає інтенсивнішому ви­явленню ознаки «Задоволеність умовами праці», ніж значення «Не зовсім задоволений». У такому разі доці­льно і числові коди добирати так, щоб сильнішому ви­явленню ознаки відповідало більше число. Так, для оз­наки «Задоволеність умовами праці» можна обрати та­кі числові коди значень: 3 — «Задоволений»; 2 — «Не зовсім задоволений»; 1 — «Незадоволений». Такі якіс­ні шкали ще називають порядковими шкалами, або шкалами рангів. У другому випадку значення якісної ознаки не піддаються жодному змістовому впорядку­ванню. Наприклад, ознака «Стать» містить два зна­чення — «чоловіча» та «жіноча». Для значень ознак такого типу можна добирати будь-які числові коди. Го­ловне, щоб різні значення мали різні коди (тобто не мо­жна кодувати два різні значення ознаки одним чис­лом). Такі якісні пікали ще називають номінальними шкалами. Як правило, для кодування значень ознак у номінальних шкалах використовують цілі додатні чис­ла — 1, 2, 3 і т. д.

Соціологові постійно доводиться при складанні про­грами дослідження обирати (або навіть самостійно конс­труювати) шкали. Від того, наскільки вдало це буде зро­блено, значною мірою залежить результат опрацювання отриманих даних. Крім того, вибір математичного мето­ду аналізу даних тісно пов'язаний зі шкалами відповід­них ознак. Невідповідність такого методу даним є суттє­вою методичною помилкою, що може звести нанівець роботу зі збору даних та обчислення результатів.

Щоб первинні дані можна було використовувати для змістового аналізу і висновків, вони повинні бути неза­лежно упорядковані та опрацьовані. З цією метою за­стосовують спеціальні статистичні методи: групування, обчислення узагальнюючих параметрів та коефіцієнтів, кореляційний, кластерний, факторний аналізи та ін. Незалежно від методу аналізу опрацювання даних по­чинають з попереднього впорядкування інформації, здебільшого за допомогою статистичного групування та побудови статистичних таблиць.

Структуру сукупності об'єктів з точки зору однієї виокремленої ознаки доцільно вивчати за таблицею, в якій для кожного з можливих значень ознаки зафіксо­вано, скільки разів трапляються в сукупності об'єкти, що мають відповідне значення. Таку таблицю назива­ють таблицею одновимірного розподілу, одновимірною таблицею, варіаційним рядом. Наприклад, для ознаки «Задоволеність умовами праці» одновимірна таблиця може мати такий вигляд:

Таблиця 4.3. Ознака «Задоволеність умовами праці»

Значення Код Частота % до всіх опитаних % до тих, хто відповів на питання
Задоволений 12,60 12,93
Не зовсім задоволений 69,75 71,55
Незадоволений 15,13 15,32

 

Кількість об'єктів — 357. Для 348 об'єктів (що стано­вить 97,48% від загальної сукупності) відоме значення оз­наки «Задоволеність умовами праці». Для інших об'єктів сукупності (в даному разі їх 9) значення цієї ознаки неві­доме (наприклад, інформація зібрана методом опитуван­ня, і деякі працівники підприємства не захотіли відпові­дати на поставлене питання). Аналіз таблиці свідчить, що задоволених умовами праці — 45 об'єкти (12,60% від загальної сукупності та 12,93% від кількості працівників, які відповіли на поставлене запитання). Більшість працівників повністю або частково не задоволена умовами праці.

В одновимірній таблиці часто перший або другий стовпчики відсутні (тобто в таблиці зазначають або самі значення, або їх коди);

Неможливо перелічити всі можливі значення оз­нак, заданих у метричних шкалах. Отже, неможливо і безпосередньо побудувати одновимірну таблицю. За таких обставин усі можливі значення ознаки розбивають на інтервали, а потім будують таблицю. Так, для сукупності працівників певного підприємства всі значення ознаки «вік» перебувають між віком наймолодшого робітника (припустимо, 18 років) та віком найстаршого робітника (припустимо, 68). Розіб'ємо їх на 4 інтервали: від 18 до 25 років, від 26 до 40 років, від 41 до 59 років та від 60 до 68 років. Тоді одновимірна таблиця, що демонструє структуру сукупності працівників за віком, набуде іншого вигляду (табл. 4.4):

Таблиця 4.4. Ознака «Вік (інтервал)»

Кількість об'єктів Частота % до всіх опитаних % до тих, хто відповів на питання
18—25 років 12,04 12,04
26—40 років 62,47 62,47
41—59 років 18,77 18,77
60—68 років 6,72 6,72

 

У цій таблиці відсутній стовпчик, в якому зазначені коди інтервалів, а оскільки відомий вік усіх працівників (є відповідні значення для всіх об'єктів), то третій і чет­вертий стовпчики збігаються. Метрична ознака розбита у цій таблиці на різні за розміром (нерівномірні) інтерва­ли. А нерідко доцільно розбивати весь діапазон значень на інтервали однакової довжини (рівномірні інтервали).

Для полегшення аналізу великої кількості таблиць та забезпечення можливості порівняння кількох із них обчислюють узагальнюючі характеристики рядів роз­поділу. Найчастіше використовують характеристику «середнє значення ознаки». Для кількісної ознаки обчислюють її середнє арифметичне значення щодо всіх об'єктів сукупності. Для якісних ознак такою узагаль­нюючою характеристикою ряду є «мода» — значення, що найчастіше зустрічається в одновимірній таблиці.

Щоб оцінити, наскільки репрезентує середнє зна­чення весь ряд розподілу, обчислюють статистичні по­казники варіації ознак. Для кількісних ознак — це ди­сперсія, середнє квадратичне відхилення, коефіцієнт варіації. Для якісних ознак розроблені спеціальні інде­кси якісної варіації. Чим більше значення відповідного показника варіації, тим розсіяніші навколо середнього значення реальні значення ознаки, а отже, тим з біль­шою обережністю потрібно оперувати із середнім зна­ченням при побудові змістових висновків.

Межі варіації також дають змогу оцінити, наскіль­ки однорідною за певною ознакою є сукупність. Якщо ця сукупність неоднорідна, може постати потреба поді­лити її на кілька однорідних за цією ознакою частин та аналізувати кожну з них окремо. Припустимо, що вивчається задоволеність умовами праці на певному під­приємстві. З логічних міркувань або за результатів попередніх досліджень відомо, що заробітна плата праців­ника впливає на його задоволеність умовами праці. Нехай коефіцієнт варіації заробітної плати для всієї сукупності працівників дорівнює 0,7. Тоді необхідно поділити всю сукупність працівників на групи, при­близно однакові за рівнем заробітної плати (щоб у кож­ній групі коефіцієнт варіації зарплати був нижчим від 0,4), та аналізувати задоволеність умовами праці окре­мо у кожній з них.