Підготовка даних до обробки

Інформацію, отриману під час методів дослідження (опитування), готують до подальшої обробки. Зібрана інформація має відповідати вимогам повноти, надійності, технологічності.

Під час вивчення дослідник часто стикається з відмовою частини респондентів брати участь в опитуванні або відповідати на оремі запитання. Через це необхідно на стадії конструювання інструментарію ретельно будувати запитання. Важливу роль відіграють також психологічні фактори взаємовідносин між анкетором (інтерв’юером) та респондентом, час і місце проведення опитування. Тому після проведення опитування здійснюють контроль повноти даних і вибраковують анкети з надмірною кількістю “пропусків”.

Під надійністю даних розуміють, по-перше, відповідність структури вибірки структурі генеральної сукупності, по-друге, змістовну однаковість інтерпретації запитань і відповідей дослідником і респондентом, по-третє, точність і логічну несуперечливість відповідей.

Незважаючи на це, бажано ще раз перевірити вже зібраний матеріал, одержати кількісні показники реального складу респондентів і, якщо виявлено розбіжності із структурою генеральної сукупності, виконати так званий ремонт вибірки.

Є два способи “відремонтувати” вибірку: за допомогою вилучення документів (заповнених бланків інструментарію) з масиву та за допомогою додаткового опитування.

Обсяг вибіркової сукупності слід визначити з деяким запасом (10 – 20% для анкетних опитувань) для компенсації втрат, які будуть спричинені вибракуванням певної частини анкет під час перевірок.

Додаткове опитування проводять шляхом відбору респондентів, які мають представляти недостатньо заповнені у вибірці групи. Анкети, одержані під час додаткового опитування, перевіряють на якість даних, як і анкети основного масиву.

Технологічністю даних називають можливість оперативно й легко працювати з відповідями. Для цього необхідно, щоб варіанти відповідей були позначені одноманітно, чітко, відкриті відповіді вписані зрозумілим почерком, сформульовані ясно і не допускали подвійного тлумачення.

Після перевірки якості інформації підраховують кількість документів у робочому масиві (кожний вид документа – анкети, бланки інтерв’ю, картки аналізу формулярів - окремо), одночасно нумеруючи їх. Нумерація необхідна, якщо обробка здійснюється за допомогою ЕОМ. При виявленні помилок у комп’ютерній копії масиву даних лише номер анкети дає можливість звернутися до першоджерела на папері.

Підготовка масиву до статистичного аналізу завершується процедурою кодування відповідей. Для повноцінного використання статистичних методів необхідно, щоб початкові дані були формалізовані, тобто подані у вигляді чисел, інтервалів або уніфікованих варіантів. Формалізовані відповіді становлять так звану кількісну (математичну) модель якісних властивостей досліджуваного об’єкта.

Системи кодування можна поділити на символьні і позиційні. У позиційній системі кожному варіанту анкети відведене місце (позиція) на спеціальній картці, і для фіксації даних або заштриховують олівцем, або пробивають. Для обробки таких карток необхідне спеціальне обладнання.

Більш поширена символьна система кодування, в якій кожний варіант позначається певним символом, кодом. Під символом розуміють умовну позначку, яка може бути номером, літерою, коротким словом. Найпоширеніші цифрові коди, що зумовлено їх високою технологічністю (спрощується введення в ЕОМ).

На комп’ютер можна перекласти рутинну роботу з перевірки репрезентативності вибірки, логічності відповідей. Досліднику залишається лише творча робота – класифікація, яка проводиться також за допомогою ЕОМ. Але, крім наявності відповідного програмного забезпечення, для використання таких можливостей необхідне введення повного масиву даних у комп’ютер для виконання всіх подальших процедур. Зокрема відкриті відповіді необхідно вводити в їх первісному вигляді. Деяка частка анкет пізніше виявиться вибракуваною. Це все, звичайно, помітно збільшує обсяг роботи з перенесення даних на магнітний диск, але витрати потім повністю перекриваються оперативністю, зручністю і точністю обробки.