Машинная обработка базы данных

Процедуры упорядочивания фактов

Редактирование и кодирование

Осуществляется в отношении данных, полученных с помощью количественных методов (анкетирование, формализованное интервью, стандартизированное наблюдение). Процедура редактирования начинается с проверки полученных с помощью количественных методов данных на точность, полноту и качество заполнения.

Проверка на точность предполагает, что в заполненных анкетах, бланках интервью или регистрационных листах наблюдений нет противоречий. К примеру, если на вопрос анкеты: «Занимаетесь ли Вы художественной самодеятельностью?» был получен отрицательный ответ, а на вопрос «В каких секциях студенческого клуба Вы занимаетесь? – получен ответ «в театральной студии», становится очевидным, что респондент либо ошибся, либо сознательно вводит в заблуждение. В этом случае анализ ответов на другие вопросы позволит скорректировать выявленные ошибки или забраковать данную анкету.

Полнота информации также является важным критерием оценки качества. Обычно анкеты и опросные листы выбраковываются, если в них пропущено свыше 20% вопросов. Особые требования предъявляются к «паспортичке». В некоторых случаях пропуск даже одного пункта служит основанием выбраковки. Однако в ряде случаев возможно восстановление пропущенных вопросов. Это можно делать, исходя из общей логики ответов респондента на вопросы анкеты, либо воспроизводя в памяти саму процедуру устного опроса.

Качество заполнения оценивается по таким критериям как разборчивость, понятность ответов на полузакрытые и открытые вопросы, что выступает важной предпосылкой правильности кодирования.

Итогом процедуры проверки информации на точность, полноту и качество заполнения может быть выбраковка части анкет. Учитывая эту возможность, при подготовке инструментария необходимо предусматривать тираж, немного превышающий объем выборки.

Процедура кодирования означает присваивание каждому варианту ответов некоего условного числа – кода. При анкетировании процедура кодирования осуществляется еще на стадии разработки инструмента в процессе формулировки вопросов анкеты, когда каждому варианту ответов присваивается номер.

 

Пример 4.1. Варианты кодирования

 

Порядковая система кодирования Позиционная система кодирования
1.Как вы считаете, кому легче поступить в вуз? 1.Юношам 2.Девушкам 3.Пол не имеет значения 2.Как Вы думаете, кому легче трудоустроиться с Вашей профессией? 4.Мужчинам 5.Женщинам 6.Возможности трудоустройства одинаковы 1.Как вы считаете, кому легче поступить в вуз? 1.1 Юношам 1.2 Девушкам Пол не имеет значения 2.Как Вы думаете, кому легче трудоустроиться с Вашей профессией? 2.1 Мужчинам 2.2 Женщинам 2.3 Возможности трудоустройства одинаковы

 

Как видно из приведенного примера, существует две системы кодирования: порядковая (сплошная нумерация) и позиционная (автономная нумерация вариантов ответов в каждом вопросе).

Машинная обработка базы данных

Следующим этапом выступает «набивка» – ввод первичной информации в базу данных. Для машинной обработки можно использовать программу Microsoft Excel, либо статистический пакет для работы в области социальных наук (SPSS). Пакет имеет модульную структуру. Каждый модуль предназначен для реализации какой-либо функции или определённого метода преобразования данных. В базовый пакет входят модули, реализующие получение линейных распределений и таблиц сопряжённости, статистические коэффициенты связи и другие статистические характеристики рядов и таблиц распределений. Кроме того он включает все методы многомерной статистики (корреляционный, факторный, кластерный анализ). Последние версии этого пакета разработаны для среды WINDOWS и включают новые алгоритмы реализации факторного и кластерного анализа, анализ временных рядов, расширенный ассортимент графического оформления результатов, более простой язык общения и некоторые другие, главным образом, сервисные возможности.