Планирование выборок и надежность данных

Основная цель составления выборок — представлять людей из более широкой популяции. Выше был пока представлен только такой способ образования репрезентативной выборки, как случайный отбор из популяции. Однако кроме вероятностных выборок в психологических исследованиях могут быть представлены и иные выборки, носящие название селективных, или целевых.

Планирование исследования с вероятностными выборками (как эксперимента, так и выборочного обследования) обычно включает три следующих условия.

1. Возможность обращения ко всем членам популяции как потенциальным участникам исследования.

2. Возможность использования случайной последовательности или правила приписывания номеров потенциальным участникам.

Экскурс 5.6

Например, при телефонном опросе в пределах г. Москвы, какую телепередачу смотрят члены семьи, исследователи имеют доступ ко всем телефонным номерам. И в случайной последовательности выбирают, скажем, каждый десятитысячный номер. Тогда, если номеров было 10 млн, в выборку попадут 1000 респондентов. В данном примере задан способ обращения — по телефону. Для других исследовательских целей именно недоступность (или неравнозначная доступность) разных членов популяции может вводить смешения с побочными переменными. Так, на объявление о возможности участия в эксперименте откликнутся не равновероятным образом лица, испытывающие и не испытывающие доверие к психологам; те, которым предлагаемая цель участия показалась интересной и неинтересной, и т.д. Поэтому запись в таким образом подготовленные выборки вряд ли будет адекватно описываться термином случайной выборки.

В случае простой случайной выборки — для данного примера — порядок выбора номеров абонентов телефонной сети будет результатом следования генерированной (сегодня с помощью компьютера) последовательности случайных чисел. В запланированные 1000 номеров каждый номер городской сети (из всего списка 10 000 000 номеров) имеет равную вероятность попадания. Предполагается, что процедура отбора действительно опирается на случайную последовательность номеров. Если в эту выборку попадут телефоны не квартир, а офисов, то вопрос о просматриваемой телепередаче останется без ответа. Не все лица, которым дозвонились, захотят отвечать. Это случаи выпадения респондентов из запланированной выборки. Следует учитывать также, что единицей выступал здесь не отдельный человек, а абонентский помер.

В случае систематической выборки используется некоторое правило обращения ко всем потенциальным участникам по списку, где при заданной вероятности попадания в список (каждый тысячный номер в приведенном примере) указано еще, каким образом извлекается каждая единица из списка. Например, это каждый номер, следующий после последовательности в 1000 номеров. Тогда последовательность случайных чисел не используется и в выборке случайно оказывается тот участник (респондент, или испытуемый), которому был приписан (в общем списке) номер, соответствующий тысячной позиции.

3. Возможность рассматривать списки членов популяции как действительно случайные в силу отсутствия связи какого-либо свойства человека и его места в списке.

Дело в том, что последовательность фамилий потенциальных участников в списке может носить неслучайный характер. Тогда стратегия систематического отбора может привести к казусам неслучайности.

Экскурс 5.7

Пример систематического смешения, введенного такой стратегией отбора. В одном из американских обследований военнослужащих было запланировано выбрать каждого второго человека по списку каждого из подразделений. Было отобрано 10 тыс. военнослужащих, которые по предположению психологов должны были иметь разные звания и разные личностные особенности. Казалось бы, вошедшие в выборку лица должны были быть репрезентативны для "популяции" военнослужащих (в этот год измерений). Но этого не произошло. Психологи обнаружили, что ими были отобраны люди только с одним и тем же воинским званием (допустим, сержанты). Списки подразделений учитывали не алфавитную последовательность фамилий, а ранжировку лиц по воинскому званию. Вторым в списке всегда шел человек в звании сержанта. Все сержанты и были систематически отобраны. Неслучайный порядок представленности людей в списке привел к тому, что выборка оказалась нерепрезентативной. Таким образом, исследователь должен точно знать способ приписывания номеров в "естественных" группах и списках, чтобы формировать именно случайные выборки.

Многослойная, или стратифицированная, случайная выборка — это выборка, отобранная в два этапа: на первом был использован определенный критерий распределения потенциальных испытуемых по слоям (например, по полу или воинскому званию), а на следующем уже применен вероятностный отбор (в заданном соотношении — каждый пятый или каждый пятитысячный из популяции).

Кроме указанных трех типов вероятностных выборок (простой, систематической или многослойной) следует указать также еще как минимум на два широко используемых случая составления селективных выборок. Обсудим их источники.

Первый случай представлен обращением к уже отобранным популяциям — селективным выборкам в узком смысле этого слова. Так, многие психологические работы выполняются на студентах. Но студенты — это лица, которые уже прошли предварительный отбор (экзамены или зачисление по другому критерию — ЕГЭ, предыдущих успехов и характеристик и т.д.). Таким образом, студенческая популяция представляет не случайно отобранных лиц из более широкой — лиц такого же возраста до дифференциации их на поступивших и не поступивших в вузы. Следствием этого является, например, различие в уровне интеллекта. Поэтому обобщения связей показателей 10 с другими свойствами (представление их как общих закономерностей) вызывают возражения рецензентов научных статей из-за того, что студенческая выборка была селективной (хотя и со случайным подбором в сравниваемые группы из студенческой популяции). Это не позволяет делать переносы установленной связи /(2 с измеренными психологическими переменными на другие выборки — лиц с меньшими показателями /(2 или просто с другими лицами, в более широкой популяции дающих большую вариабельность свойств (см. следующий параграф).

Другой вариант селективной выборки дает пример кластерной выборки. Это название фиксирует стратегию отбора испытуемых из групп по ряду признаков, которые могут объединяться в иерархии, или "гнезда". Например, при цели сравнить мотивационные профили лиц, обучающихся гуманитарным и техническим специальностям, нужно решать разные проблемы. Первая связана с учетом того, что лица не случайно приходят в ту или иную профессию или в тот или иной вуз и соответствующие различия в мотивации могли иметь место еще до того, как студенты попали в соответствующую селективную выборку. И если связь стиля или типа мышления с предпочтением профессии можно обсуждать только за скобками проблемы планирования выборок (психолог включает эти связи в характеристики выборки как состоявшиеся предпочтения), то относительно предпочтения вуза планирование выборки может помочь валидизации исследования. Таким образом, вторая проблема — учета различия в самих вузах — может охватываться при планировании. Так, исследователь может включать в выборки людей из более и менее престижных вузов, предполагая, что начальный уровень образования, интеллекта и интересов связан с тем, в какого уровня вуз были поданы документы абитуриентом. Не прямой, но связанной с этим характеристикой может выступить выбор города — большой и маленький, близко расположенный и удаленный от столицы. В результате в конечной выборке будут охвачены все параметры, сужающие последовательно большую популяцию до составляющих ее меньших единиц. Для данного примера: вуз — величина города — его удаленность. В каждой из выборок — лиц гуманитарных и технических специальностей — должны будут оказаться представители всех единиц, отражающих сочетания выделенных признаков разделения популяции на составляющие ее кластеры.

Соответствующий охват критериев кластеризации на уровне выявления связанных с ними статистических эффектов представлен схемами иерархического моделирования (гл. 17).