Метод таблиц случайных чисел.

 

При использовании этого метода, всем потенциальным респондентам (элементам генеральной совокупности) присваиваются номера. Например, если размер генеральной совокупности равен 100, то все элементы генеральной совокупности нумеруются от 1 до 100.

 

Для того, чтобы случайно выбрать респондентов из списка, можно использовать таблицы случайных чисел, которые часто публикуются в справочниках по математической статистике. Отбор номеров из таблицы случайных чисел формирует выборочную совокупность.

 

Если в процессе отбора исследователю попадаются числа, превосходящие по величине самый большой номер в списке или повторяющиеся, то социолог их просто пропускает.

 

Если доступ к таблицам случайных чисел затруднен, то можно использовать специальную компьютерную программу – генератор случайных чисел, которая может в случайном порядке выдавать числа из заданного диапазона, например, от 1 до 100.

 

 

Неслучайная выборка – это способ отбора респондентов, основной принцип которого обратен случайному отбору. Цель невероятностного отбора, также как и вероятностного – обеспечить репрезентативность выборки.

 

Но в отличие от вероятностной выборки статистически значимые выводы обо всем множестве объектов при использовании неслучайной выборки нельзя, так как исследователь не может заранее рассчитать вероятность каждого элемента попасть в выборки, и, следовательно, не может рассчитать репрезентативность выборки.В этом случае она является не обязательной, так как количественные параметры объекта не играют решающей роли в исследовании, а целью его будет – углублённое качественное описание какого-либо социального явления.

 

Отбор элементов в неслучайной выборке осуществляется не случайным образом, а по субъективным критериям – доступности, однотипности и т.д. Существенный недостаток неслучайных методов заключается в том, что не существует строгих статистических методов, которые позволили бы обобщить полученные результаты. Оценка точности и валидности выводов исследования, проведенного на основе неслучайной выборки остаётся делом субъективных суждении социолога, его опыта и теоретических предпочтений.

 

Случаи применения неслучайной выборки:

 

1. Невозможно провести случайный отбор по причине:

 

a. Ограниченности ресурсов (не хватает денег, времени, нет списков единиц генеральной совокупности и т.д.)

 

b. Этических проблем (нельзя заставить респондента отвечать, если он отказывается)

 

2. Отсутствует необходимость проведения случайного отбора.

 

 

Разновидности неслучайного отбора

 

Направленная (целевая) выборка

 

 

Направленная выборка характеризуется выбором единиц или групп единиц по какому-либо заранее определенному принципу. Наиболее распространенными формами направленного отбора считаются: выборка доступных случаев, отбор типичных случаев, метод "снежного кома", стихийная выборка и квотная выборка. Применяется чаще в качественном исследовании. На отбор в этом случае большое влияние оказывают цели исследования. Основная задача целевых выборок – получить информационно богатые случаи для последующего их глубокого и многостороннего изучения. Рассмотрим подвиды целевой выборки.

 

 

Выборка доступных случаев.

 

В этом случае социолог формирует выборку из тех элементов, которые ему наиболее доступны в данный момент. Например, сотрудники своей организации, студенты в ВУЗе или родственники. При простоте такого подхода, необходимо понимать, что применять такую выборку лучше только в демонстрационных или экспериментальных целях. Или же, тогда, когда социологу необходимо изучить какие-то специфические популяции.

 

Перечислим основные сферы применения выборки доступных случаев:

 

a) тестирование анкет и отработка процедур опроса,

 

б) изучение интимных сторон жизни людей,

 

в) изучение здоровья населения на основе данных об обращениях в больничные учреждения,

 

г) монографические обследования.

 

Отбор типичных представителей.

 

Этот метод возник в земской статистической практике во второй половине XIX в. как один из вариантов замены сплошного наблюдения частичным. В основе этого метода лежит представление о том, что отобранные типичные объекты могут представлять всю генеральную совокупность, если в ней возможно выделение типов явлений и выбор объектов, наиболее подходящих к типу

 

При использовании данного метода отбираются единицы генеральной совокупности, обладающие типичным для всей генеральной совокупности значением признака. При этом перед социологом существует проблема выбора признака и определения его типичного значения и субъективный характер оценки исследователя иногда может привести к систематической ошибке.

 

Вероятностные методы – это методы формирования выборки, при использовании которых каждая единица генеральной совокупности имеет шанс (вероятность) попадания в выборку. То есть единицы выборки определяются случайным образом.

 

При использовании вероятностных методов необходимо точно знать размер генеральной совокупности и основные характеристики контура выборки, а так как это сделать практически невозможно, то нельзя точно рассчитать вероятность включения единиц совокупности в выборку. Но можно определить интервал, в пределах которого с определенной достоверностью (99% или 95%) находится искомое значение характеристик ГС.

 

К вероятностным методам относят:

 

· простую случайную выборку;

 

· систематическую выборку;

 

· стратифицированную выборку;

 

· кластерную выборку.

 

Следует заметить, что они различаются между собой степенью эффективности – это понятие, отражающее компромисс между затратами, связанными с проведением выборки и ее точностью.

 

Рассмотрим сущность каждого метода.

 

Простая случайная выборка – это вероятностный метод выборки, согласно которому каждая единица ГС имеет известную и равную вероятность отбора. Другими словами, все имеют одинаковый шанс попасть в выборку. Для формирования данной выборки используют методы случайных чисел или вслепую.

 

При простой случайной выборке с использованием статистических таблиц случайных чисел исследователь должен иметь пронумерованный список ГС (контура выборки). Затем генерируют случайные числа, чтобы определить номер единиц, которые будут включены в выборку. Генерация случайных чисел происходит произвольно. В таблице выбирают любую начальную цифру и от нее двигаются в любом направлении, причем меняя направление движения, пока не выберут необходимое число респондентов либо эту работу выполняет компьютер.

 

При использовании метода вслепую единицы совокупности также нумеруются, вносятся в карточки и помещаются в барабан (по принципу лотереи), который встряхивают и из него вынимаются отдельные таблички.

 

Достоинством метода считается объективность, т.к. у всех есть равный шанс, простота понимания и выполнения.

 

Недостаток метода – трудно определить каждую единицу контура выборки, особенно при крупных генеральных совокупностях; высокие затраты на проведение.

 

Систематическая выборка – это вероятностный метод выборки, предполагающий некую систему, в соответствии с которой сначала задается произвольная отправная точка, а затем из контура выборки последовательно, через равные интервалы выбираются остальные элементы. В данном случае используют «интервал скачка», рассчитанный как соотношение размера контура выборки к объему выборки. Например, совокупность состоит из 10 тыс. элементов, желательный объем выборки равен 100. Тогда 10000: 100 = 100. В нашем примере интервал скачка равен 100. Затем выбирается случайное число между 1 и 100. Если, например, это число 23, то в выборку войдут следующие элементы ГС 23, 123, 223, 323, 423 и т.д.

 

Данный метод целесообразно использовать, если есть справочники. Обычно применяют при почтовых, телефонных опросах или личных интервью в торговых центрах (опрашивается, например, каждый пятый посетитель, покидающий универмаг, если интервал скачка равен 5).

 

 

Достоинство метода:

 

- экономит время, а значит, деньги;

 

- если ГС обладает информацией об исследуемой характеристике, то выборка более репрезентативна, чем простая случайная.

 

Недостатки метода аналогичны предыдущей выборке.

 

Кластерная выборка основана на делении совокупности на группы (кластеры), каждая из которых представляет совокупность в целом. Элементы кластера должны быть максимально разнородны, а сами кластеры – как можно более однородны. В идеале каждый кластер должен представлять собой небольшую модель генеральной совокупности. После определения кластеров, которые будут подвергаться обследованию, случайным способом из элементов кластера формируется выборка. При использовании данной выборки контур выборки нужен только для кластеров, которые вошли в выборку. Полученные результаты от кластера распространяются на всю совокупность.

 

Распространенной формой кластерной выборки считается территориальная выборка, в которой кластеры состоят из округов, микрорайонов, краев, кварталов.

 

Достоинством метода является:

 

- легкость применения, т.к. не требуется список всей совокупности;

 

- эффективность с точки зрения затрат;

 

Недостаток:

 

- низкая точность, т.к. сложно сформировать неоднородные кластеры (например, жители одного квартала могут иметь больше сходства, чем различий, что не соответствует генеральной совокупности).

 

Перечисленные методы приемлемы, если генеральная совокупность характеризуется симметричным распределением изучаемой характеристики среди элементов совокупности. Если распределение несимметрично, то есть смысл использовать метод стратифицированной выборки.

 

 

Стратифицированная выборка – это двухэтапный метод вероятностной выборки, согласно которому генеральная совокупность делится на подгруппы (страты) по каким- либо признакам таким образом, чтобы каждый элемент совокупности относился только к одному слою. Затем из слоев простым случайным способом отбираются элементы выборки. При этом доля каждой страты в общем объеме выборки соответствует ее удельному весу в генеральной совокупности. Элементы, относящиеся к одной страте, должны быть как можно более однородными, а относящиеся к разным слоям, как можно более разнородными. Кроме того, признак, в соответствии с которым выделены страты, должен быть тесно увязан с исследуемой переменной. Признаком стратификации могут быть демографические переменные, размер фирмы, уровень дохода, отрасль промышленности.

 

Количество страт в стратифицированной выборке остается предметом спора между специалистами. Практический опыт показывает, что следует использовать не более шести страт.

 

Достоинство метода:

 

- включает все важные подгруппы совокупности;

 

- обеспечивает высокую точность.

 

Недостаток:

 

- сложно выбрать подходящие переменные,

 

- невозможно стратифицировать с учетом нескольких переменных (более двух);

 

- высокие затраты.

 

Невероятностные методы предполагают неслучайный отбор респондентов и в значительной степени основаны на индивидуальных предпочтениях исследователя. В результате применения данных методов мнение единиц выборки может отличаться от мнения элементов генеральной совокупности. Это порождает систематические ошибки данных исследования. Используя невероятностные выборки, можно получить детальную оценку характеристик совокупности, но насколько точны полученные данные определить невозможно, т.к. неясна вероятность включения в выборку каждой единицы. Поэтому невероятностные выборки считаются нерепрезентативными и сведения, полученные от лиц, выделенных таким образом, сложно распространять на генеральную совокупность.

 

Виды невероятностных методов:

 

метод, основанный на принципе удобства (нерепрезентативная выборка);

на основе суждения исследователя (поверхностная выборка);

в ходе обследования (выборка по принципу «снежного кома»);

квотная выборка.

Метод, основанный на принципе удобства, заключается в том, что исследователь формирует выборку самым удобным для него способом (с точки зрения затрат и времени). Например, опрос покупателей проводится в магазине, ближайшем от места жительства исследователя. Очевидно, что многие представители совокупности не примут участия в опросе. Данный метод применим только в поисковых исследованиях, направленных на выявление новых идей, гипотез, уточнение характеристик объекта исследования. Нерепрезентативные выборки можно применять для фокус-групп при предварительных опросах, но все же следует проявлять осторожность в оценке полученных результатов.

 

Достоинство метода – экономичность (с точки зрения времени и затрат), удобство отбора.

 

Недостаток – необъективность отбора, нерепрезентативность.

 

Формирование выборки на основе суждений основано на использовании мнения компетентного специалиста (исследователя). Считается, что исследователь, обладая опытом и знаниями, может достаточно точно отобрать единицы выборки, которые будут представлять ГС.

 

Типичные примеры поверхностной выборки: избирательные участки для изучения поведения избирателей; универмаги, выбранные для тестирования новой системы выкладки товара; инженеры, покупающие промышленное оборудование, выбранные для участия в исследовании, потому, что они являются представителями компаний определенной отрасли. На основе такого подхода часто формируются фокус-группы.

 

Достоинство – низкая стоимость, удобство, быстрота.

 

Недостаток – субъективность, результаты зависят от компетентности исследователя.

 

Формирование выборки в ходе обследования основано на расширении числа опрашиваемых путем получения сведений о них от первых респондентов, принявших участие в опросе. Формируют начальную группу респондентов (методом случайного отбора) и затем их просят назвать других кандидатов, входящих в совокупность. Процесс, когда каждый опрошенный называет другого кандидата, приводит к эффекту «снежного кома».

 

Главная задача такой выборки – дать оценку необычным для совокупности характеристикам. Например, людям, имена которых не разглашаются, получающим социальную помощь – продовольственные талоны; отдельным группы населения – сексуальным меньшинствам.

 

Данная выборка применяется также при исследованиях деловых рынков, где контур выборки является ограниченным, например, когда необходимо определить взаимовыгодных партнеров.

 

Достоинство метода:

 

- позволяет оценить необычные для совокупности характеристики;

 

- невысокие затраты.

 

Недостаток – требует много времени.

 

Квотная выборка – метод невероятностной выборки, структуракоторой строится по аналогии с распределением изучаемого признака в генеральной совокупности. Проводится в два этапа. Сначала формируются квоты из элементов ГС в соответствии с каким - либо признаком (обычно пол, возраст, профессия, вид деятельности – эти данные известны из статистических сборников и других исследований). Затем методом удобства или на основе мнений исследователя отбираются респонденты из каждой квоты. Причем квоты устанавливаются таким образом, чтобы доля респондентов в выборке, обладающая определенными характеристиками, соответствовала доле элементов ГС, обладающей такой же характеристикой. Например, если ГС включает 55% женщин и 45% мужчин, то при объеме выборки 400 человек, необходимо опросить 220 женщин и 180 мужчин.

 

Основное допущение этого метода состоит в том, что если выборка репрезентативна по признаку квотирования, то она будет репрезентативна и относительно распределения мнений по предмету исследования.

 

Достоинство метода:

 

– низкая стоимость;

 

– удобство выбора элементов для каждой квоты;

 

– возможность регулировать выборку по определенным характеристикам;

 

Недостаток – большая вероятность необъективности при отборе. Например, опрашиваем тех, кто находится рядом и избегаем тех, кто далеко живет, недружелюбен или просто не симпатичен.

 

Кроме того, следует сказать еще о двух методах, между которыми исследователь может сделать выбор. Это повторная и бесповторная выборка.

 

Повторная выборка – это метод, согласно которому элементы ГС можно неоднократно включать в выборку. Исследователь выбирает из контура выборки элемент и получает необходимую информацию. Затем возвращает элемент в контур выборки. Таким образом, элемент может неоднократно попадать в выборку.

Бесповторная выборка – это метод, согласно которому элемент совокупности нельзя включать в выборку более одного раза. Другими словами, изученный элемент удаляется из контура выборки.

Статистические выводы при использовании этих двух методов похожи, если контур выборки намного больше конечного объема выборки. Следовательно, различия в результатах важно учитывать только тогда, когда контур выборки ненамного больше объема выборки.

 

 

КОЛИЧЕСТВЕННЫЕ МЕТОДЫ

(quantitative мethods)

 

Набор математических и статистических методов, используемых для анализа данных. Для проверки эмпирических теорий и гипотез в социальной работе прибегают к широкому комплексу источников,включая документы итоги выборочных опросовили агрегированная статистика, например результаты выборов, материалы переписей илиобщенациональные статистические серии. Для анализа количественных данных, необходимо описать их, т.е. структурировать информацию и определить общие параметры. когда ониопределены, важно изучить внутреннюю связь между вариантами, чтобы увидеть, поддаются ли они ассоциации или корреляции и если да, то в какой степени. В-третьих, исходя из того, что исследовательаприори имеет основания для установления причинных связей между вариантами, возникает вопрос, насколько изменения в причинах или предсказанных или независимых переменных могут объяснитьизменения в следствиях или в предсказанных либо зависимых переменных. Наконец, если данные получены из выборочного опроса, возникает вопрос, насколько верно эти результаты отражают точку зрения всего населения. Для выполнения этих четырех функций: описания, ассоциации и корреляции, объяснения, выводов б

используют набор статистических и математических методов. Выбор методовварьируется в зависимости от различных соображений, прежде всего от уровня измерения. На низшемуровне явления разбивают на группы так же, как при опросах, где респонденты классифицируются посоциально-экономическим критериям (например, рабочий класс или средний класс, католики илипротестанты) или по принципу партийной принадлежности (например, консерваторы или лейбористы,христианские демократы или социал-демократы, республиканцы или демократы). Такие данные именуютсяданными номинального или категорического уровня. Следующий уровень – это тот, где явления могут бытьвыстроены в иерархию по принципу "более чем менее тем" по сравнению с базисом. Так, например, странымогут быть выстроены по ранжиру в зависимости от того, являются ли они на основе соответствующегокритерия "более или менее" демократическими. Подобные данные называются данными ординальногоуровня. На третьем, и самом высоком, уровне измерения известны не только порядок распределенияявлений, но и величина различий в масштабном выражении. Примерами могут служить данные переписей осоциальном составе электората в избирательных округах, численность конкретных групп в процентах илиданные о выборах, показывающие распределение голосов между партиями. Эти сведения именуютсяданными интервального уровня. Для каждого уровня измерения имеется набор статистики, обеспечивающейвыполнение изложенных выше функций. Данные номинального уровня могут быть описаны с помощьюмодального и категорийного распределений. Ассоциация может быть измерена с помощью такой статистики,как число "фи" и коэффициент вероятности. Объяснение может быть достигнуто посредством логолинейногоанализа (наглядных схем на основе логарифмических координат). Статистическая значимость обычноединичных переменных вариантов по пропорциям ошибки в выборке (как, например, в прогнозах приопросах) или путем ассоциации с использованием ши-квадратного теста. Данные ординарного уровняобычно описываются путем расчета половинного или четвертичного, восьмиричного или десятичногораспределения данных. Наиболее распространенный способ измерения ассоциации – это "ро" Спирмена.Значимость оценивается путем t-теста. Данные интервального уровня обычно описываются с помощьюсредних или стандартных отклонений, и они проверяются для определения ошибок в выборках. Корреляцияизмеряется с помощью "r" Пирсона. Объяснение обеспечивается регрессивным анализом (на основевозвращения к исходной точке). Значимость оценивается на основе тестов "ти" и "фи". Помимо этого,конечно, данные могут быть смешанными с точки зрения уровней, и для работы с ними разработанасоответствующая методика. Например, может оказаться желательным изучить взаимосвязь междупеременными номинального и интервального уровня, используя анализ вариантного теста. Наконец, в техслучаях, когда имеется много вариантов различных типов и исследователи стремятся выделить основныесходства и различия, применяются сложные методики, включая факторный, пучковый дискриминантныйанализ. Подобные методы широко применяются политологами применительно к целому спектру контекстов,например для изучения гонки вооружений, политической стабильности, политического насилия и поведениязаконодателей. Однако в основном они используются при изучении электоральных позиций и поведенияизбирателей. Здесь данные легко поддаются количественному выражению, и поэтому такая методикаприменяется наиболее широко. Хотя количественные методы, без сомнения, способствовали углубленномуизучению политики, нельзя не подвергнуть критике чрезмерный энтузиазм в отношении их использования(применение количественных методов ради них самих), а также приравнивание полученных результатов крезультатам научных экспериментов (некорректное применение методов естественных наук к даннымсоциальной жизни) и преувеличенное внимание к числам за счет объяснения смысла (определениесуществования статистически значимого коэффициента корреляции или регрессии почти ничего не дает сточки зрения понимания смысла этого процесса). Подобная критика привела к некоторой сдержанности иосторожности в применении количественных методов.