Районированная и стратифицированная выборки

Если генеральная совокупность велика, а такое в эмпиричес­ком исследовании случается очень часто, то приходится разделять обследуемую совокупность на более или менее однородные час­ти, а затем осуществлять отбор единиц внутри этих частей. Такую раздробленную на части выборку правильнее всего было бы на­зывать расслоенной. Однако в русском языке подобный термин не утвердился, видимо, как не соответствующий нормам правиль­ного произношения.

Поскольку в отечественной социологии очень много иностран­ных слов — и это правильно с точки зрения унификации научной терминологии, приведения ее к международным стандартам, — то слову «расслоенная» попытались найти эквивалент. В числе пре­тендентов оказались две наилучшие кандидатуры, а именно тер­мины «районированная» и «стратифицированная».

В русском языке первое слово явно тяготеет к географическо­му языковому ареалу и обозначает территориальную зону. По­скольку генеральную совокупность, особенно очень большую, например население всей страны, можно разбивать в том числе и по региональному признаку, в отечественной литературе утвердил­ся термин «районированная выборка». Но наряду с тем генераль­ную совокупность можно расслаивать и по стратам (полу, возрас­ту, доходам и т.д.), получая в качестве критерия уже не географи­ческий район, а социальную группу.

В итоге сложилась практика различения двух разновиднос­тей расслоенной выборки. Если деление происходит по стратам (социальным группам), то выборку именуют стратифицирован­ной, если по экономико-географическим районам, то —райони­рованной.

В литературе (да и в маркетинговой практике) два термина — районированная и стратифицированная выборки — нередко счи- таются эквивалентными. Происходит это потому, что в основе той и другой лежит одна и та же процедура расслоения, а расслаивать в социологии можно двояко: либо по социальным группам (тогда речь идет о социальной структуре и стратификации как ее част-ном виде), либо по географическим районам. Когда объединяют оба понятия в одно, как правило, дают обобщающее определение подобной выборки, например, такое:

Районированная выборка — вид выборки, при котором отбору предшествует процедура районирования (расслоения, стратифика­ции), т.е. разделения исходной совокупности на статистически или качественно однородные подсовокупности, называемые слоями,

стратами или типичными группами. Отбор единиц, который мо­жет носить как случайный, так и направленный характер, произ­водится независимо из каждого слоя, поэтому районированная выборка равносильна ряду выборок, извлеченных из меньших со­вокупностей-страт15.

В этом определении исходное понятие «районированная выбор­ка» без ущерба для дела можно заменить на «стратифицирован­ную выборку». Таким образом, одинаково правильно будет как разделять одну выборку на две самостоятельные разновидности, районированную и стратифицированную, так и подавать их как единое целое. За единство двух приемов выступает практика со­циологических исследований. Оказывается, в крупномасштабных проектах социологи начинают с районированной выборки, а за­тем переходят на стратифицированную. Так, например, в обсле­дованиях Центра «Социо-Экспресс» Института социологии РАН в основе построения районированной выборки лежат десять эко­номико-географических зон, в каждой из которых выделяются крупные города (численностью свыше 500 тыс. населения), сред­ние города (50-500 тыс.), малые города (до 50 тыс.) или поселки городского типа, а также сельские населенные пункты. Внутри отобранных городов респондентов отбирают случайным методом. Репрезентативность контролируется по региональным пропорци­ям численности населения, пропорциям между городским и сель­ским населением, пропорциям между населением указанных ти­пов населенных пунктов16.

В международной практике не используется русское слово «район» как географическая зона (ареал, регион, часть террито­рии), поэтому здесь не встретишь и термина «районированная выборка». Вместо него употребляют термин «стратифицированная выборка», подразумевая, что, разбивая единое целое на части, не обязательно точно указывать, что они собой представляют — груп­пы или районы.

В таком случае стратифицированная выборка (stratified sampling) — вероятностная выборка, обеспечивающая равномерное представи­тельство в выборочной совокупности различных частей, типов, групп и слоев населения.

В английском языке слово «стратификация» мало чем отлича­ется от слов «расслоение», «разделение», «разбиение». Это социо­логи придали стратификации социальный смысл, а в геологии, 104

откуда мы позаимствовали термин, стратификация означает вер­тикальное расслоение земли на однородные пласты. Ни классов, ни доходов, ни социальных групп здесь нет.

Надо учитывать и другой нюанс. Дело в том, что в зарубежных словарях, прежде всего американских и главным образом ведущих, все, что связано с территориальным признаком, в том числе и рас­слоение по районам, относится к квотной выборке. К примеру, в знаменитом Оксфордском словаре социологии на термин «stratified sampling» стоит отсылка: см. sampling. Открываем с. 576—577 и чи­таем о том, что в случае стратифицированной вероятностной {random) выборки речь идет о разбиении совокупности на подгруп­пы, т.е. страты, например мужчин и женщин, а о районированной выборке в нашем понимании не говорится ни слова. Близкий к районам термин «local areas» употребляется Гордоном Маршаллом (а он считается знатоком в этом деле) только в связи: 1) с первой стадией многоступенчатого отбора, 2) с квотной выборкой17.

Возвращаясь от лингвистических тонкостей к методическим, подчеркнем вот еще что: отбор единиц, который может носить как случайный, так и направленный характер, производится незави­симо из каждого слоя или района, поэтому районированно-стра-тифицированная выборка (если можно так выразиться) равносиль­на ряду выборок, извлеченных из меньших совокупностей-страт (районов).

Стратифицированная случайная выборка (в узком значении) основана на выборке по каждой страте отдельно. Это повышает точность результатов либо уменьшает время, силы и стоимость исследования, допуская меньшие размеры выборки при заданном уровне точности. Например, известно, что бедность наиболее ча­сто встречается среди пожилых, безработных и в монородительс­ких семьях. Исследуя проблемы бедности, можно с равным успе­хом выбрать в качестве объекта любую из трех страт. В отобран­ных районах или стратах выбор единиц обследования проводится по вероятностному методу.

Основная цель всякого расслоения — повышение точности вы­борочных оценок. Слои выделяются таким образом, чтобы дис­персия изучаемых переменных внутри слоев была значительно меньше, чем между ними. При расслоении вариация между сло­ями не входит в среднюю ошибку выборки, а компенсируется са­мой процедурой выделения слоев. Поэтому расслоение позволяет5 добиться более высокой степени точности оценок по сравнению

с простым случайным отбором. Если каждый слой представляет собой статистически однородную группу, то для любого из них даже выборка малого объема позволит получить достаточно точ­ные оценки, которые, будучи объединены, дадут хорошую оцен­ку для всей совокупности.

Различают стратификацию одномерную и многомерную в за­висимости от того, один или несколько признаков положены в основу разделения совокупности. Эти признаки должны иметь тесную связь с изучаемыми переменными, от их выбора в высо­кой степени зависит эффективность расслоения.

2.4.4. Гнездовая выборка

Противоположность районированной и стратифицированной выборке составляет гнездовая выборка.

Гнездовая выборка — вид выборки, при котором отбираемые объекты представляют собой группы или гнезда (кластеры) более мелких единиц. Гнездом называют единицу отбора высшей ступе­ни, состоящую из более мелких единиц низшей ступени. В выборку могут быть включены как все единицы низшего уровня, так и их часть. Число единиц, образующих гнездо, называют его размером.

В качестве гнезд выступают населенные пункты, районы, дома, подъезды, предприятия, цехи, бригады.

Гнездовой отбор обладает большими организационными пре­имуществами — проще осуществлять отбор и обследование не­скольких компактных групп, чем десятков или сотен отдельных единиц. Технические преимущества гнездового отбора особенно ощутимы при построении территориальной выборки. Отбор не­большого числа территориальных сегментов (населенных пунктов, районов, жилых кварталов и т.п.), затем выборочный или сплош­ной опрос проживающего в них населения существенно уменьша­ют стоимость исследования и сроки проведения.

Процедурно такой метод применить легче, чем вероятностный либо районированный. Проблемы, которые возникают здесь, свя­заны с определением величины гнезда, количеством гнезд, ко­торые надо обследовать, их размещением в генеральной совокуп­ности.

Основные рекомендации при выборе гнезд сводятся к тому, чтобы различия между гнездами были бы по возможности более неоднородными. Это правило прямо противоположно основному принципу расслоения, в соответствии с которым выигрыш в точ­ности тем больше, чем более однородными будут выделенные

слои. Другая рекомендация касается выбора размера гнезд: боль­шое число малых гнезд предпочтительнее малого числа крупных18.

Пример стратифицированной выборки.Первое исследование по уровню жизни населения проведено в конце 60-х гг. XX в. груп­пой исследователей (под рук. Н.М.Римашевской) из Центрально­го экономико-математического института АН СССР в городе Та­ганроге19. Проект назван Таганрог-1. Исследование в конце 70-х гг. названо Таганрог-2, а в 1988-1989 гг. названо Таганрог-3. Это го­род на юге России с населением около 300 тыс. человек. Семья — это группа лиц, живущих вместе на одной жилой площади, веду­щих совместное хозяйство и находящихся в отношениях родства, брака или опекунства. В 1989 г. в Таганроге около 10% населения имели душевые доходы ниже 75 руб., т.е. были бедными. Основой выборки служили данные о структуре жилого фонда и числе про­живающих. На первом этапе город поделен на районы, на втором вычислялись доли разных типов жилья с разным уровнем его оп­латы и коммунальными удобствами. На третьем этапе жилой фонд делился по числу квартир в домах. Для каждой страты — района, типа застройки, размера жилья — заводился лист с адресами и чис­лом квартир. Так планировалась выборка и организовывался отбор домохозяйств в Таганроге-2. Использовалась трехуровневая проце­дура территориального стратифицированного отбора.

Пример районированной выборки.Эмпирической основой рабо­ты «Динамика социальной структуры красноярского региона» явились социологические исследования, проведенные сотрудни­ками Красноярского государственного университета под руковод­ством проф. В.Г.Немировского: 1) опрос 1488 жителей Краснояр­ского края в мае 1991 г.; 2) опрос 1240 жителей края в июне 1992 г.; 3) опрос 1050 жителей края в мае 1995 г.; 4) опрос 1820 жителей края в апреле 1998 г.; 5) опрос 1460 жителей края в январе 1999 г. Каждое исследование проводилось по общекраевой выборке ме­тодом формализованного интервью. Использовалась многоступен­чатая, районированная выборка, сформированная в соответствии с половозрастной структурой населения края. В процессе постро­ения выборки на первой ступени генеральная совокупность дели­лась на ряд слоев в зависимости от места жительства респонден­та: в городской (в крае 27 городов) и сельской местности (послед­няя подразделяется на 41 административный район); размера населенного пункта: жители крупного города (Красноярск), сред-

него города, малого города, сельскохозяйственных районов, рай­онов с преобладанием лесной промышленности. Затем осуществ­лялся типологический отбор районов и городов в каждом из выделенных слоев. На второй ступени отбора проводилось райо­нирование уже внутри населенных пунктов или сельских районов. Так, в городах выделялись административные, промышленные, «спальные» районы, места индивидуальной застройки. В сельской местности признаком расслоения служил размер населенного пун­кта — райцентр, село, деревня. В следующей ступени проводился квотный отбор. В рамках конкретной территориальной зоны ан­кетер должен был опросить определенное число лиц с заданными социально-демократическими характеристиками20.

При гнездовой выборке (которую иногда называют также клас­терной21) определяются группы или гнезда элементов и составля­ются их списки. Затем из этого списка единиц выборки проекти­руется выборка. Потом только для этих единиц идентифицируются и отбираются элементы. Возьмем, например, составление опрос­ного списка на 1000 человек (размер выборки) для изучения об­щественного мнения населения города. Поскольку мы не распо­лагаем списком всех жителей города, мы могли бы начать с полу­чения карты города, чтобы определить все его кварталы и составить их список. Этот список кварталов становится остовом выборки, из которого случайным образом или систематически проводится выборка кварталов. Затем будет спроектирована вы­борка жилых домов из каждого квартала. Затем будет установле­на связь с семьями, проживающими в отобранных домах, и в каж­дой семье кто-то будет проинтервьюирован для опросного листа. Предположим, что имеется 500 кварталов и из них случайным образом отобрано 25. В этих 25 кварталах идентифицированы 4000 семей. Связь будет установлена с четвертью этих семей, потому что требуется выборка из 1000 индивидов. Эти 1000 семей будут отобраны случайным или систематическим образом.

Пример гнездовой выборки.Исследование Т. Б. Бердниковой и МАЛямина «Социальные последствия трансформации собствен­ности»22, проведенное в 1999 г., охватывало 500 респондентов в Белгородском, Губкинском, Корочанском и Ровеньском районах Белгородской области. Отбор респондентов осуществлялся мето­дом гнездовой двухступенчатой выборки. В качестве гнезд (клас-

теров) или групп выделялись районы Белгородской области. На первом этапе проведен отбор гнезд в соответствии с требования­ми минимальных различий между ними и максимальной неодно­родности составляющих их единиц. В рамках самих гнезд отбор респондентов осуществлялся по методу многоступенчатой квот­ной выборки, репрезентативной по отношению к социально-демографической структуре работников предприятий различных форм собственности. Квотными признаками выступали: пол, воз­раст, место проживания. Опрос руководителей проводился по той же методике, но квотными признаками выборки в данном случае были: пол, возраст, образование, стаж работы. Отбор респонден­тов для экспертного опроса проводился по методу случайной вы­борки по следующим критериям: род деятельности, наличие спе­циального опыта, участие в приватизации и акционировании.

Пример кластерной выборки.В исследовании, проведенном B.C. Журавлевым23 в 1999 г. в школах и училищах Екатеринбур­га была использована многоступенчатая выборка с применением на первой ступени кластерной выборки. Были отобраны учебные заведения Екатеринбурга, находящиеся в «опасных» районах в не­посредственной близости от вокзалов, парков и лесопарков и т.д. Опрашивались учащиеся профессионального училища, школ и гимназии города. Внутри кластеров отбор стратифицировался. В каждом кластере опрашивалось по 100 респондентов. Генераль­ная совокупность насчитывает 80 тыс. человек. Объем выбороч­ной совокупности составил 500 человек, что достаточно для по­лучения репрезентативных данных, учитывая однородность гене­ральной совокупности и небольшой вариационный размах.

2.5. Методы невероятностной (неслучайной) выборки

Неслучайная (невероятностная) выборка — это способ отбора единиц, при котором мы не можем заранее рассчитать вероятность попадания каждого элемента в состав выборочной совокупности, что, разумеется, не дает возможности рассчитать, насколько пра­вильна (репрезентативна) выборка. По этой причине предпочте­ние обычно отдается вероятностной выборке, хотя иногда по ус­ловиям исследования оказывается единственно возможным про­вести неслучайную выборку.

Таким образом, можно заранее сказать, что по содержательным критериям невероятностная (она же целевая и целенаправленная) выборка не хуже вероятностной, а может быть, и лучше. Ее недо­статки: невозможность установить степень репрезентативности и более высокая стоимость (с точки зрения затрат она обычно пре­восходит вероятностную на несколько порядков). Но есть и пре­имущества — более глубокое, качественное и всестороннее рас­крытие предмета по сравнению с вероятностной.

Известны следующие разновидности неслучайной выборки: квотная выбор­ка, метод снежного кома, метод основного массива, метод стихийного отбора.

Несомненно, принцип отбора единиц в неслучайной выборке отличается от традиционного. Рассмотрим, чем именно.

Как и для вероятностного способа отбора, основная цель не­случайного отбора состоит в получении совокупности, репрезен­тирующей изучаемый объект. Однако в отличие от вероятностной выборки статистические выводы обо всем множестве объектов в этом случае делать не совсем правомерно. Эти выводы могут с большей или меньшей степенью вероятности распространяться лишь на генеральную совокупность (которая не всегда совпадает с объектом исследования).

Выделяют два основных вида неслучайного отбора:

♦ направленный отбор (другие названия — целенаправленный, целевой, выбор по усмотрению);

♦ стихийный.

Направленный отбор характеризуется выбором единиц по ка­кому-либо заранее определенному принципу. Наиболее распрос­траненными формами направленного отбора считаются: выбор типичных объектов (методов типичных представителей), метод «снежного кома» и выбор квотами.

Метод типичных представителей часто оказывается удобным на высших ступенях отбора, когда необходимо ограничиться небольшим количеством объектов. Отбор типичных объектов может в достаточ­ной мере обеспечить репрезентативность полученных данных только в том случае, если приняты меры по обоснованию выбора объектов. Для этого необходимо иметь дополнительную информацию по ряду признаков, которые могут рассматриваться в качестве контрольных.

Метод «снежного кома» (snowball sampling) — разновидность целе­направленного выбора, при котором предполагается, что отбор допол­нительных (последующих) респондентов производится после ссылки на них первоначально отобранных. Такая процедура используется при изучении особенных, редких, неслучайных совокупностей.

Этот метод обычно применяется для отбора экспертов и ред­ко встречающихся групп респондентов (так называемых редких элементов) — например потребителей, обладающих очень высо­кими доходами, или представителей элитных групп. По сути, это техника поиска и отбора респондентов с определенным сочета­нием свойств в таких условиях, когда трудно очертить границы генеральной совокупности. Особенность метода состоит в том, что, за исключением первого шага, выбор каждого очередного респондента совершается по указанию респондентов, включен­ных в выборку на предыдущем шаге. Каждый респондент ука­зывает интервьюеру, где можно найти интересующих его людей (и даже сам связывается с ними и рекомендует интервьюера), и выборка скаждым шагом разрастается, подобно снежному кому.

Метод стихийного отбора только внешне похож на случайный отбор, поскольку социолог, приблизительно зная, кого ему надо оп­росить, идет на улицу или останавливается у станции метро, опраши­вая всех, кого удастся или кто похож на представителей генеральной совокупности, например людей в возрасте от 30 до 40 лет. Никаких математических процедур при составлении выборки здесь не приме­няется, и соблюсти контроль за обеспечением репрезентативности невозможно. Чаще всего фиксируется мнение тех, кто имеет возмож­ность и желание поговорить с интервьюером. Стихийный отбор мо­жет принимать иную форму, когда не социолог подходит к первому встречному на улице, а первый встречный звонит на телевидение, откликаясь на обращение принять участие в так называемом интерак­тивном опросе, ставшем особенно модным у нас с конца 1990-х гг.

Стихийные выборки формируются произвольно и часто неза­висимо от самого исследователя. Примерами стихийного отбора могут служить опросы с помощью средств массовой информации, выборка «первого встречного», опросы покупателей в залах супер­маркетов, пассажиров на остановках и в общественном транспорте

и т.д. Одна из особенностей стихийной выборки состоит в том, что мы зачастую не можем заранее предсказать ее размеров (как, например, при опросах с помощью СМИ — достаточно вспомнить опросы интерактивного телевидения). Главный недостаток сти­хийных выборок состоит в том, что для них часто невозможно уточнить, какую генеральную совокупность они представляют.

К стихийному отбору тесно примыкает метод основного мас­сива. Метод основного массива представляет опрос 60—70% гене­ральной совокупности. Процедура его крайне проста: из жителей данного района или работников предприятия опрашивается про­стое большинство. В результате средние генеральной и выбороч­ной совокупностей сближаются, а выборочная совокупность со­ставляет преимущественную часть генеральной и перекрывает возможное смещение. К подобному методу в прошлом часто при­бегали заводские социологи, не искушенные в математических процедурах составления сложной выборки, зато располагающие материальными и временными ресурсами для опросов.

Кроме того, к невероятностным методам отбора относятся также:

♦ отбор на основе принципа удобства;

♦ отбор на основе суждений.

Смысл метода отбора на основе принципа удобства заключа­ется в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например с позиций минимальных затрат времени и усилий, с позиции доступности респондентов. Формирование выборки на основе суждений осно­вано на использовании мнений квалифицированных специалис­тов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.

Квотная выборка

Квотная выборка — микромодель объекта социологического исследования, формируемая на основе статистических сведений (параметров квот) преимущественно о социально-демографи­ческих характеристиках элементов генеральной совокупности. Нужные данные обычно берут из статистических справочников.

Квотный метод выборки предполагает предварительное нали­чие статистических сведений по ряду существенных либо корре­лирующих с ними характеристик генеральной совокупности. Од­нако эти сведения не используются для определения объема вы­борки, так как в последующем отбор респондентов осуществляется не случайно, а целенаправленно, при помощи интервьюеров.

Принцип квотной выборки, или же принцип отбора единиц на­блюдения по методу квот, восходит к представлению о подобии объектов в случае пропорциональности их структурных элемен­тов. Этот метод основан на целенаправленном формировании структуры выборочной совокупности. Анкетер получает задание опросить некоторое количество лиц определенного возраста, пола, образования и профессии. Удельный вес квоты в выборочной со­вокупности должен соответствовать ее удельному весу в генераль­ной совокупности.

Обычно квотная выборка используется на последних ступенях отбора и завершает процесс районирования (стратифицирования) и применения вероятностных процедур. Социолог разыскивает респондента определенного пола, статуса и возраста в заданном районе и беседует с ним.

Приведем пример расчетавыборки по таким параметрам кво­ты, как пол и возраст, в реальном социологическом исследовании. Обосновывая репрезентативность выборки при опросе избирате­лей в ходе избирательной кампании по выборам депутатов Город­ской думы Нижнего Новгорода, мы опирались на данные Облком-стата о половозрастной структуре населения районов города. Так, половозрастная структура населения Советского района выгляде­ла следующим образом (табл. 2.2):

Половозрастная структура населения Советского района

Таблица 2.2

  Всего Мужчины Женщины Мужчины, % Женщины, %
Все население 45,1 54,9
В том числе по возрастам:          
до 1 года 51,4 48,6
1 —6 лет 51,1 48,9
7 —9 лет 50,6 49,4
10-15лет 51,0 49,0
16-19лет 49,8 50,2
20 — 24 года 50,3 49,7
25-29 лет 55,0 45,0
30 — 34 года 48,5 51,5
35 —39 лет 47,3 52,7
40 — 44 года 46,8 53,2
45 —49 лет 45,7 54,3
50 — 54 года 44,3 55,7
55-59 лет 42,0 58,0
60 —69 лет 39,0 61,0
70 лет и старше 20,8 79,2

Учитывая, что в состав выборки должны были войти избирате­ли, т.е. лица в возрасте не моложе 18 лет, мы взяли в качестве ос­новы выборки ту часть таблицы, где представлено половозрастное распределение населения от 20 лет (разделить предыдущую стро­ку, выделив из нее лиц 18—19 лет, не представлялось возможным). В итоге распределение половозрастной структуры выборки по числу респондентов в каждой из 20 выбранных половозрастных групп (две по полу и 10 по возрасту) выглядело следующим образом (табл. 2.3):

Таблица 2.3

Половозрастная структура выборочной совокупности

 

 

  Генеральная совокупность Выборочная совокупность
число доля(в%) число
Всего муж. жен. муж. жен. всего муж. жен. всего
Основавыборки 43,4 56,6 100,00
Возраст (лет)                  
20-24 50,3 49,7 9,30
25-29 55,0 45,0 9,22
30-34 12 093 48,5 51,5 9,41
35-39 47,3 52,7 11,17
40-44 46,8 53,2 10,98
45-49 45,7 54,3 9,94
50-54 44,3 55,7 5,66
55-59 42,0 58,0 9,32
60-69 17 503 10 675 39,0 61,0 13,62
70 и старше 20,8 79,2 11,38

Численность каждой из половозрастных групп в трех последних столбцах таблицы пропорциональна24 численности каждой из со­ответствующих групп в генеральной совокупности.

Степень репрезентативности квотной выборки повышается прямо пропорционально степени устойчивости значений тех ха­рактеристик, по которым задаются квоты, поэтому признаки, из­меняющие свои значения слишком быстро, здесь стараются не применять. Иногда у исследователей возникает соблазн увеличить число контролируемых квотных параметров в надежде, что это повысит степень достоверности получаемых результатов. Однако на практике это ведет к нарастанию систематической ошибки и затрудняет работу интервьюера.

Квотная выборка — почти обязательный момент в проведении научного эксперимента, если он практикуется в социальных на-

уках. Что касается опросов общественного мнения, здесь квотная выборка применяется наряду с вероятностными выборками, по-рой для взаимного контроля представительности результатов оп-роса. Метод квот удобен также для построения выборки в случае небольшой генеральной совокупности либо в случае сильной «ско­шенности» распределения в ней элементов наблюдения.

Пример квотной выборки. В проведенном Е.Л. Могильчак в 2000 г. ис-следовании экономических диспозиций студентов 1-4-го курса экономичес-кого факультета Уральского государственного университета и финансового факультета Уральского государственного экономического университета по Екатеринбурга объем квотной выборки составил 380 человек (по 190 сту-дентов от каждого вуза), критериями выступили три признака: пол, курс, успеваемость. Выборка формировалась на каждом факультете в отдельно-сти, ошибка по квотным признакам не превышала 3%. Респондентам пред-лагалось выразить свое согласие с каждым из десяти суждений, отражаю-щих отношение к собственности по пятичленной шкале, включающей зна­чения от «полностью согласен» до «совершенно не согласен» Дифференциация осуществлялась на основании следующих критериев: ха-рактер санкций, характер объекта собственности, характер субъекта соб-ственности, характер прав собственника25.

Квотная выборка у прикладных социологов вошла сегодня в моду, но не от хорошей жизни. По научным критериям она ни-когда не выровняется с классической выборкой, т.е. случайной! которая считается эталоном. Точность результатов по квотном выборке определить нельзя.

Правда, на практике случайный отбор встречается редко, ибо для него обязательно нужен список единиц генеральной совокуп-ности. Если его нет или есть, но такого качества, что для науч-ных целей его лучше не использовать, то и говорить о случайной выборке нельзя.

Многоступенчатая выборка

Отметим, что в реальной практике чаще всего применяется многоступенчатая выборка, построенная с применением проя цедуры поэтапного отбора объектов опроса. При этом совокупч ность объектов, отобранных на предыдущем этапе (ступени)

становится исходной для отбора на следующем. Соответствен­но различают единицы отбора первой ступени (первичные еди­ницы), единицы отбора второй ступени (вторичные единицы) и т.д. Объекты самой нижней ступени, с которых ведется не­посредственный сбор информации, называются единицами на­блюдения.

Приведем пример многоступенчатой выборки, которую мы рассчитывали в ходе одного из маркетинговых омнибусных26 ис­следований, проводившихся при нашем участии в ряде крупных регионов России в 1995 г. одним из столичных маркетинговых центров. Для Нижнего Новгорода объем выборки был задан в 900 человек. В качестве единиц отбора первой ступени были определены три городских района из восьми с объемом выборки 300 респондентов по каждому. Здесь, как и на следующей ступе­ни, был использован метод типичных представителей. Определив среднюю численность населения одного района, мы остановили свой выбор на трех районах — Канавинском, Советском и Ниже­городском, численность населения которых в наименьшей степе­ни отклонялась от этого среднего значения. За основу выборки на второй ступени были взяты списки избирателей (большинство из которых выступают самостоятельными экономическими агента­ми рынка в качестве покупателей). Здесь в качестве единиц отбо­ра второй ступени были определены по три избирательных учас­тка. Также были рассчитаны средние размеры каждого из участ­ков и отобраны те из них, где численность избирателей в наименьшей степени отклонялась от средней. На третьей ступе­ни за основу выборки принимался список избирателей каждого участка. Было определено, что на каждом участке предстоит оп­росить по 100 человек (я(.= 100). На этом последнем этапе для окончательного отбора единиц наблюдения применялся метод си­стематической выборки. Определив шаг выборки, мы получили списки респондентов с домашними адресами. Поскольку во всех районах имелись электронные версии списков избирателей, вся процедура заняла менее одного дня.

Отметим, что и в приведенном выше примере опроса изби­рателей в ходе избирательной кампании фактически использо-

валась многоступенчатая выборка. На первой ступени была про­изведена квотная выборка по параметрам пола и возраста, а на втором рассчитана территориальная квота — по параметрам чис­ленности каждого избирательного округа. Затем была опять просчитана половозрастная квота для каждой из первичных единиц отбора (округов). Кроме того, была задана половозраст­ная квота для каждого из тридцати анкетеров по отдельным

участкам опроса.

К многоступенчатому отбору прибегают в тех случаях, когда генеральная совокупность имеет настолько большой объем, что простой случайный или систематический отбор элементов привел бы к чрезмерному распылению выборки по всей территории. По­просту говоря, такой метод применяют в тех случаях, когда изу­чают достаточно большие группы людей или крупные общности, скажем регион или город.

В многоступенчатой выборке каждая единица отбора представ­ляет собой гнездо единиц более низкого уровня, поэтому много­ступенчатый отбор позволяет локализовать выборку в меньшем числе точек. Большой массив социолог начинает последователь-но сужать, проходя множество ступеней, доводя большую сово-купность до такой малой величины, что ее можно охватить одним взглядом, а если это территория, то обойти ногами. Город делит-ся на районы, те — на кварталы, затем выделяют избирательные участки, а в них отбирают домохозяйства.

Многоступенчатая выборка поначалу напоминает огромную воронку, поскольку широкое горлышко (огромную совокупность респондентов или объектов) через ряд процедур сводят к узкой горловине, с которой социолог в конечном итоге и имеет дело.

Однако то, что облегчает его жизнь на этапе составления вы-борки, сильно затрудняет его существование на конечной фазе, когда он подсчитывает величину ошибки и думает, на какую ге-неральную совокупность он может распространить свои выводы

При этом не стоит забывать: чем больше ступеней в многоступенчатом oт боре, тем больше ошибка выборки. В любом случае при многоступенчатом отборе ошибка всегда больше, чем при простом случайном. И еще: на каж-дой ступени все равно применяется случайный отбор.

Такая вот странная диалектика у нас получается: число оши-бок на каждой ступеньке возрастает, они накапливаются с каж-дым шагом и разрастаются к концу исследования до неуправляе-мых размеров. Вместо обратной пирамиды, т.е. воронки, мы по-лучили теперь прямую пирамиду (рис. 2.4).

 

Специалисты об этом явлении говорят так: на каждой ступени процессу независимого извлечения выборки сопутствует своя вы­борочная ошибка. Отдельные ошибки складываются в общую ошибку многоступенчатой выборки. Таким образом, увеличение количества ступеней, с одной стороны, приводит к сокращению базовых точек опроса и, следовательно, к экономии людских и материальных ресурсов, с другой — к уменьшению точности вы­борочных оценок27.

2.7. Идеальные и реальные совокупности

Обследуемый объект — выборочная совокупность — пред­ставляет собой явление, таящее в себе массу противоречий и подводных камней. Социологу следует помнить, что этот объект не существует в реальности — он сконструирован процедурой операционализации переменных, методикой выборки респон­дентов, условиями наблюдения, проведения интервью или эк­сперимента.

«Действительно, выборочная совокупность, с которой непос­редственно «снимаются» данные, порождается процедурой, но в то же время она растворена в большой совокупности, которую представляет или репрезентирует с разной степенью точности и надежности. Социологические заключения относятся не к обсле­дованным на прошлой неделе респондентам, а к идеализирован­ным объектам: «старшим поколениям», «молодежи» и т.д.»28.

В идеале представляется, что из генеральной совокупности де­лается правильная выборка и опрашиваются только те, кто в нее попал. Однако подобная идеальная ситуация происходит далеко

не всегда. Социолог правильно определил генеральную совокуп­ность, сделал правильную выборку, но при обходе домов и опро­се респондентов возникли непредвиденные сложности и часть из них или выпала, или была заменена на других. В результате те, кто попал в выборку, и те, кто был реально опрошен, представ­ляют разные совокупности людей. В итоге вместо одного объекта исследования мы получили целых два.

Предположим, что социолог интересуется мнением россиян накануне президентских выборов. Что входит в понятие «россия­не»? Объем понятия «россияне» охватывает, по всей видимости, всех, кто является гражданином России и имеет право участвовать в президентских выборах. Назовем всех мыслимых россиян, со­ответствующих данному свойству, идеально планируемой генераль­ной совокупностью.Но на практике обследовать всех, кто охвачен теоретически сконструированным понятием «россияне», невоз­можно. «Среди россиян немало людей находится в тюрьмах, ис­правительно-трудовых учреждениях, в следственных изоляторах и иных труднодоступных для интервьюера местах. Эту группу придется «вычесть» из проектируемого объекта. «Вычесть» придет­ся и многих пациентов психиатрических больниц, детей, часть престарелых. Вряд ли гражданскому социологу удастся обеспечить нормальные шансы на попадание в выборку и военнослужащим. Аналогичные проблемы сопровождают обследование читателей, избирателей, жителей малых городов, посетителей театров... По­мимо заключенных, военнослужащих и больных, меньшую веро­ятность попасть в выборку имеют жители удаленных от транспор-тных коммуникаций сел, особенно если обследование производит-ся осенью; те, кого, как правило, нет дома, не склонны к разговорам с посторонними людьми и т.п. Бывает, что интервью- еры, пользуясь отсутствием контроля, пренебрегают точным ис-полнением своих обязанностей и опрашивают не тех, кого поло-жено опрашивать по инструкции, а тех, кого легче «достать».

Исключив из идеальной генеральной совокупности все труд- недоступные единицы наблюдения, мы получим более узкое по-нятие —реально получившуюся генеральную совокупность. В мето- дологической литературе первая получила также название концеп-туального объекта, а вторая — проектируемого.

Концептуальный объект идеальный конструкт, обозначаю- щий рамки темы исследования. Проектируемый объект — сово-купность доступных исследователю единиц.

Итак, взвесив свои возможности и поняв, что всех, кто иде­ально подходит для нашей генеральной совокупности, мы опро­сить по разным обстоятельствам не сможем, мы получаем в итоге новую генеральную совокупность, из которой и должны исходить, проектируя свою выборку. Они могут различаться совсем незна­чительно (если труднодоступных единиц наблюдения мало) или очень значительно (если таковых много).

Поскольку два объекта расходятся, то следует заново переоп­ределить генеральную совокупность. Старое определение: гене­ральная совокупность — это та совокупность, из которой предпо­лагается производить выборку единиц. Новое определение: гене­ральная совокупность — это та совокупность, из которой производится выборка единиц. Чем они различаются? Старое оп­ределение не учитывает труднодоступность и возможные на прак­тике ограничения, но указывает на теоретически возможный объем понятия, скажем «россияне». В теоретически сконструиро­ванной генеральной совокупности, согласно официальной стати­стике, например, 49% мужчин и 51% женщин. Но когда социо­лог отбросил все труднодоступные единицы наблюдения и дал новое определение, приближенное к реальности обследования, у него получилось, к примеру, 43% мужчин и 57% женщин (умень­шение количества мужчин могло произойти за счет того, что, ска­жем, опросить военных и заключенных накануне президентских выборов практически невозможно или нереально).

Из какой генеральной совокупности — теоретически мыслимой или реально существующей — должен исходить социолог? Види­мо, из второй. А с какой генеральной совокупностью он должен сравнивать выборочную после полевого исследования и устанав­ливать меру отклонения, т.е. определять репрезентативность? Обязательно со второй. Но часто об этом забывают и сравнение происходит с первой совокупностью, хотя выборка производилась из второй.

Однако трудности встречаются, как мы уже выяснили, не только на пути конструирования генеральной совокупности. Не меньше, если не больше, их и на пути конструирования, а затем и обследования выборочной совокупности. Выше они были сгруппированы в два типа ошибок выборки — случайные и сис­тематические. Для неопытного полевого социолога они могут стать мощнейшим фактором возмущения и причиной серьезных погрешностей.

В результате наложения двух типов ошибок происходит не меньшее, если не большее, чем в случае с генеральной совокуп­ностью, отклонение идеально запроектированной выборки от ре-120

ально получившейся. Отклонение реальной выборки от проекти­руемой можно наглядно изобразить на схеме.

На рис. 2.5 сплошной линией обозначена связь двух реаль-ных выборок: А'ЮВ; она символизирует то, что получилось в эм-лирическом исследовании в действительности. Хотя, конечно же, социологу мечталось о другом. В идеале он желал бы получить связь АЮВ1, т.е. чтобы из идеально сконструированной и мак-симально широкой генеральной совокупности у него получилась максимально полная и репрезентативная выборка. Но позже, ког-да он осознал невозможность получения идеальной генсовокуп-ности, он устремился ко второму варианту — получить связь А'ЮВ1, т.е. из ограниченной генсовокупности получить макси-мально полную выборку. На самом же деле, преодолев многочис-ленные трудности и наделав множество ошибок (случайных и си-стематических), социолог получил самый худший вариант,а именно А'ЮВ.

Для сокращения разрыва между идеальной (проектируемой) и реальной (получившейся) выборками, приведения в соответствие замысла и действительности социологи разработали множество до-вольно эффективных приемов: контроль выборки (увеличение удельного веса недостающих групп и уменьшение избыточных), ремонт выборки (замена труднодоступных респондентов анало-гичными по задаваемым признакам индивидами), контроль запол-нения вопросников и др. С их помощью реальный массив подго-няется под проектируемый.

2.8. Расчет объема выборки30

Из всех вопросов, которые задают сотрудникам знаменитого Института опросов общественного мнения Гэллапа, самым попу­лярным является такой: как вы можете, проинтервьюировав 1000 человек, судить о том, что думают 250 млн американцев?

Для ответа на этот вопрос нужно упомянуть не только высокую квалификацию и огромный практический опыт сотрудников, но и использование ими статистики и математики. Если методы опроса не основаны на науке, результаты могут ввести вас в заблуждение.

В статистике приняты следующие разграничения объемов вы­борки. Объем выборки, достаточный для взаимопогашения слу­чайностей и получения статистических характеристик закономер­ного характера, равен 30. Выборка такого объема называется ма­лой. Характер распределения значений признака в малых выборках приближается к нормальному с ростом числа испытаний. Мини­мальный объем выборки, позволяющий получить средние значе­ния признака с указанием доверительных вероятностей, равен 5. Выборки такого объема называются сверхмалыми. Распределение значений признака в таких выборках характеризуется распределе­нием Стьюдента. Но чаще всего в социологии имеют дело с го­раздо большим объемом выборки.

При планировании выборочного обследования наступает мо­мент, когда нужно решить, сколько человек опрашивать, т.е. ка­ким должен быть объем выборки. Это решение чрезвычайно важ­но, поскольку слишком большая выборка потребует излишних затрат, а слишком маленькая понизит качество результатов.

Объем выборки — общее число единиц наблюдения, включенных в выбо­рочную совокупность.

Поскольку выборочная совокупность — это часть генеральной совокупности, отобранная с помощью специальных методов, — важно, чтобы эта часть не искажала представления о целом, т.е. репрезентировала его. Социологов, часто проводящих эмпиричес­кие исследования, постоянно волнует вопрос о том, как много надо опрашивать человек, чтобы получить достоверную информа­цию? Институт Гэллапа в США проводит регулярные опросы по национальной выборке объ

1,5%). Центр «Социо-Экспресо Института социологии РАН про­водит исследования на выборке объемом в 2 тыс. человек, при этом ошибка выборки не превышает 3%31.

Специалисты считают, что наилучшая выборка — не обязатель­но большая. Конечно, чем больше объем выборки, тем выше точ­ность ее результатов. Однако даже огромная выборка не гаранти­рует успеха, если генеральная совокупность «плохо перемешана», т.е. является неоднородной. Однородной считается такая совокупи ность, в которой контролируемый признак распределен равномер-но, не образует пустот или сгущений. В этом случае, опросив не­скольких человек, можно получить точную информацию о распре­делении этого признака в генеральной совокупности.

Таким образом, на репрезентативность данных влияют не ко­личественные характеристики выборочной совокупности (ее объем), а качественные характеристики генеральной совокупнос-ти — степень ее однородности.

В социологии еще не придумано единой и четкой формулы, используя которую можно рассчитать оптимальный объем выбо­рочной совокупности, — такой формулы просто не существует в природе. И объясняется это весьма просто. Дело в том, что опре-деление объема выборочной совокупности — проблема не столько статистическая, сколько содержательная. Иными словами, объем выборочной совокупности зависит от множества факторов, в том числе от целей и задач, теоретической модели, гипотез и методов исследования, степени однородности генеральной совокупности наконец, требующейся точности получаемой информации.

Надо всегда помнить, что каждый процент прироста точности ин-формации в исследовании приводит к резкому увеличению расходов на его проведение. Знаменитый институт Гэллапа, на протяжении многих десятилетий проводящий опросы в США, выявил, что при общенациональной выборке в 100 человек — ошибка выборки будет в пределах ±11%; 200 человек - ±8%; 400 - ±6%; 600 - ±5%; 750 — ±4%; 1000 - ±4%; 1500 - ±3%; 4000 человек - +2%. Именно поэто-му он проводит общенациональные опросы в США на выборке в 1500-2000 человек. Как видно, он предпочитает увеличение ошибки на 1% многократному увеличению стоимости исследования.

Практика показывает, что для многих социологов обоснование объема выборки является камнем преткновения, несмотря на зна- чительное количество литературы, посвященной выборочным

методам и, в частности, расчету объема выборки. Причин несколь­ко: 1) дефицит специальной литературы на периферии; 2) нехватка времени для самообразования; 3) неумение пользоваться матема­тическим аппаратом. В связи с этим возникает необходимость без сложных математических формул изложить стратегию и тактику обоснования объема выборки.

Процедура расчета объема выборки — цепь бесконечных компро­миссов между стремлением к точности и ограниченностью ресурсов, дефицитом времени и неполнотой сведений об изучаемом явлении. Вместе с тем это наука и искусство, познание которых доступно каж­дому человеку. Однако для этого нужно знать стратегии расчета объе­ма выборки (предварительного расчета, последовательной и комби­нированной стратегии), а также факторы, влияющие на объем вы­борки (объем генеральной совокупности, варьирование ответов респондентов, точность оценивания, характер предполагаемого рас­пределения ответов, метод исследования, процедура обработки).

Стратегия предварительного расчетасостоит в том, что объем выборки определяется до проведения основного исследования. В наиболее простом случае можно воспользоваться уже наработан­ным опытом, например, института Гэллапа, где используется объем выборки приблизительно в 1500—2000 человек. Для средне­статистического отечественного исследования объема выборки — примерно 400—600 человек.

Для расчета объема случайной выборки надо знать желаемую точность оценивания, величину риска получаемого ответа и сте­пень изменчивости ответа. Традиционно точность оценивания принимают за 5%, а величину риска — за 0,95. Иными словами, если по данным выборочного исследования 60% опрошенных удовлетворены работой, то можно утверждать, что в генеральной совокупности доля удовлетворенных составит от 55 до 65% в 95% случаев, а в 5% случаев такая доля может выйти за этот интервал. Если исходить из 5%-ной точности и величины риска в 0,95, объем выборки будет следующим (табл. 2.4).

Таблица 2.4 Зависимость объема выборки от объема генеральной совокупности

Объем генеральной совокупности Бесконечная
Объем выборки

Результаты, приведенные в табл. 2.4, свидетельствуют против Распространенного заблуждения, будто бы объем выборки — же-

стко фиксированный процент от генеральной совокупности, рав-ный 10. На самом же деле эта величина — не постоянная, а пере-менная, изменяющаяся в конкретных условиях. Объем выборки зависит также от того, какие вопросы используются в анкете. Цифры в табл. 2.4 действительны только для одного случая — ког-да речь идет о дихотомическом вопросе, у которого максималь- ный разброс ответов — 50 на 50%. Не имея предварительной ин-формации о разбросе оценок, социолог как бы заранее страхуется и считает, что этот разброс составит 50 на 50%. Если же такая информация имеется, то объем выборки будет следующим..

Таблица 2.5 Зависимость объема выборки от распределения дихотомического ответа

 

Распределение ответов, %
Объем выборки

В табл. 2.5 показано распределение ответов на качественные вопросы. Расчет объема выборки для количественных вопросов, включающих вопросы типа «возраст» и «заработная плата», стро­ится исходя из коэффициента вариации (табл. 2.6), который по-казывает, какой процент составляет среднее квадратическое откло-нение от средней арифметической, и позволяет сравнивать межч-ду собой (по степени варьирования) любые признаки.

Таблица 2.6

Зависимость объема выборки от коэффициента вариации

 

Коэффициент вариации, % 110 I 120
Объем выборки 1860|2213

Если изучаются условия труда, взаимоотношения в коллекти­ве, заработная плата и т.д. с помощью пятичленной шкалы,то коэффициент вариации изменяется здесь от 27 до 62%, а при ис-пользовании семичленной — от 78 до 113%. Стало быть, чем длиннее шкала, тем выше коэффициент вариации и больше дол­жен быть объем выборки. Если социолог хочет обойтись неболь-шой выборкой, то и вопросы должен формулировать проще. Иногда думают, что чем длиннее шкала, тем точнее измерение Но преимущества семибалльных шкал над пятибалльными не доказаны.

Среди социологов распространено мнение, согласно которому чем больше объем выборки, тем точнее результат, и это заставля-ет их непомерно увеличивать количество опрошенных. В реаль-

ности дело обстоит иначе: табл. 2.7, составленная по данным Ин­ститута Гэллапа, показывает зависимость между объемом выбор­ки и точностью оценивания в процентах. Из нее следует, что с увеличением объема выборки точность возрастает, но до опреде­ленного порога. Уже при 600 опрошенных достигается желанный для всех 5%-ный уровень точности. Стало быть, 600 человек — приемлемый объем выборки.

Между цифрами 400 и 600 человек противоречия нет. В пер­вом случае объем выборки рассчитывался, исходя из положения о нормальном распределении ответов респондентов, а во втором — из практики. Расхождение между теорией и практикой обуслов­лено тем, что в реальной ситуации распределение оценок отлича­ется от нормального, поэтому объем выборки надо рассчитывать с учетом именно этого обстоятельства; наиболее эффективным способом уменьшения объема выборки является снижение коэф­фициента вариации оценок.

Таблица 2.7 Зависимость между объемом выборки иточностью оценивания

Количество интервью Точность оценивания,%
±11
±8
±6
±5
±4
±4
±3
±2

При расчете объема выборки социологи часто совершают та­кую ошибку: рассчитав по существующим формулам необходимый объем выборки в целом для совокупности, в дальнейшем пропор­ционально размещают его по отдельным подразделениям выбор­ки, например по цехам, предприятиям, районам, городам, типам семей. После чего на этапе обработки данных — анализируют уже сами различия между подразделениями. Однако правильнее вы­числить объем выборки отдельно для каждого подразделения, а затем суммировать отдельные объемы. Допустим, расчеты объе­ма выборки по трем цехам (с учетом размерности шкалы, числен­ности работающих, характера предполагаемого распределения оценок) позволили установить, что в первом цехе необходимо спросить 384 человека, во втором — 222, а в третьем — 600. Тогда общий объем выборки составит 384 + 222 + 600 = 1206 человек

Если социологу необходимо опросить какую-либо катего- рию работников (допустим, водителей автобусов), о которой из- вестно лишь, что к ней принадлежит, например, десятый работ­ник предприятия, и он решил спросить 139 водителей автобусов, а общий объем выборки для предприятия составит 1390 человек, т.е. иными словами, отбирая случайным образом 1390 респонден­тов на предприятии, мы в соответствии с теорией выборки наде­емся выявить 139 человек интересующей нас специальности.

При расчете квотной выборки социологи часто произвольно определяют ее объем в 1000 человек, исходя из удобства вычисле­ния квот. Но с таким же успехом можно взять любое другое круг­лое число. Более обоснованным является подход, при котором, объем квотной выборки рассчитывается как для случайной. Дру-гим вариантом расчета объема квотной выборки является исполь-зование теории малых выборок. Ее суть: если не ставится цель дать дифференцированный анализ по группам работников, то умножа-ют количество градаций вопросов, подлежащих изучению, на 25 (минимальный статистический значимый размер группы). Напри-мер, изучают три переменные: пол — две категории, возраст — две категории (до 30 лет и свыше 30 лет), удовлетворенность трудом — измеряется пятибалльной шкалой. Тогда необходимый объем вы- борки для данного примера составит 2x2x5x25 = 500 человек. Объем выборки увеличивается в 2,5 раза. Ясно, что с расширени- ем числа переменных и числа градаций объем выборки может стать катастрофически большим. Выход только один: детальная проработка исходной проблемы, которая позволит отбраковать лишние вопросы в анкете, оставив самые важные. Если в иссле-довании проверяется несколько гипотез, то объем выборки для проверки каждой гипотезы вычисляется отдельно. Таким образом, при использовании выборки количество вопросов в анкете и ги­потез должно быть минимальным.

Итак, мы рассчитали требуемый объем выборки. Теперь, и только теперь необходимо проверить, совместима ли полученная величина с выделенными ресурсами. Типичная ошибка многих социологов-прикладников состоит в том, что при расчете объема выборки во главу угла ставятся наличные ресурсы или, хуже того, социолог пассивно принимает все условия, диктуемые заказчиком.. Это в корне неверно по нескольким причинам. Во-первых, рас­чет объема выборки позволяет глубже проникнуть в суть изучае­мого предмета и специфику методов исследования, а значит, ар- гументированно требовать получения больших ресурсов или при-нять правильное решение о снижении объема выборки. Если администрация отказала в дополнительных ресурсах, а цели ис-

следования не позволяют сократить объем выборки (т.е. социолог не может принять решение администрации), то надо переходить к другой схеме исследования. Во-вторых, обоснованный расчет объема выборки показывает профессионализм социолога и застав­ляет заказчика относится к нему более уважительно.

Стратегия последовательного расчетаобъема выборки. При расчете объема выборки желательно знать разброс оценок и не­которые другие параметры. Однако они-то, как правило, неиз­вестны. Для того чтобы не допустить ошибки, лучше предполо­жить, что они максимальны. Плата за наше незнание — разбуха­ние объема выборки сверх необходимого и дополнительные финансовые и временные затраты (приходится опрашивать боль­шее число людей). Для сохранения затрат применяется последо­вательная стратегия — объем выборки не рассчитывается заранее, а ставится в зависимость от конечных результатов исследования. Например, опрашивают 100 человек, затем устанавливают вели­чину разброса оценок и уже в зависимости от этого рассчитыва­ют необходимый объем выборки. Если оказывается, что 100 чело­век достаточно, то исследование заканчивается. В противном слу­чае добирается необходимое количество респондентов, но не до бесконечности. Известен пример из практики Дж. Гэллапа, ко­торый в начале своей карьеры активно экспериментировал с объемами выборки. В 1936 г. американцам был задан вопрос: «Хотели бы вы возобновления закона о восстановлении нацио­нальной промышленности?» Выяснился странный парадокс: Дж. Гэллап вначале опросил 500 человек и замерил ошибку выбор­ки, а затем последовательно наращивал число респондентов до 30 тыс. К своему сожалению, он обнаружил, что прибавление 29,5 тыс. опрошенных увеличило точность информации менее чем на 1%. Следовательно, опрос можно было прекращать уже при 500 опрошенных. Этот пример показывает, что, применяя последовательную стратегию, можно добиваться значительного снижения необходимого числа наблюдений по сравнению с пред­варительным расчетом объема выборки.

Однако стратегия последовательного расчета объема выборки приносит желаемый результат лишь в том случае, если социолог может производить необходимые расчеты в ходе самого опроса, например телефонного, с применением компьютерных систем. Социолог вводит ответы респондента в свой персональный компь­ютер, с него результаты сразу поступают на компьютер руководи­теля исследования, обрабатываются, и на экране дисплея выдается информация не только об одномерных частотах, распределенных по тому или иному вопросу, но и о требуемом объеме выборки..

Если существует опасность, что объем выборки может оказаться катастрофически большим, надо совместить оба вида стратегии — предварительную и последовательную, т.е. применить комбиниро- ванную стратегию. Рассчитывая выборку по предварительной стра­тегии, получаем верхние допустимые значения для последователь­ной стратегии или, иначе говоря, ту величину объема выборки, при достижении которой прекращается опрос по последователь- ной стратегии.

Наиболее обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов, в: основе которого лежит ряд базовых понятий математической ста­тистики (вариация, среднее квадратическое отклонение, довери-тельный интервал, средняя квадратическая ошибка).

Для расчета необходимого размера выборки в количественном исследовании чаще всего используют два статистических поня-тия — доверительный интервал и доверительную вероятность. Доверительный интервал представляет собой заранее задаваемую вами погрешность выборки. Например, если вы задаете доверй-тельный интервал в 3% и конкретный ответ на конкретный воп-рос исследования составит 48%, это значит, что даже при прове- дении опроса всей генеральной совокупности реальное значение попадет в интервал между 45 (48-3) и 51% (48 + 3). Доверитель-ная вероятность показывает, насколько вы можете быть уверены в полученных результатах, в том, что характеристики выборки со-ответствуют характеристикам всей генеральной совокупности -иными словами, с какой вероятностью случайный ответ попадет в доверительный интервал. Обычно используют доверительную вероятность 95 и 99%. Чаще всего используется 95% — этого впол-не достаточно в подавляющем большинстве исследований. Если объединить доверительную вероятность и доверительный интер-вал, то можно сказать, что ответы на вопрос с 95%-ной вероятно-стью попадут в интервал между 45 и 51%.

Весьма полезна следующая приблизительная оценка надеж-ности результатов выборочного обследования. Повышенная на-дежность допускает ошибку выборки до 3%, обыкновенная — от 3 до 10% (доверительный интервал распределений на уровне 0,03-0,1), приближенная — от 10 до 20%, ориентировочная — от 20 до 40%, а прикидочная — более 40%33.

На основе этих понятий с учетом ряда предположений выво­дятся формулы расчета объема выборки, которые предполагают,

что репрезентативность гарантируется путем использования кор­ректных вероятностных процедур формирования выборки.