Определение выборки
Объектами полевых исследований выступают все представители, носители какого-либо важного признака или потребители товара/услуги, которых называют генеральной совокупностью. Иногда она небольшая и ее исследуют целиком. Но чаще всего всю совокупность охватить даже проведением массовых опросов невозможно, поэтому изучают только ее часть, которая называется выборкой.
При проведении опросов часто возникают ошибки, снижающие достоверность информации, о которых будет подробнее рассказано в параграфе 6.11, — это систематические ошибки, связанные с компетенцией проводящего их персонала, а также статистические ошибки, к которым относится ошибка выборки. Она проистекает из двух элементов — математической погрешности, зависящей от объема выборки, а также ошибки нерепрезентативности данных, зависящей от выбора респондентов, т.е. типа выборки. При контроле математической погрешности необходимо знать следующие характеристики на стадии разработки концепции маркетинговых исследований: примерный размер генеральной совокупности, которую планируется изучать, т.е. количество изучаемых потребителей, и плановую погрешность точности (например, ±5%), вследствие чего можно задать размер выборки.
Таким образом, ошибка выборки обуславливается методом формирования выборки и ее размером.
Формирование выборки основывается на знании контура выборки, под которым понимается список всех единиц совокупности, из которых выбираются единицы выборки. Ошибка контура выборки характеризует степень отклонения от истинных размеров генеральной совокупности.
Основные типы выборки, использующиеся при проведении полевых исследований, следующие.
1. Неслучайные (детерминированные) выборки:
— нерепрезентативная;
— поверхностная;
— квотная;
— "снежный ком";
— типовая.
2. Случайные (вероятностные) выборки:
— простая случайная;
— систематическая (пошаговая);
— стратифицированная (расслоенная);
— кластерная (клумбовая).
Как правило, используют оба типа выборки, т.е. выборки носят составной характер. С одной стороны, по типу лотереи каждый посетитель торгового центра имеет шанс быть опрошенным, с другой — в выборку не должны попадать респонденты, не посещающие торговые центры.
Неслучайные или детерминированные выборки (nonprobability sampling) основаны скорее на индивидуальной оценке исследователя, чем на случайном отборе элементов выборки. Исследователь может произвольно или сознательно решать, какие элементы включать в выборку. В результате проведения детерминированной выборки можно получить детальную оценку характеристик совокупности. Однако этот подход не позволяет объективно оценить точность результатов исследования. Поскольку невозможно определить вероятность включения в выборку каждого отдельного элемента, полученные результаты нельзя статистически распространять на всю совокупность.
Неслучайные выборки делятся на неквалифицированные и квалифицированные. Неквалифицированными неслучайными выборками считаются нерепрезентативные (например, размещение анкеты в непрофильных для изучаемой целевой аудитории СМИ) и поверхностные, квалифицированными — квотированные, "снежный ком" и типовые.
Нерепрезентативные выборки создаются из удобных и доступных для отбора элементов. Отбор элементов для включения в выборку проводится главным образом интервьюером. Иногда отбор респондентов для участия в исследовании основан на том, что они оказались в нужном месте и в нужное время. Примером применения нерепрезентативной выборки может служить: опрос студентов; покупателей торгового центра без предварительной квалификации респондентов; отрывные анкеты в журналах и опрос прохожих на улице. Нерепрезентативная выборка наиболее экономична с точки зрения временных и финансовых затрат. Элементы выборки доступны, готовы сотрудничать и их характеристики легко измерить. Несмотря на эти преимущества использование личного выборочного наблюдения имеет ряд ограничений. Существует большой риск возникновения различных ошибок, включая самовыбор респондентов. Нерепрезентативная выборка не может представлять какую-либо определенную совокупность. Поэтому абсолютно некорректно распространять на генеральную совокупность выводы, полученные при анализе нерепрезентативной выборки, она не подходит для маркетинговых исследований, предусматривающих написание заключения обо всей совокупности.
Поверхностная выборка — это разновидность нерепрезентативной выборки, в соответствии с которой элементы совокупности отбираются на основе суждений исследователя. Исследователь, применив свои знания или проведя анализ, отбирает элементы для включения в выборку, поскольку считает, что они представляют изучаемую совокупность или подходят по другим соображениям. Типичные примеры поверхностной выборки: пробные рынки, выбранные для оценки потенциала нового товара; инженеры, покупающие промышленные товары, выбранные для участия в отраслевых маркетинговых исследованиях, поскольку их считают представителями компании; универсальные магазины, выбранные для тестирования новой системы выкладки товаров.
Поверхностная выборка недорога, удобна и быстра, но она не позволяет обобщать результаты, полученные в ходе изучения определенной совокупности, потому что эта совокупность точно не определена. Поверхностная выборка субъективна, и ее эффективность полностью зависит от оценки исследователя, его компетентности и изобретательности. Она полезна, если заказчик не требует подробного заключения о результатах исследования данной совокупности.
Квотные выборки применяются фиксированием исследователем контрольных характеристик, относящихся к предмету исследования, и определяются их распределением в изучаемой совокупности. Например, такими характеристиками является заранее известная исследователям структура потребителей по таким признакам, как пол, возраст, уровень образования и доходов, либо в качестве генеральной совокупности рассматривается все население и задается, что в выборке должно быть 55% женщин и 45% мужчин или 22% людей в определенном интервале возраста.
Применяя выборку по квотам, исследователь стремится получить представительную выборку при сравнительно низком уровне затрат (прежде всего временных и трудовых). Преимущества такой выборки — удобство выбора элементов для каждой квоты. Но даже если в структуре выборки полностью отражена структура популяции с учетом контрольных характеристик, нет гарантии, что эта выборка репрезентативна. Если характеристика, непосредственно связанная с проблемой исследования, не учтена, то квотная выборка нерепрезентативна. Важные контрольные характеристики часто упускаются из виду в связи с тем, что на практике очень сложно включить большое количество таких характеристик в выборку. Элементы выбираются из каждой квоты, исходя из удобства или на основании мнения исследователя. Значит, существует большая вероятность необъективности при отборе. Интервьюеры могут отправиться в те из указанных районов, где легче всего найти подходящих респондентов. Более того, они могут избегать людей, которые недружелюбно выглядят, плохо одеты или живут в местах, куда неудобно добираться. Квотная выборка не позволяет оценить величину ошибки выборки.
"Снежный ком" — это выборка по личным связям, когда каждый последующий респондент сообщает контакты других респондентов, к которым можно обратиться. Или выборка делается по знакомым, родственникам. Это делает работу быстрее. Важно, чтобы проводящий опрос интервьюер не был лично знаком с респондентами для снижения влияния межличностных факторов, поэтому в таких случаях личные контакты передаются своим коллегам.
Типовая выборка — одна из самых популярных, формируется по одному или нескольким признакам одновременно (например, отбираются только женщины и только от 18—25 лет, только постоянно проживающие в Москве). В погоне за репрезентативностью можно сделать недостижимым проведение исследования. Например, если ввести очень много требований к отбору, квотам и типовым требованиям, то нужное количество респондентов можно отбирать очень долго.
Случайные (вероятностные) выборки преследуют принцип теории вероятности, их назначение — обеспечить случайность.
Простая случайная выборка построена на принципе лотереи, т.е. каждый элемент совокупности имеет известную и равную вероятность отбора. Например, используется генератор случайных чисел, когда в колл-центре случайным образом отбираются домашние телефоны для последующего обзвона респондентов.
Простая случайная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность, и поэтому большинство подходов к получению статистических выводов предусматривает сбор информации с помощью простой случайной выборки. Однако метод простой случайной выборки имеет несколько существенных ограничений. Во-первых, сложно создать основу выборочного наблюдения, которая позволила бы провести простую случайную выборку. Во-вторых, результатом применения простой случайной выборки может стать большая совокупность либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных. В-третьих, результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов. В-четвертых, в результате применения использования данного подхода может сформироваться нерепрезентативная выборка.
При проведении систематической (пошаговой) выборки сначала задают произвольную отправную точку, а затем из основы выборочного наблюдения последовательно выбирают каждый г-й элемент. Например, когда для личного анкетирования представителей домохозяйств выбирается каждый третий дом улицы для исследования. Обшей чертой систематической выборки и простой случайной выборки является то, что каждый элемент генеральной совокупности имеет известную и равную вероятность выбора. Но систематическая выборка отличается тем, что только допустимые выборки объема, которые можно получить из генеральной совокупности, имеют известную и равную вероятность выбора. Систематическая выборка дешевле и проще, чем простая случайная, поскольку случайный отбор осуществляется только один раз. Еще одно важное преимущество: систематический отбор можно применять, даже не зная структуру основы выборочного наблюдения. Например, можно опросить каждого 1-го человека, покидающего универмаг или торговый центр. Поэтому систематический отбор часто применяется при проведении почтовых и телефонных опросов, а также интервью-"перехватов" в торговых центрах.
Стратифицированная, или расслоенная, выборка — это процесс, состоящий из двух этапов, в котором совокупность делится на подгруппы (слои или страты). Слои должны взаимно исключать и дополнять один другого, чтобы каждый элемент совокупности относился только к одному слою, и ни один элемент не был упущен. Далее из каждого слоя случайным образом выбираются элементы, при этом обычно используется метод простой случайной выборки. Отличие стратифицированной выборки от квотной состоит в том, что элементы в ней выбираются скорее случайно, а не из удобства или на основании мнения исследователя. Главная задача стратифицированной выборки — увеличение точности без увеличения затрат.
Переменные, используемые для деления совокупности на слои, называются стратификационными переменными. Критерии для их выбора: однородность, неоднородность, взаимосвязанность и стоимость. Элементы, относящиеся к одному слою, должны быть как можно более однородными, а относящиеся к разным слоям — наоборот, как можно более разнородными. Кроме того, стратификационные переменные должны быть тесно связаны с исследуемой характеристикой. Чем больше переменные соответствуют этим критериям, тем эффективнее уменьшение нежелательных отклонений в выборке. В конце концов переменные должны снижать стоимость процесса расслоения, будучи простыми в оценке и применении. Как правило, для стратификации используют такие переменные, как демографические характеристики, разновидность покупателя (например, владельцы автомобилей или те, кто их не имеет), величина фирмы или отрасль промышленности. Так, при использовании данной выборки жителей области расслаивают на районы и по данным одного района переносят выборку на всю область.
Основное различие между кластерной (клумбовой) и стратифицированной выборкой состоит в том, что в первом случае используются только отобранные подгруппы (кластеры), в то время как в стратифицированной выборке все подгруппы (слои) используются для дальнейшего отбора. Эти методы преследуют разные цели. Цель кластерной выборки — увеличить эффективность выборки, уменьшив затраты на ее проведение. Цель стратифицированной выборки — увеличение точности. Клумбовая выборка похожа на стратифицированную, но в ней из выбранного слоя выбираются не все элементы, а только некоторые типичные.
При построении выборки обычно используются следующие последовательные этапы.
1. Определение исследуемой генеральной совокупности (например, студенты дневных отделений вузов Москвы).
2. Выбор основы для построения выборки (например список всех вузов Москвы).
3. Выбор способа построения выборки (например, стратифицированный отбор).
4. Определение требуемого размера выборки.
5. Реализация процесса построения выборки.