Проектирование выборки и сбор данных

На этапе проектирования выборки и сбора данных нужна информация о параметрах "группы", избранной для маркетингового исследования (контур выборки, ее объем), и единице выборки. Чтобы проводимое исследование было репрезентативным, следует использовать вызывающий доверие метод, с помощью которого отбираются единицы выборки из ее контура.

В литературе описываются два вида выборки. Вероятностной (случайной) называют выборку, у которой все единицы могут быть включены в нес. При невероятностной (неслучайной) выборке степень вероятности (шанс) неизвестна. В связи с тем что в основном точно рассчитать шанс практически невозможно, для большей части маркетинговых исследований определить наиболее эффективный размер совокупности не удается. Поэтому термин "известная вероятность" скорее обозначает применение определенных методов для формирования выборки, чем знание точных размеров совокупности.

Вероятностные методы предусматривают использование простого случайного, систематического, кластерного и стратифицированного видов отбора.

При простом случайном отборе предполагается, что вероятность включения единицы в выборку известна, она одинакова абсолютно для каждой единицы совокупности и ее определяют через соотношение объема выборки и размера совокупности. Такой отбор осуществляют, формируя выборку вслепую либо с помощью таблицы случайных чисел, в которые входят числа, включенные случайным образом. Единицы совокупности получают порядковые номера, затем, начиная от любой точки, продолжают движение в произвольном направлении, постоянно меняя его. Так осуществляют выбор необходимого количества номеров из присвоенных, которое должно быть равно установленному объему выборки. Применение этого вида отбора гарантирует, что каждая единица совокупности известна и вероятность включения в выборку одинакова для всего объема выборки.

При систематическом отборе в выборку включается каждый элемент генеральной совокупности, выбранный через определенный интервал (на первом этапе возможно применение таблицы случайных чисел). Этот вид одноступенчатого отбора способен обеспечить достаточно быстрое и экономически эффективное обследование генеральной совокупности, причем в некоторых ситуациях он более репрезентативен.

Кластерный отбор основан на выделении из совокупности подгрупп, способных представить всю совокупность. Так, при исследовании мнения населения какого-либо региона об уровне оказания некоего вида услуг регион разбивают на четко определяемые части (кластеры), скажем районы. Предполагается, что все выделенные кластеры идентичны и по мнению населения этих районов можно судить о позиции населения всего региона. Затем случайным образом выбирают кластеры, выявляют совокупность, в которой проводят исследование, выводы же обобщаются и распространяются на регион в целом.

Все вероятностные методы основаны на предположении о том, что для любой совокупности характерно симметричное распределение ее ключевых свойств; т.е. любая выборка достаточно полноценно представляет совокупность в целом, а некоторые отклонения в выборке (подобная ситуация на практике встречается нечасто) взаимно уравновешиваются.

При несимметричном распределении совокупности отбору элементов выборки предшествует выделение в генеральной совокупности нескольких групп (страт), например по месту жительства, полу, возрасту и т.д. То есть в подобной ситуации следует применять метод стратифицированного отбора. Затем определяется, как распределить общий размер всей выборки по отдельным стратам. Для этого используют пропорциональные и непропорциональные выборки (значимым фактором является соотношение размера выборки из каждой страты и доли в генеральной совокупности).

Затем посредством случайного отбора формируют выборку. Объем выборки в основном устанавливают с помощью универсального метода по формуле

(3.1)

где п – численность выборки; N – объем генеральной совокупности; t – коэффициент соответствия доверительной вероятности; Δ – допустимая ошибка; у – доля исследуемого признака в генеральной совокупности.

При вероятности 0,990 значение коэффициента t = 3,0, а при вероятности 0,999–3,28. В основном при расчетах опираются на вероятность 0,954, при которой t = 2.

Дисперсия обычно определяется на основе эксперимента, пробного исследования или же по аналогам. В связи с тем что выборка возрастает в случае увеличения доли исследуемого признака в генеральной совокупности, при неизвестных значениях доли следует брать у, равный 50%.

На практике решение об объеме выборки достигается за счет компромисса между теоретическими прогнозами о точности результатов обследования и возможностями их реализации, которые в основном определяются бюджетом, выделенным на проведение опроса.

В основном размер выборки устанавливают в процентном отношении от совокупности (5–10%), что не составляет никакой сложности при исполнении, но не позволяет выяснить, насколько точны и надежны полученные результаты. К тому же, если совокупность большая, этот подход достаточно затратен.

Иногда при определении объема выборки прибегают просто к использованию предварительной договоренности. Так, известно, что при опросе 150 потенциальных покупателей ошибка составляет не более 5%, поэтому заказчиком маркетингового исследования может быть дана исследователям рекомендация придерживаться именно этого количества.

Достаточно часто как основной аргумент при определении объема выборки выступает стоимость исследования, так как заложенная в бюджете фирмы сумма на проведение маркетинговых исследований не может быть скорректирована. В этом случае объективность полученных сведений в расчет не принимают, хотя справедливости ради стоит отметить, что при вероятностном методе формирования выборки малая выборка способна дать достаточно точные результаты.

Объем выборки можно определить, обратившись к статистическому анализу. Минимальный объем выборки определяют с учетом требований к надежности и достоверности получаемой информации. Этот подход применим, если потребуется анализ результатов для отдельных подгрупп, которые формируются в составе выборки по полу, возрасту, уровню доходов, уровню образования и т.п. Требования, предъявляемые к надежности и точности результатов для отдельных подгрупп, предполагают выдвижение определенных требований к объему всей выборки. В любом случае заказчиком и исследователем должны быть рассмотрены различные объемы выборки, различные методы сбора информации, расходы, а также учтены и другие значимые факторы.