Распространение выборочных данных на генеральную совокупность

Выборка или выборочная совокупность - это множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

В процессе проведения выборочного наблюдения требуется решить целый ряд вопросов практического характера. Такими вопросами являются определение способа отбора, вычисление ошибок выборки и построение доверительных интервалов выборочных характеристик, а также расчет необходимого объема выборки.

Расчет ошибок выборки позволяет решить одну из главных проблем организации выборочного наблюдения- оценить репрезентативность (представительность) выборочной совокупности. Различают среднюю и предельную ошибки выборки. Эти два вида ошибок связаны следующим соотношением:

∆=µt,

где ∆ - предельная ошибка выборки;

µ- средняя ошибка выборки;

t - коэффициент доверия, определяемый в зависимости от уровня вероятности .

Величина средней ошибки выборки в свою очередь рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки (см. Таблица 6).

Таблица 6 - Формулы расчета средней ошибки выборки для собственно-случайной и механической выборки

Метод Повторным Бесповторный
отбора для средней для доли для средней     для доли
Формула  
       


Используется несколько подходов к определению объема выборки. Первый из них называется произвольным подходом и основан он на применении «правила большого пальца». Например, бездоказательно принимается, что для получения точных результатов выборка должна составлять 5 % от совокупности. Данный подход простой и доступный в исполнении, не позволяет получать точные результаты. Его достоинством является относительная дешевизна затрат.

В соответствии со вторым подходом объем выборки может быть установлен исходя из заранее оговоренных условий. Заказчик маркетингового исследования, например, знает, что при изучении общественного мнения выборка обычно составляет 1000 - 1200 человек, поэтому он рекомендует исследователю придерживаться данной цифры.

Третий подход означает, что в некоторых случаях главным аргументом при определении объема выборки может быть стоимость проведения опроса. Хотя при этом ценность и достоверность получаемой информации не принимается в расчет.

В случае четвертого подхода объем выборки определяется на основе статистического анализа. Данный подход предполагает определение минимального объема выборки с учетом требований к надежности и достоверности получаемых результатов.

Так, в случае проведения случайной бесповторной выборки численность необходимой выборки определяется по формуле:

n=

где n- число единиц, которые следует отобрать для обследования;

t - коэффициент доверия ( вычисляется по специальным таблицам в зависимости от вероятности с которой можно гарантировать, что предельная ошибка не превысит t- кратную среднюю ошибку (чаще всего опираются на вероятность 0,954, при которой t составляет 2);

2- выборочная дисперсия (определяют на основе эксперимента, пробного обследования или по аналогам);

∆- предельная (задаваемая) ошибка выборки;

N - численность генеральной совокупности.

Пятый подход считается наиболее теоретически обоснованным и правильным подходом в определении объема выборки. Он основан на расчете доверительного интервала.

Доверительный интервал - это диапазон, крайние точки которого характеризуют процент определенных ответов на какой-то вопрос. Данное понятие тесто связано с понятием «среднее квадратичное отклонение получаемого признака в генеральной совокупности». Чем оно больше, тем шире должен быть доверительный интервал, чтобы включить в свой состав, например 9,5 % ответов.

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе данных, полученных по выборке. При этом исходят из того, что все средние и относительные показатели, полученные по выборке, являются несмещенными и эффективными характеристиками генеральной совокупности.

Понятно, что стоимость выборки сильно зависит от суммы, которую заказчик готов выделить, и мало зависит от исследователей. Хотя если требуется увеличить точность вдвое, выборку придется увеличить не в 2 раза, а в 4. Например, чтобы сделать в 2 раза более точную оценку данных полученных путем опроса 300 человек, потребуется опросить не 600 человек, а 1200 человек.

Основными методами распространения выборочного наблюдения на генеральную совокупность являются прямой пересчет и способ коэффициентов.

Прямой пересчет есть произведение среднего значения признака на объем генеральной совокупности. Однако большое число факторов не позволяет в полной мере использовать точечную оценку прямого пересчета при распространении результатов выборки на генеральную совокупность. На практике чаще пользуются интервальной оценкой, которая дает возможность учитывать размер предельной ошибки выборки, которая рассчитана для средней или для доли признака.

Способ коэффициентов используется в тех случаях, когда выборочное наблюдение проводится для проверки и уточнения данных сплошного наблюдения. Если нужно уточнить данные сплошного наблюдения при осуществлении контроля за выборочными исследованиями, необходимо определить поправку на недоучет. Метод расчета этой поправки широко применяется при исследовании небольших совокупностей, когда можно рассчитать коэффициент недоучета по каждой категории работников и, уточнив данные, распространить результаты на всю совокупность. При этом рекомендуется использовать формулу

где - численность совокупности с поправкой на недоучет;

Y0 - численность совокупности без этой поправки;

у0 - численность совокупности в контрольных точках по первоначальным данным;

y1 - численность совокупности в тех же точках по данным контрольных мероприятий.

Например, если выборочное наблюдение показало, что недоучет величины исследуемого явления составил 5%, то это значение распространяют на сплошное наблюдение, умножая его результат на поправочный коэффициент 1,05.

Покажем практическое применение рассмотренной методики на следующем примере.

Пример 1. В 100 туристических агентствах города предполагается провести обследование среднемесячного количества реализованных путевок методом механического отбора. Необходимо определить, какова должна быть численность выборки, чтобы с вероятностью 0,683 ошибка не превышала 3 путевок, если по данным пробного исследования дисперсия составляет 225.

Решение

Рассчитаем необходимый объем выборки по формуле:

=20 агентств.

В целях ускорения процесса исследования и удешевления сбора материалов целесообразно использовать методы малой выборки. Малой выборкой считается отбор единиц численностью менее 20.

Средняя ошибка малой выборки определяется по формуле:

где Mb2 -дисперсия в малой выборке;

В малой выборке значения коэффициента доверия 1зависят не только от вероятности, но и от объема выборки (табл. 7)

Таблица 7 - Значения коэффициента доверия при малой выборке

n
t
1,0 0,626 0,644 0,656 0,662 0,666 0,668 0.670
1,5 0,792 0,816 0,832 0,838 0,846 0,848 0,850
2,0 0,884 0,908 0,924 0,930 0,936 0,938 0,940
2.5 0,933 0,953 0,966 0,970 0,975 0,977 0,0978
3,0 0,960 0,976 0,984 0,988 0,991 0,992 0,992

Предельная ошибка выборки определяется по следующей формуле:

∆=t,

где t- нормированное отклонение или коэффициент доверия.

Организация сбора данных

Существует три альтернативных подхода к сбору данных:

1.Осуществлять сбор самостоятельно;

2.Осуществлять сбор путем создания специальной группы;

3.Осуществлять сбор путем привлечения коммерческих компаний, специализирующихся на сборе данных.

В первом случае сотрудники маркетинговой службы организации своими силами осуществляют сбор данных, скажем, путем интервьюирования. Очевидно, что такая организация должна обладать достаточно развернутым штатом сотрудников. Однако и в этом случае весьма проблематично проведение сбора данных в широком, например национальном, масштабе.

Специальная группа обычно комплектуется за счет специалистов не очень высокой квалификации, например, студентов для проведения телефонного или персонального интервьюирования. В этом случае с интервьюерами необходимо провести несколько тренировочных занятий. Необходимы контроль за качеством собираемой информации, мотивация труда интервьюеров.

Маркетинговая информация классифицируется по целому ряду оснований. Основания для классификации, выделяемые в соответствии с ними виды маркетинговой информации и их характеристика представлены в таблице 8.

Критерий классификации Вид маркетинговой информации Характеристика  
1)по охвату внешняя Предоставляет возможность изучать данные о развитии внешней среды предприятия, организации, поведении посредников, поставщиков, продавцов, действиях конкурентов и т.д  
внутренняя Раскрывает внутреннее состояние предприятия, содержит данные о материальных и финансовых запасах, производительности труда, капиталовложениях, расходах, доходах и т.д  
2)По способу получения первичная Собирается непосредственно маркетологом; для ее получения прибегают к наблюдению, эксперементу, панели, опросу  
вторичная Ранее собранные данные из различных источников  
3)По характеру возникновения постоянная Отражает постоянные, длительное время неизменные величины маркетинговых интересов  
переменная Содержит фактические количественные и качественные характеристики функционирования субъектов рынка  
эпизодическая Определяется, формируется и предоставляется по мере необходимости  
4)По назначению справочная Предназначена для ознакомительного, вспомогательного использования, отражает относительно стабильные признаки  
рекомендательная Содержит прогнозы реализации товарной продукции, приоритеты выбора целевых рынков, поставщиков, посредников, торговцев  
нормативная Включает нормативные законодательные акты, нормы и нормативы элементов производства, обращения и др.  
сигнальная Позволяет в ходе возникновения фактического состояния объектов маркетинговых интересов в отличие от запланированного состояния  
5)По формам текстовая Формируется в разрезе определенной тематики; наименее формализованный вариант представления данных
предоставления табличная Связана с манипулированием данными столбцов, строк, отдельных граф и клеток
графическая Представляет собой графическое изображение явлений, процессов, отдельных данных, отражает зависимости между факторами, выявляет сложившиеся закономерности, раскрывает динамику рыночного процесса и отдельных его составляющих
Числовая Показывает количественные значения, которые при исследовании подаются в динамических рядах, отражает тенденции изучаемого процесса, явления, изменения, значений этих показателей
         

Контрольные вопросы

1.Что такое выборка в маркетинговом исследовании?

2.Какие статистические параметры характеризуют выборку?

3.Как рассчитать объём простой случайной выборки?

4.Какие методы формирования выборки используются в маркетинговых исследованиях?

5.Как рассчитать выборку владельцев сотовых телефонов для всей России?

Практические задания

1.Пусть существует популяция (генеральная совокупность) из 1507 элементов. Необходимо спроектировать выборку численностью 150 элементов, использую при этом два смежных столбца в таблице случайных чисел: цифры, стоящие в двух смежных ячейках, будут образовывать четырехзначное число.

Таблица 9 -Таблица случайных чисел

 

2. Партия роз (80000 шт.), поступивших из Голландии, была подвергнута выбраковке. Для этого было обследовано 800 роз, отобранных механическим способом. Среди обследованных роз обнаружено 160 бракованных. Определите с вероятностью 0,997 возможный размер убытка от некачественной транспортировки, если цена приобретения розы 10 руб.

Приложение.

Таблица 10 - Значения коэффициент доверия t, определяемого в зависимости от уровня вероятности

Значения t 1,5 2,5 3,5
Значения F(t) 0,683 0,866 0,954 0,988 0,997 0,999

 

ГЛАВА 7.