РЕПРЕЗЕНТАТИВНОСТЬ

Репрезентативность выборки означает, что с некоторой наперед заданной или вычисленной на фактической выборке погрешностью установленное на выборочной совокупности можно отождествить с генеральной совокупностью или, если использовать язык статистики, найти оценки параметров генераль­ной совокупности. Во-первых, каждая единица генеральной совокупности

Голубков Е.П. Маркетинговое исследование // Маркетинг в России и за рубежом. 2001. № 1.

должна иметь равную вероятность попасть в выборку. Во-вторых, во избежа­ние направленного отбора выбор единиц генеральной совокупности нужно производить независимо от изучаемого признака. В-третьих, отбор должен производиться по возможности из однородных совокупностей. В-четвертых, число единиц генеральной совокупности, отобранных для обследования, дол­жно быть достаточно большим.

Процесс непосредственного определения репрезентативности выборки складывается из этапов: сопоставление средних показателей распределений выборочной и генеральной совокупностей; сопоставление форм распределе­ния этих показателей. Средний показатель распределения обычно берется как средняя арифметическая или средневзвешенная арифметическая этого рас­пределения.

В случае изучения совокупностей с альтернативными признаками вмес­то средней арифметической вычисляется доля единиц, обладающих рассмат­риваемой характеристикой, относительно всей совокупности. Если обозна­чить объем совокупности символом N, а явление с данным признаком — М, то Р—доля явлений с этим признаком определяется:

i> + Q = l(100%)

l-P = Q,

где Q — доля явлений с альтернативным признаком.

Пользоваться выводами, полученными на основании исследования выбороч­ной совокупности, можно в том случае, если разность между средними ариф­метическими (или средними долями) признаков выборочной и генеральной совокупностей стремится к нулю. Предполагается, что это требование удовлет­воряется при выполнении четырех условий, оговоренных выше. Правда, зная только выборочные средние показатели, нельзя дать точные оценки их разно­сти, так как неизвестны средние показатели генеральной совокупности. Кроме того, сами значения выборочных средних могут колебаться в зависимости от того, какие единицы генеральной совокупности попадут в выборку. Поэтому оценка репрезентативности выборочной совокупности по средним показателям ее распределения сводится к поиску ошибки репрезентативности.

Сравнение выборочной и генеральной совокупностей по средним пока­зателям не дает полного представления о генеральной совокупности. Так, в двух совокупностях с одинаковыми средними показателями расхождения между максимальным и минимальным значением признака, определяющие форму его распределения, могут быть различны. Если представить такое распределение графически, то оно образует симметричную колоколообраз-ную (нормальную) кривую, отражающую тот факт, что сумма многих неза­висимых произвольно распределенных случайных переменных приближен­но распределяется по нормальному закону. Ордината у, которая определяет высоту кривой для каждой точки х, представляет собой плотность вероятно­сти для значения хг

Максимум плотности вероятности приходится на среднее значение пере­менной и равен единице. Это означает, что чем меньше случайное значение переменной отличается от ее среднего значения, тем больше вероятность его

проявления. И наоборот, чем больше отклонение значений переменной от ее средней величины, тем вероятность их появления меньше. Таким обра­зом, значения отклонений от средних величин, т.е. значения вида jc;- х, не­сут информацию о вариации изучаемых переменных. Если бы все значения признака были одинаковы и совпадали с его средней величиной, то совокуп­ность значения этого признака была бы предельно однородной.

Обычно число положительных отклонений от среднего арифметическо­го значения совокупности примерно равно числу отрицательных отклонений, т.е. сумма всех отклонений неизбежно стремится к нулевому значению. По­этому, если бы потребовалось просуммировать все отклонения признака в совокупности, эта сумма всегда была бы равна нулю:

Во избежание этого каждое отклонение возводят в квадрат и находят сумму квадратов — дисперсию.

Нормальное распределение в полной мере характеризуется парамет­рами: х — среднее значение признака и а — среднее квадратичное (стандарт­ное) отклонение. Среднее jc определяет положение распределения относи­тельно оси х; стандартное отклонение показывает форму кривой; чем боль­ше значение о, тем шире кривая и тем ниже ее максимум.

Площадь под нормальной кривой располагается таким образом, что в границах находится 68% всего распределения признака, в границах

— 95,5, в пределах — 99,7%. Вероятность того, что разность

между случайной переменной, распределенной примерно по нормальному закону, и ее средним значением по абсолютной величине превосходит За. меньше 0,3%. Отсюда следует, что практически со стопроцентной точностью можно утверждать:

Оценка репрезентативной выборочной совокупности по форме распреде­ления показателей представляет собой сравнение мер вариации этих пока­зателей в выборочной и генеральной совокупностях. Дисперсия генеральной совокупности известна далеко не всегда, однако в математической статис­тике доказано, что между генеральной и выборочной дисперсиями существу­ет соотношение вида:

где п — объем выборки.

Проблема репрезентативности выборки имеет важное значение как про­блема правомерности экстраполяции выводов, полученных при анализе выборочной совокупности, на всю генеральную совокупность12.

Подробнее см.: Методическое пособие социолога-практика (Словарь-справочник) / Под ред. ДА. Шев ченко, А.И. Кравченко. М., 1990.