Способы формирования выборочной совокупности

Под выборочным наблюдениемпонимается такое несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные специальным способом. Выборочное наблюдение ставит перед собой задачу: по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.

При этом методе обследованию подвергаются не все объекты совокупности. Совокупность единиц, из которой производится отбор, называется генеральной совокупностью, а специальным образом отобранная часть из генеральной совокупности называется выборочной совокупностью, она отражает все свойства генеральной.

Основные характеристики параметров генеральной и выборочной совокупности приведены в табл. 7.1.

Таблица 7.1

№ п/п Характеристики Генеральная совокупность Выборочная совокупность
Объем совокупности (численность единиц) N n
Численность единиц, обладающих обследуемым признаком М m
Доля единиц, обладающих обследуемым признаком P = M/N W = m/n
  Средний размер признака
Дисперсия количественного признака
Дисперсия доли

 

Как правило, выборочные характеристики отклоняются от характеристик генеральной совокупности, т. е. обычно имеют место ошибки репрезентативности, разность между средними и относительными показателями выборочной и генеральной совокупностями. Основная задача выборочного метода сводится к минимизации ошибок репрезентативности.

Главные условия выборки:

1. Равновозможность каждой единицы генеральной совокупности попасть в выборку.

Если из совокупности, состоящей из N единиц, обладающих некоторыми признаками, отбирается одна единица, и при этом никакой из единиц, составляющих данную совокупность, не отдается предпочтение по сравнению с другими, то говорят, что каждой единице обеспечена равная возможность быть отобранной (принцип равновозможности). О равновозможности отбора можно судить либо исходя из общих свойств изучаемых явлений, либо по числу появления событий в достаточно большой серии испытаний.

В случае соблюдения принципа равновозможности выбор вполне определенной конкретной единицы имеет один шанс (случай) из числа N таких же шансов. Выбор же единицы, обладающей данным значением признака (например, первосортные детали, число которых во всей совокупности М), имеет М равновозможных шансов из N таких же шансов.

2. Достаточная численность выборки. Для обеспечения равновозможности единиц генеральной совокупности попасть в выборку применяются следующие виды, методы и способы отбора.

По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе – группы единиц, а комбинированный отбор предполагает сочетание группового и индивидуального отбора.

Отбор единиц из совокупности, при котором каждая отобранная и обследованная единица возвращается в генеральную совокупность и может быть повторно отобрана, называется повторным методом. Если же после отбора обследованная единица не возвращается в совокупность и в дальнейших испытаниях не участвует, то отбор называют бесповторным методом.

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие выборки:

1) собственно-случайная выборка;

2) механическая выборка;

3) типическая выборка;

4) серийная выборка;

5) комбинированная выборка [1, 3–7].

Ошибки выборки

Расхождения между величиной какого-либо показателя, найденного посредством статистического наблюдения, и действительными его размерами называются ошибками наблюдения. В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают в результате неправильного установления фактов или ошибочной записи в процессе наблюдения или опроса. Они бывают случайными или систематическими. Случайные ошибки регистрации могут быть допущены как опрашиваемыми в их ответах, так и регистраторами. Систематические ошибки могут быть и преднамеренными, и непреднамеренными. Преднамеренные – сознательные, тенденциозные искажения действительного положения дела. Непреднамеренные вызываются различными случайными причинами (небрежность, невнимательность).

Ошибки репрезентативности (представительности) возникают в результате неполного обследования и в случае, если обследуемая совокупность недостаточно полно воспроизводит генеральную совокупность. Они могут быть случайными и систематическими. Случайные ошибки репрезентативности – это отклонения, возникающие при несплошном наблюдении из-за того, что совокупность отобранных единиц наблюдения (выборка) неполно воспроизводит всю совокупность в целом. Систематические ошибки репрезентативности – это отклонения, возникающие вследствие нарушения принципов случайного отбора единиц. Ошибки репрезентативности органически присущи выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Избежать ошибок репрезентативности нельзя, однако, пользуясь методами теории вероятностей, основанными на использовании предельных теорем закона больших чисел, эти ошибки можно свести к минимальным значениям, границы которых устанавливаются с достаточно большой точностью.

Ошибки выборки – разность между характеристиками выборочной и генеральной совокупности. Для среднего значения ошибка будет определяться по формуле

(7.1)

где

Величина называется предельной ошибкой выборки.

Предельная ошибка выборки – величина случайная. Исследованию закономерностей случайных ошибок выборки посвящены предельные теоремы закона больших чисел. Наиболее полно эти закономерности раскрыты в теоремах П.Л. Чебышева и А.М. Ляпунова.

Теорему П.Л. Чебышеваприменительно к рассматриваемому методу можно сформулировать следующим образом: при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице (т. е. почти с достоверностью), утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым. В теореме П.Л. Чебышева доказано, что величина ошибки не должна превышать . В свою очередь величина , выражающая среднее квадратическое отклонение выборочной средней от генеральной средней, зависит от колеблемости признака в генеральной совокупности и числа отобранных единиц n. Эта зависимость выражается формулой

, (7.2)

где также зависит от способа производства выборки.

Величину = называют средней ошибкой выборки.В этом выражении – генеральная дисперсия, n – объем выборочной совокупности.

Рассмотрим, как влияет на величину средней ошибки число отбираемых единиц n. Логически нетрудно убедиться, что при отборе большого числа единиц расхождение между средними будет меньше, т. е. существует обратная связь между средней ошибкой выборки и числом отобранных единиц. При этом здесь образуется не просто обратная математическая зависимость, а такая зависимость, которая показывает, что квадрат расхождения между средними обратно пропорционален числу отобранных единиц.

Увеличение колеблемости признака влечет за собой увеличение среднего квадратического отклонения, а следовательно и ошибки. Если предположить, что все единицы будут иметь одинаковую величину признака, то среднее квадратическое отклонение станет равно нулю и ошибка выборки также исчезнет. Тогда нет необходимости применять выборку. Однако следует иметь в виду, что величина колеблемости признака в генеральной совокупности не известна, поскольку не известны размеры единиц в ней. Можно рассчитать лишь колеблемость признака в выборочной совокупности. Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой:

Поскольку величина при достаточно больших n близка к 1, можно приближенно считать, что выборочная дисперсия равна генеральной дисперсии, т. е.

Следовательно, средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Однако о величине этой ошибки можно судить с определенной вероятностью. На величину вероятности указывает множитель

Теорема А.М. Ляпунова. А.М. Ляпунов доказал, что распределение выборочных средних (следовательно и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.

Математически теорему Ляпунова можно записать так:

(7.3)

, (7.4)

где – математическая постоянная;

предельная ошибка выборки, которая дает возможность выяснить, в каких пределах находится величина генеральной средней.

Значения этого интеграла для различных значений коэффициента доверия t вычислены и приводятся в специальных математических таблицах. В частности, при:

Поскольку t указывает на вероятность расхождения , т. е. на вероятность того, на какую величину генеральная средняя будет отличаться от выборочной средней, то это может быть прочитано так: с вероятностью 0,683 можно утверждать, что разность между выборочной и генеральной средней не превышает одной величины средней ошибки выборки. Другими словами, в 68,3 % случаев ошибка репрезентативности не выйдет за пределы С вероятностью 0,954 можно утверждать, что ошибка репрезентативности не превышает (т. е. в 95 % случаев). С вероятностью 0,997, т. е. довольно близкой к единице, можно ожидать, что разность между выборочной и генеральной средней не превзойдет трехкратной средней ошибки выборки и т. д.

Логически связь здесь выглядит довольно ясно: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о ее величине.

Зная выборочную среднюю величину признака и предельную ошибку выборки , можно определить границы (пределы), в которых заключена генеральная средняя:

(7.5)