Понятие выборочного наблюдения

Выборочный метод используется, когда применение сплошного на­блюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно. Физическая невозможность имеет ме­сто, например, при изучении пассажиропотоков, рыночных цен, семей­ных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением. Например, де­густация, испытание кирпичей на прочность и т.п. Выборочное наблю­дение используется также для проверки результатов сплошного.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весьих массив - генеральную совокупность (ГС). При этом число единиц в выборке обозначают п, во всей ГС – N. Отношение n/N называется относительный размер или доля выборки.

Качество результатов выборочного наблюдения зависит от репре­зентативности выборки, т.е. от того, насколько она представительна в ГС. Для обеспечения репрезентативности вы­борки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая..

Способы формирования выборки

1. Собственно случайный отбор: все единицы ГС нумеруются, а выпавшие в результате жеребьевки номера соответствуют единицам, попавшим в выборку, причем число номеров равно запланированному объему выборки. На практике вместо жеребьевки используют генераторы случайных чисел. Данный способ отбора может быть повторным (когда каждая единица, отобранная в выборку, после проведения наблюдения возвращается в ГС и может быть вновь подвергнута обследованию) и бесповторным (когда обследованные единицы в ГС не возвращаются и не могут быть обследованы повторно). При повторном отборе вероятность попадания в выборку для каждой единицы ГС остается неизменной, а при бесповторном отборе она меняется (увеличивается), но для оставшихся в ГС после отбора из нее нескольких единиц, вероятность попадания в выборку одинакова.

2. Механический отбор: отбираются единицы генеральной совокупности с постоянным шагом N/п. Так, если она генеральная совокупность содержит 100 тыс.ед., а требуется выбрать 1 тыс.ед., то в выборку попадет каждая сотая единица.

3. Стратифицированный (расслоенным) отбор осуществляется из неоднородной генеральной совокупности, когда ее предварительно разбивают на однородные группы, после чего производят отбор единиц из каждой группы в выборочную совокупность случайный или механическим способом пропорционально их численности в генеральной совокупности.

4. Серий­ный (гнездовой)отбор: случайным или механическим способом вы­бирают не отдельные единицы, а определенные серии (гнезда), внутри которых производится сплошное наблюдение.

Средняя ошибка выборки

После завершения отбора необходимого числа единиц в выборку и регистрации предусмотренных программой наблюдения изучаемых признаков этих единиц, переходят к расчету обобщающих показателей. К ним относят среднюю величину изучаемого признака и долю единиц, обладающих каким-либо значением этого признака. Однако, если ГС произвести несколько выборок, определив при этом их обобщающие характеристики, то можно установить, что их значения будут различными, кроме того, они будут отличаться и от реального их значения в ГС, если такое определить с помощью сплошного наблюдения. Другими словами, обобщающие характеристики, рассчитанные по данным выборки, будут отличаться от их реальных значений в ГС, поэтому введем следующие условные обозначения (табл. 23).

Таблица 23. Условные обозначения

Показатель Совокупность
генеральная выборочная
Число единиц совокупности N n
Среднее значение
Доля единиц, обладающих каким-либо значением признака d
Доля единиц, не обладающих каким-либо значением признака 1-d 1-
Дисперсия

Разность между значением обобщающих характеристик выборочной и генеральной совокупностей называется ошибкой выборки, которая подразделяется на ошибку регистрации и ошибку репрезентативности. Первая возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательно­сти регистратора при заполнении анкет, формуляров и т.п. Она доста­точно легко обнаруживается и устраняется. Вторая возни­кает из-за несоблюдения принципа слу­чайности отбора единиц в выборку. Ее сложнее обнаружить и устранить, она гораздо боль­ше первой и потому ее измерение является основной задачей выборочного наблюдения.

Для измерения ошибки выборки определяется ее средняя ошибка по формуле (65) для повторного отбора и по формуле (66) – для бесповторного:

= ;(65) = . (66)

Из формул (65) и (66) видно, что средняя ошибка меньше у бес­повторной выборки, что и обусловливает ее более широкое применение.

Предельная ошибка выборки

Учитывая, что на основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. В конкретной выборке разность может быть больше, меньше или равна . Каждое из отклонений от имеет определенную вероятность. При выборочном обследовании реальное значение в ГС неизвестно. Зная среднюю ошибку выборки, с определенной вероятностью можно оценить отклонение выборочной средней от генеральной и установить пределы, в которых находится изучаемый параметр (в данном случае среднее значение) в генеральной совокупности. Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки . Она определяется в долях средней ошибки с заданной вероятностью, т.е.

= t ,(67)

где tкоэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.

Вероятность появления определенной ошибки выборки находят с помощью теорем теории вероятностей. Согласно теореме Чебышёва, при достаточно большом объеме выборки и ограниченной дисперсии генеральной ГС вероятность того, что разность между выборочной средней и генеральной средней будет сколь угодно мала, близка к единице:

при . (68)

А. М. Ляпунов доказал, что независимо от характера распределения генеральной ГС при увеличении объема выборки распределение вероятностей появления того или иного значения выборочной средней приближается к нормальному распределению (центральная предельная теорема). Следовательно, вероятность отклонения выборочной средней от генеральной средней, т.е. вероятность появления заданной предельной ошибки, также подчиняется указанному закону и может быть найдена как функция от t с помощью интеграла вероятностей Лапласа:

, (69)

где – нормированное отклонение выборочной средней от генеральной средней.

Значения P (интеграла Лапласа) для разных t рассчитаны и име­ются в специальной таблице, которая приведена в Приложении 1.

Вероятность, которая принимается при расчете выборочной характеристики, называется доверительной. Чаще всего принимают вероятность P = 0,950, которая означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы. Задавшись конкретным уровнем вероятности, выбирают величину нормированного отклонения t по Приложению 1 и рассчитывают предельную ошибку выбор­ки по формуле (67).

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики ГС совокупности по формуле (70) – для среднего значения, и по формуле (71) – для доли единиц, обладающих каким-либо значением признака:

или ( ) ( + )(70)

или ( ) d ( + ) (71)

Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики ГС, а лишь ее доверительный интервал с заданным уровнем вероятно­сти. И это серьезный недостаток выборочного метода статистики.