Алгоритмы формирования выборочной совокупности

Реализация выборочного метода базируется на понятиях генеральной и выборочной совокупностей.

Генеральной совокупностью называется вся исходная изучаемая статистическая совокупность, из которой на основе отбора единиц или групп единиц формируется совокупность выборочная. В каждом конкретном случае в зависимости от условий выбирают наиболее предпочтительную систему организации отбора, которая определяется видом, методом и способом отбора.

По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе – группы единиц, а комбинированный отбор предполагает сочетание группового и индивидуального отбора.

Метод отбора определяет возможность продолжения участия отобранной единицы в процедуре отбора. Бесповторным или отбором без возвращения называется такой отбор, при котором попавшая в выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор. Повторный метод отбора применяется в тех случаях, когда характер исследуемого явления предполагает возможность повторной регистрации единиц. К повторному также приравнивается отбор из совокупности, границы которой не определены. Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В мировой практике выборочных обследований наибольшее распространение получили следующие выборки:

• собственно-случайная (простая случайная);

• механическая (систематический отбор);

• типическая (расслоенная, стратифицированная);

• серийная (гнездовая);

• комбинированная;

Собственно-случайная или простая случайная выборка заключается в отборе единиц из генеральной совокупности в случайном порядке без каких-либо элементов системности. Необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку. Следует также установить четкие границы генеральной совокупности таким образом, чтобы включение или не включение в нее отдельных единиц не вызывало сомнений.

Для реализации простой случайной выборки могут применяться различные алгоритмы отбора.

Алгоритм случайной сортировки.

• каждой единице совокупности присваивается случайное число u, полученное с помощью процессора случайных чисел в интервале от 0 до 1 (полученные случайные числа должны в той или иной степени соответствовать закону равномерного распределения),

• единицы совокупности ранжируются в порядке убывания (возрастания) u;

• отбираются n первых единиц.

Недостаток: требуется относительно долгая процедура сортировки в случае большого объема N (генеральной совокупности).

Достоинства данного метода заключаются в простом алгоритме отбора единиц, а также в возможности формирования нескольких выборок без перекрытия или с контролируемым перекрытием.

Алгоритм прямой реализации.

• все единицы генеральной совокупности нумеруются от 1 до N;

• образуют n чисел в интервале от 1 до N в соответствии с законом равномерного распределения (с помощью процессора случайных чисел);

• из сформированного списка единиц генеральной совокупности отбираются единицы, по номеру соответствующие образованным числам.

Преимущество: требует только одного считывания файла (в случае ранжирования n случайных чисел).

Алгоритм метода отбора-отказа.

• последовательно образуют случайные числа u1, u2 ... в соответствии с законом равномерного распределения в интервале от 0 до 1;

• если u1 < n/N, то первая из списка единица извлекается в выборку, в противном случае – отбрасывается;

• для последующих единиц: если , то единица (k+1) извлекается, в противном случае – отбрасывается; где k - число просмотренных единиц; nk – число отобранных единиц среди первых k просмотренных единиц.

• процедура заканчивается, когда nk = n, т.е. когда выборка необходимого объема полностью сформирована.

Преимущество: является наиболее экономичным, так как при его реализации происходит только одно считывание файла без каких-либо предварительных сортировок единиц генеральной совокупности или случайных чисел.

После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки. Средняя ошибка собственно-случайной выборки определяется по формуле

- повторная, - бесповторная (уменьшится и предельная ошибка выборки, что вызовет сужение границ генеральной средней)

Механическая выборка (систематический отбор) применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определенная последовательность в расположении единиц.

Для проведения механической выборки устанавливается пропорция отбора, которая определяется соотнесением объемов выборочной и генеральной совокупностей.

Генеральную совокупность при механическом отборе целесообразно ранжировать или упорядочить по величине изучаемого или коррелирующего с ним признака, что позволит повысить репрезентативность выборки. Целесообразно отбор начинать с середины первого интервала. Недостаток: В связи с трудоемкостью предварительной сортировки, данный способ отбора не имеет большого распространения в практике статистических работ.

Для определения средней ошибки механической выборки используется формула средней ошибки при собственно-случайном бесповторном отборе.

Типический отбор или стратифицированный отбор используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько типических групп. Типический отбор предполагает выборку единиц из каждой типической группы собственно-случайным или механическим способом. Типизация генеральной совокупности позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки, которая в этом случае определяется только внутригрупповой вариацией.

Преимущество: позволяет учесть региональные и отраслевые классификации субъектов финансово-хозяйственной деятельности.

Отбор единиц в типическую выборку может быть организован либо пропорционально объему типических групп, либо пропорционально внутригрупповой дифференциации признака (оптимальное размещение Чупрова - Неймана).

При выборке, пропорциональной объему типических групп, число единиц, подлежащих отбору из каждой группы:

, где Ni – объем i-й группы; ni – объем выборки из i-й группы.

Средняя ошибка такой выборки находится по формулам:

- повторный отбор, - бесповторный отбор

– средняя из внутригрупповых дисперсий.

При выборке, пропорциональной дифференциации признака, число наблюдений по каждой группе рассчитывается по формуле

где – среднее квадратическое отклонение признака в i-й группе.

Средняя ошибка такого отбора определяется следующим образом:

- повторный отбор, - бесповторный отбор

Отбор, пропорциональный дифференциации признака, дает лучшие результаты, однако на практике его применение затруднено вследствие трудности получения сведений о вариации до проведения выборочного наблюдения.

Серийный отбор или гнездовой способ отбора удобен в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. Сущность серийной выборки заключается в собственно-случайном либо механическом отборе серий, внутри которых производится сплошное обследование единиц.

Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка серийной выборки (при отборе равновеликих серий) зависит от величины только межгрупповой (межсерийной) дисперсии и определяется по следующим формулам:

(повторный отбор) (бесповторный отбор)

r – число отобранных серий; R – общее число серий.

Межгрупповая дисперсия: , где – средняя i-й серии; – общая средняя по всей выборочной совокупности.

Основное применение серийного отбора – технологическая статистика и контроль качества продукции (упаковки готовой продукции, упаковки товара и т.п.).

В практике статистических обследований помимо рассмотренных выше способов отбора применяется и их комбинация. Так, например, можно комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп.

Многоступенчатым называется отбор, при котором из генеральной совокупности сначала извлекаются укрупненные группы, потом – более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.

В отличии от многоступенчатой, многофазная выборка предполагает сохранение одной и той же единицы отбора на всех этапах его проведения, при этом отобранные на каждой стадии единицы подвергаются обследованию (на каждой последующей стадии отбора программа обследования расширяется).

содержание