Выборочная совокупность— это совокупность отобранных в определенном порядке единиц, по которым собирается информация, а ее показатели – выборочными.

ТЕМА 8.

ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ В СТАТИСТИКЕ

1. Понятие выборочного наблюдения. Статистическое наблюдение можно организовать как сплошное и несплошное. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности явлений, несплошное — лишь ее часть. К несплошному наблюдению относится и выборочное наблюдение.

Выборочное наблюдение— это такое несплошное наблюдение, при котором статистическому наблюдению подвергаются не все единицы изучаемой совокупности, а лишь отобранные в определенном порядке.

Цель выборочного наблюдения состоит в том, чтобы по характеристикам отобранной части единиц получить обобщающие характеристики изучаемой совокупности.

Основные причины, по которым во многих случаях выборочному наблюдению отдается предпочтение перед сплошным наблюдением, следующие:

· достижение большей точности результатов обследования благодаря сокращению числа ошибок регистрации (за счет работы более квалифицированных участников);

· экономия трудовых и денежных средств и времени в результате уменьшения объема работы;

· возможность детального обследования каждой единицы наблюдения за счет расширение программы наблюдения;

· сведение к минимуму уничтожения и приведения в негодность обследуемых единиц совокупности;

· уточнение результатов сплошного наблюдения;

· использование в тех случаях, когда проведение сплошного наблюдения методологически невозможно. Например, при статистических исследованиях качества продукции либо когда исследуемая совокупность объектов велика и нет возможности обследовать каждую единицу ( при маркетинговых обследованиях покупателей, изучении пассажиропотоков и т.д.).

Преимущества выборочного наблюдения по сравнению со сплошным можно обеспечить, если оно организовано и проведено в строгом соответствии с научными принципами выборочного наблюдения, которые состоят в обеспечении:

· случайности отбора единиц (при отборе каждой из единиц изучаемой совокупности обеспечивается равная возможность попасть в выборку). Положенный в основу выборочного метода принцип случайности позволяет математически обосновать дальнейшее распространение выборочных характеристик на всю совокупность;

· достаточного числа отобранных единиц совокупности.

Соблюдение этих принципов позволяет получить такую совокупность единиц, которая по интересующим исследователя признакам представляет всю изучаемую совокупность, т.е. является репрезентативной(представительной).

Выборочный метод имеет ряд недостатков:

· полученные данные всегда содержат в себе ошибку, о результатах наблюдения можно судить лишь с определенной степенью достоверности. Но по сравнению с другими видами наблюдения это достоинство выборочного метода.

· для его проведения требуются квалифицированные кадры, что в свою очередь ведет к увеличению стоимости обследования.

Генеральная и выборочная совокупности, их обобщающие характеристики. Генеральная совокупность— это совокупность, из которой производится отбор единиц совокупности, все обобщающие показатели совокупности – генеральными.

Выборочная совокупность— это совокупность отобранных в определенном порядке единиц, по которым собирается информация, а ее показатели – выборочными.

Используемые обозначения:

– объем генеральной совокупности (число входящих в нее единиц);

– объем выборочной совокупности (число единиц, попавших в выборку);

– генеральная средняя (среднее значение признака в генеральной совокупности);

– выборочная средняя (среднее значение признака в выборочной совокупности);

– генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности);

– выборочная доля (доля единиц, обладающих данным признаком в выборочной совокупности);

– генеральная дисперсия (дисперсия признака в генеральной совокупности);

– выборочная дисперсия (дисперсия признака в выборочной совокупности);

– среднее квадратическое отклонение признака в генеральной совокупности;

– среднее квадратическое отклонение признака в выборочной совокупности.

Доля выборки— это отношение численности выборочной совокупности к численности генеральной совокупности. Доля выборки определяется по формуле

где – численность единиц генеральной совокупности; – численность единиц выборочной совокупности.

Если исследуется количественный признак, то непосредственная задача выборочного наблюдения – это оценка среднего и суммарного значения признака. Генеральная средняя— среднее значение признака всей совокупности, которое определяется по формуле

Выборочная средняя— среднее значение признака у единиц, которые подверглись выборочному наблюдению:

Дисперсия количественного признака в генеральной совокупностиопределяется по формуле

Генеральная дисперсия по большей части в ходе исследования остается неизвестной. В математической статистике доказано, что соотношение между генеральной и выборочной дисперсиями определяется равенством

Так как при достаточно больших n – величина, близкая к единице, то можно принять, что . Поэтому на практике используют выборочную дисперсию в качестве оценки генеральной дисперсии.

Дисперсия количественного признака в выборочной совокупностивычисляется по формуле

Наряду с нахождением характеристик количественных признаков могут оцениваться характеристики альтернативных показателей.

Генеральная доля– это доля единиц, обладающих тем или иным признаком в генеральной совокупности. Формула расчета генеральной средней:

где – численность единиц, обладающих определенным признаком в генеральной совокупности.

Выборочная доля, или частость– доля единиц, обладающих тем или иным признаком в выборочной совокупности:

где – численность единиц, обладающих определенным признаком в выборочной совокупности.

Для расчета дисперсии доли признака в генеральной совокупностиприменяется формула

где – доля единиц, не обладающих исследуемым признаком .

Дисперсия доли признака в выборочной совокупностиопределяется по формуле

Основной целью статистического наблюдения является получение достоверной статистической информации. Но при любом способе наблюдения могут возникнуть погрешности, которые приведут к снижению качества получаемой информации. При проведении выборочного наблюдения нельзя даже теоретически получить абсолютно точные данные, как при сплошном обследовании. Обусловлено это тем, что наблюдению подвергается не вся совокупность, а только ее часть. В связи с этим при проведении выборочного наблюдения неизбежна некоторая свойственная ему погрешность (ошибки). Ошибки, присущие выборочному наблюдению, называются ошибками репрезентативности.Они возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную.

Ошибка репрезентативности— это расхождение между выборочной характеристикой и характеристикой генеральной совокупности.

Существуют два вида ошибок репрезентативности: систематические и случайные.

Систематические ошибкиимеют место в том случае, когда нарушен принцип случайности отбора и в выборку попали единицы, обладающие какими–либо свойствами, не характерными для всех единиц генеральной совокупности.

Случайные ошибки обусловлены тем обстоятельством, что даже при тщательной организации выборка не может в точности воспроизвести генеральную совокупность. В отличие от ошибок систематических случайные ошибки исключить невозможно, но их можно свести к минимуму и они могут быть оценены с достаточной степенью точности на основании закона больших чисел.

Теория оценивания ошибок выборки базируется на ряде предельных теорем под общим названием «закон больших чисел». В них доказывается, что ошибки могут быть сведены к минимальным значениям. При этом возможно установить их значения с требуемой точностью. Так, в приложении к выборочному методу из теоремы Чебышева следует, что с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки, полученной с соблюдением всех правил ее формирования, разность между генеральной и выборочной средними будет сколь угодно мала. Теорема Ляпунова позволяет оценить предельную ошибку выборки для среднего значения признака. Теорема Бернулли является частным сличаем теоремы Чебышева применительно к исследованию доли альтернативного признака.

3. Методы, виды и способы отбора выборочных совокупностей.К основным этапам работ при организации выборочного наблюдения относятся:

· постановка пели и определение задач выборочного наблюдения в соответствии с экономической задачей исследования;

· разработка программы наблюдения;

· проектирование бланков анкет, создание инструкции по проведению наблюдения и заполнению статистических формуляров;

· решение организационных вопросов наблюдения, в юм числе подготовка квалифицированного персонала;

· определение состава единиц генеральной совокупности;

· выбор способа формирования выборочной совокупности, решение вопросов, связанных с определением доли отбора, объема выборки и размера допустимой ошибки наблюдения;

· сбор данных (регистрация исследуемых признаков у отобранных единиц наблюдения):

· получение характеристик выборочной совокупности:

· определение ошибок выборки,

· распространение результатов выборки на изучаемую совокупность;

· выводы и рекомендации на основе полученных результатов выборочного наблюдения.

В теории выборочного наблюдения разработаны методы, способы и виды отбора единиц из генеральной совокупности.

По методамотбор делится на повторный и бесповторный.

При повторном отборекаждая единица, отобранная вслучайном порядке, после ее обследования возвращается в генеральную совокупность и в последующем отборе может снова попасть в выборку. При таком отборе вероятность попасть в выборку для каждой единицы генеральной совокупности не меняется независимо от числа отобранных единиц.

При бесповторном отборекаждая единица, отобранная в случайном порядке, после ее обследования в генеральную совокупность не возвращается. Вероятность попасть в выборку для каждой единицы генеральной совокупности увеличивается по мере производства отбора.

Так как бесповторный отбор охватывает все новые и новые совокупности, а повторный отбор на всем протяжении одну и ту же совокупность, то бесповторный отбор дает более точные результаты, чем повторный.

По видамотбор делится на индивидуальный, групповой и комбинированный.

При индивидуальном отборев выборочную совокупность отбираются отдельные единицы генеральной совокупности, например, при обследованиях промышленности – предприятия, при обследованиях населения – конкретные люди и т.д.

При групповом отборев выборочную совокупность отбираются качественно однородные группы или серии изучаемых единиц, например, бригады, микрорайоны и т.д.

При комбинированном отборесочетаются первый и второй виды отбора, например, сначала отбираются группы единиц(групповой отбор), а затем из них случайным образом – конкретные единицы (индивидуальный отбор).

В статистике существует несколько способов отбора:собственно-случайный, механический, типический, серийный и комбинированный.

Собственно-случайный отбор— это отбор, при котором наблюдению подвергается часть совокупности, отобранная (преимущественно посредством жеребьевки или, например, с помощью таблицы случайных чисел) из всей совокупности (без предварительного разбиения ее на какие-либо группы) в случайном порядке. При этом единицы совокупности имеют равные шансы попасть в выборочную совокупность. Собственно-случайный отбор бывает повторным и бесповторным.

Механический отборприменяется в тех случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определенная последовательность в расположении единиц (например, номера домов, списки избирателей).

При проведении механического отбора устанавливается шаг отсчета ( ), т.е. расстояние между отбираемыми единицами ( – величина, обратная доле выборки), и начало отсчета – номер единицы, которая должна быть обследована первой. Механический отбор всегда бывает бесповторным.

Механический отбор имеет преимущество перед случайным отбором, его не только легче организовать, но при нем единицы выборочной совокупности равномернее распределяются в генеральной совокупности.

Типический отборпредставляет собой отбор, при котором генеральная совокупность, содержащая N единиц, разбивается на качественно однородные типические группы (подсовокупности), состоящие соответственно из N₁, N₂, … N_L единиц. Эти подсовокупности не содержат общих единиц и вместе исчерпывают всю совокупность:

N₁ + N₂ + … + N_L = N.

Такие подсовокупности называются слоями. Для того, чтобы можно было полностью воспользоваться преимуществами этого метода отбора, значения N_L должны быть известны. Затем из каждой группы с помощью собственно-случайной или механической выборки проводится отбор единиц в выборочную совокупность, причем отбор в разных слоях производится независимо. Объемы выборок внутри слоев обозначаются соответственно через n₁, n₂, … n_Lи, следовательно, n₁ + n₂ + … + n_L = n.

Объем выборки из каждого слоя может быть пропорционален объему этого слоя (такой отбор называется пропорциональным) или определяется степенью дифференциации признака в данном слое (оптимальный отбор). При пропорциональном отборе объем выборки для каждой группы определяется по формуле , при оптимальном размещении (по Нейману)

Типический отбор бывает повторным и бесповторным.

Расслоение – наиболее распространенный прием, что обусловлено следующими причинами:

· расслоение можно рассматривать как процедуру извлечения выборок, в которой на простой случайный отбор наложены некоторые ограничения или условия;

· это способ включения знаний об общей совокупности и ее типических группах по признакам в процедуру отбора таким образом, чтобы повысить точность оценивания.

Разбивка на типические группы дает возможность избежать влияния межгрупповой вариации на точность выборки. В литературе типическая выборка называется также расслоенной, стратифицированной, районированной. Типическая выборка в статистической практике применяется гораздо чаще, чем остальные виды выборочного наблюдения. Так, при обследованиях населения в зависимости от целей исследования генеральную совокупность расслаивают по возрастному или социальному признаку, типа проживания (городское, сельское население и т.д.); при обследовании малых предприятий типизация осуществляется по четырем признакам: территориальному, отраслевому, виду собственности, и размеру выручки. Этим достигается однородность единиц внутри групп. Типическая выборка дает более точные результаты.

Серийный отбор— это такой отбор, когда в случайном порядке отбираются не единицы, подлежащие обследованию, а группы единиц (серии, кластеры, гнезда). Внутри отобранных серий обследованию подвергаются все единицы, т.е. применяется сплошное наблюдение. Например, при оценке качества продукции можно отбирать партии товара, а затем обследовать все входящие в них изделия: при некоторых обследованиях населения отбираются в порядке серии жилые дома, в которых опрашиваются жильцы всех квартир; обследования школьников проводятся путем отбора однотипных школ или конкретных классов, ученики которых подвергаются сплошному опросу, и т.д.

Широкое применение гнездового отбора в таких отраслях, как статистика сельского хозяйства и статистика населения, обусловлено двумя главными причинами:

· для многих обследований достоверного списка элементов совокупности не существует, а составление достоверного списка элементов обошлось бы слишком дорого;

· если имеется список отдельных единиц, экономические соображения могут диктовать выбор более крупных единиц отбора. При данном объеме выборки малые единицы отбора обычно обеспечивают более точные результаты, чем большие единицы. Например, простая случайная выборка объемом в 600 домов распределена по городу более равномерно, чем 20 городских кварталов, содержащих в среднем по 30 домов каждый. Однако определение местонахождения 600 домов и разъезды между ними потребуют больших расходов, чем определение местонахождения 20 кварталов и посещение всех домов в этих кварталах.

Поскольку внутри серий обследуются все без исключения единицы, средняя ошибка выборки приотборе равновеликих серий зависит от величины только межгрупповой дисперсии. Серийный отбор бывает повторным и бесповторным.

Комбинированный отбор. Комбинированный отбор широко применяется на практике и представляет собой сочетание разных методов отбора (их комбинацию), например типического с механическим. В этом случае генеральная совокупность разбивается на типические группы на основе ранее выбранного группировочного признака, внутри этих групп единицы наблюдения упорядочиваются, устанавливается шаг отбора, соответствующий необходимой численности выборки, после чего происходит извлечение единиц наблюдения из типических групп на основе механического отбора. Подобная комбинация методов обеспечивает представительство в выборке всех типов единиц наблюдения (за счет применения типического отбора)и сохраняет структуру типических групп по группировочным признакам, обеспечиваемую механическим отбором.

В статистике различают одноступенчатые и многоступенчатые способы отбора единиц в выборочную совокупность.

При одноступенчатой выборке каждая отобранная единица сразу же подвергается изучению по заданному признаку. Так обстоит дело при собственно-случайной и серийной выборке.

При многоступенчатой выборке производят подбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы. Так производится типическая выборка с механическим способом отбора единиц в выборочную совокупность.

Комбинированная выборка может быть двухступенчатой. При этом генеральная совокупность сначала разбивается на группы. Затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц.

Многофазная выборка предполагает сохранение одной и той же единицы отбора на всех этапах его проведения. При этом отобранные на каждой последующей стадии единицы отбора подвергаются обследованию, программа которого расширяется, например, студенты всего института, затем студенты каких-то факультетов.

Малая выпорка. Выборка считается малой, если количество объектов, отобранных для выборочного наблюдения, не превышает 20 единиц.

Малые выборки используются в тех ситуациях, когда распределение признака в генеральной совокупности является нормальным или приближается к нему. Только в этих случаях построенные доверительные интервалы или рассчитанные доверительные вероятности будут иметь реальное практическое значение.

Средняя (стандартная) ошибка выборки – это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака (чем меньше вариация признака, следовательно, и дисперсия, тем меньше ошибка выборки, и наоборот), численности выборки (чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки), метода отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования.

Согласно, центральной предельной теореме А.М. Ляпунова, доказанной в 1901 г, при достаточно большом числе независимых наблюдений в генеральной совокупности с конечной средней и ограниченной дисперсией вероятность того, что расхождение между выборочной и генеральной средней не превзойдет по абсолютной величине некоторую величину , равна интегралу Лапласа. Сказанное можно записать таким образом:

где – представляет собой нормированную функцию Лапласа

Величина есть средняя квадратическая ошибка выборки. Из теоремы А.М. Ляпунова непосредственно следует, что при достаточно большом числе независимых наблюдений распределение выборочных средних (а следовательно, и их отклонений от генеральной средней) приближенно нормально.

Средняя ошибка выборки – это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[ ].

В математической статистике доказывается, что величина средней квадратической стандартной ошибки выборочной средней количественного признака при случайном повторном отборе может быть определена по формуле

где – средняя ошибка выборочной средней; – дисперсия выборочной совокупности; – численность выборки.

Из формулы средней квадратической ошибки следует, что величина зависит от колеблемости признака в генеральной совокупности (чем больше вариация признака, тем больше ошибка выборки) и от объема выборки (чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик).

Предельная ошибка выборки –максимально возможное расхождение выборочной и генеральной средних , т.е. максимум ошибки при заданной вероятности ее появления.Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:

, ,

где – выборочная средняя, – генеральная средняя.

Границы задают доверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней.Предельная ошибка выборкисвязана со средней ошибкой выборки отношением:

то есть предельная ошибка выборки равна кратному числу средних ошибок выборки.

Коэффициент кратности называется также коэффициентом доверия. При этом коэффициент доверия зависит от значения доверительной вероятности (или уровня надежности) , с которой гарантируется величина предельной ошибки выборки. Для предельной ошибки выборочной средней это теоретическое положение выражается формулой

Значения t вычислены заранее для различных доверительных вероятностей и протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности значения для выборок достаточно большого объема ( )задаются следующим образом (табл. 1):

Таблица 1

Выборочная совокупность— это совокупность отобранных в определенном порядке единиц, по которым собирается инфор­мация, а ее показатели – выборочными.

Выборочная совокупность— это совокупность отобранных в определенном порядке единиц, по которым собирается информация, а ее показатели – выборочными.