Тогда основная задача выборочного обследования состоит в том, чтобы на основе характеристик w и из выборки получить достоверные суждения о Р и в генеральной совокупности.

Их расхождения измеряются средней ошибкой выборки m.

 

  1. Ошибка выборки.

Ошибка выборки – это объективно возникающие расхождения между характеристиками выборки и генеральной совокупности

 

В математической статистике доказывается, что среднее значение ошибки выборки определяется по формуле:

где - генеральная дисперсия; n – объем выборки.

Однако обычно неизвестно, наоборот, его как правило надо определить.

Поэтому используют соотношение

, где - дисперсия в выборочной совокупности.

Если n – велико, то стремится к 1.

 

Тогда (1)

 

где s2- дисперсия в выборочной совокупности; n- объём выборки.

 

Формула (1) используется при повторном отборе.

При этом для показателя доли альтернативного признака w дисперсия в выборочной совокупности определяется по формуле:

, где w=m/n

m – доля единиц с изучаемым признаком; n – объем выборки.

Для бесповторного отбора: (2)

 

где N - численность генеральной совокупности.

 

Повторный отбор – каждая попавшая в выборку единица после фиксации значения изучаемого признака, должна быть возвращена в генеральную совокупность, где ей опять предоставляется равная возможность попасть в выборку. (Используется редко)

 

Возможные значения, в пределах которых может находиться доля единиц, обладающих изучаемым признаком, в генеральной совокупности определяется по формуле: . (3)

 

Для средних значений в генеральной совокупности установлены следующие границы: (4)

 

Формулы (3) и (4) гарантированы не с абсолютной достоверностью, а лишь с определённой степенью вероятности.

В математической статистике доказывается, что пределы значений характеристик генеральной совокупности (Р и ) отличаются от характеристик выборочной совокупности (w и ) на величину лишь с определенной вероятностью = 0,683. Т.е. в 317 случаях из 1000 значения могут выйти из этих пределов.

 

 

Эту вероятность можно увеличить, увеличив в t раз среднюю ошибку m.

Здесь t - коэффициент доверия. Величина коэффициента доверия t зависит о доверительной вероятности и определяется по специальным таблицам, исчисленным применительно к случаю нормально распределенной совокупности (таблицы интегральной функции Лапласа).

Тогда:

При изучении доли альтернативного признака показатели соотносятся следующим образом: , (5)

При изучении средней величины: . (6)

 

Ошибки репрезентативности выборочного наблюдения это разновидность случайных ошибок. Они появляются как результат неполноты наблюдения. Если провести несколько выборочных наблюдений по одной совокупности, то полученные расхождения между показателями выборочной и генеральной совокупностей (т.е. ошибки выборки) будут различны как по знаку, так и по величине. Вот почему с помощью теорем математической статистики определяется средняя из возможных ошибок.

 

Смысл средней ошибки выборки: средняя ошибка выборки, по существу, это средняя квадратическая величина из отдельных ошибок, взвешенная по вероятности их возникновения.

 

Предельная ошибка выборки D находится следующим образом:

D = t · m. (7)

t- зависит от вероятности, с которой гарантируется величина предельной ошибки выборки.

 

Расчёт D при бесповторном отборе может быть записан следующими алгоритмами:

- доля альтернативного признака (8)

 

- средняя величина количественного признака (9)

 

Если процент единиц, взятых в выборку небольшой (до 5 %) то и расчёт производится по формулам повторного отбора:

 

, (10)

 

. (11)

Однако в этом случае мы несколько преувеличиваем результаты выборки (т.е. немного повышается средняя ошибка выборки).

 

  1. Определение оптимальной численности выборки.

Размер ошибки выборки прежде всего зависит от численности выборочной совокупности n. При доведении N до n ошибка выборки m =0. Однако это требует увеличения объемов исследований, дополнительных затрат труда и материальных средств.

 

Определение оптимальной численности выборки основывается на формуле предельной ошибки выборки. Необходимая численность выборки nх (для среднего значения) и nw (для доли альтернативного признака) определяется как:

 

отсюда (12)

 

отсюда (13)

 

В случае бесповторного отбора величины (12) и (13) примут следующий вид:

 

(14)

 

(15)

 

  1. Малая выборка.

Под малой выборкой (МВ) понимается несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности.

К минимальному объему выборки прибегают, когда большая выборка невозможна, или экономически невыгодна (если проведение исследования связано с порчей или уничтожением обследуемых образцов).

Объем малой выборки обычно не превышает 30 единиц, но м.б. до 4-5 единиц.

 

Первые работы в области теории малой выборки были выполнены английским статистиком В. Госсетом в 1908г. (псевдоним Стьюдент) и продолжены в исследованиях Р. Фишера.

Величина ошибки МВ определяется по формулам, отличным от формул выборочного наблюдения со сравнительно большим объемом выборки (n > 100). Средняя ошибка малой выборки исчисляется по формуле:

 

где - дисперсия малой выборки. (16)

При МВ величина имеет существенной значение, поэтому вычисление дисперсии малой выборки проводится с учетом числа степеней свободы.

Число степеней свободы – это количество вариантов, которые могут принимать произвольные значения, не меняя величины средней.

При определении дисперсии число степеней свободы = n – 1,

 

Тогда дисперсия МВ находится по формуле: (17)

Предельная ошибка малой выборки: Dмв = t · mмв.

 

При этом для МВ t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n.

 

Для отдельных значений t и n доверительная вероятность МВ определяется по таблицам Стьюдента, в которых даны распределения стандартизованных отклонений:

(18)

 

При увеличении n распределение Стьюдента приближается к нормальному и при

n = 20 оно уже мало отличается от нормального распределения.

 

 

  1. Распространение характеристик выборки на генеральную совокупность.

В зависимости от цели исследования применяются следующих два метода:

1) способ прямого пересчета показателей выборки для генеральной совокупности

2) посредством расчета поправочных коэффициентов.

 

1) При использовании способа прямого пересчета показатели выборочной доли или средней распространяются на генеральную совокупность с учетом ошибки выборки.

2) способ поправочных коэффициентов применяется, если целью выборочного метода является уточнение результатов сплошного учета:

 

Распространение выборочных данных на генеральную совокупность производится с учетом доверительных интервалов. Для этого соответствующие обобщающие показатели выборочной совокупности w и корректируются величиной предельной ошибки выборки w и :

Для доли альтернативного признака:

Для средней величины количественного признака:

 

  1. Способы отбора единиц из генеральной совокупности.

Практика применения выборочного метода использует следующие методы отбора единиц из генеральной совокупности:

  1. Индивидуальный отбор – в выборку отбираются отдельные единицы.
  2. Групповой отбор – в выборку попадают качественно однородные группы или серии изучаемых единиц.
  3. Комбинированный отбор – сочетание индивидуального и группового отбора.

 

Методы отбора определяются способами формирования выборочной совокупности:

а) собственно-случайная выборка

б) механическая выборка

в) типическая выборка

г) серийная выборка

д) моментная выборка

е) комбинированная выборка

 

Собственно-случайная выборка – случайный (непреднамеренный) отбор отдельных единиц из генеральной совокупности. Количество отобранных единиц определяется исходя из принятой доли выборки Кв.

 

Кв= n/N.

 

Принцип случайности попадания в выборку устраняет возникновение систематических (тенденциозных) ошибок выборки и обеспечивает ее репрезентативность (представительность).

Формирование этой выборки производится с помощью специальных фишек; таблицы случайных чисел.

Эта выборка м.б. осуществлена по схемам повторного и бесповторного отбора.

 

Для вычисления средней ошибки выборки используются формулы:

(19)

 

Механическая выборка – генеральная совокупность разбивается на равные интервалы (группы). Размер интервала в генеральной совокупности равен обратной величине доли выборки.

Например, при 20%-й выборке размер интервала = 1/0,2=5

 

Из каждой группы в интервал выбирается одна единица. Для обеспечения репрезентативности выборки все единицы генеральной совокупности должны располагаться в определенном порядке. Если это упорядочение сделано по существенному признаку (который всецело определяет поведение изучаемого показателя), то в выборку идет единица из середины каждой группы.

Если упорядочение сделано по нейтральному признаку, то из каждой группы м.б. отобрана любая единица, но одинаковая.

Для вычисления средней ошибки выборки используются формулы:

Типическая выборка - часто применяется в статистике торговли. Генеральная совокупность делится на качественно однородные группы. Внутри групп отбираются единицы в случайном порядке (или механическим способом отбора).

Применяется при изучении сложных статистических совокупностей. Она дает более точные результаты.

 

При определении ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.

Средняя из внутригрупповых дисперсий исчисляется:

 

- для доли альтернативного признака (20)

- для средней величины количественного признака (21)

 

Формирование типической выборки осуществляется пропорционально численности единиц, составляющих типические группы.

Определение средней ошибки типической выборки:

а) для доли альтернативного признака

 

Повторный отбор: . (22)

Бесповторный отбор: (23)

Здесь (24)

б) для средней величины количественного признака

Повторный отбор: . (25)

Бесповторный отбор: (26)