Тогда основная задача выборочного обследования состоит в том, чтобы на основе характеристик w и из выборки получить достоверные суждения о Р и в генеральной совокупности.

Их расхождения измеряются средней ошибкой выборки m.

Ошибка выборки.

Ошибка выборки – это объективно возникающие расхождения между характеристиками выборки и генеральной совокупности

В математической статистике доказывается, что среднее значение ошибки выборки определяется по формуле:

где - генеральная дисперсия; n – объем выборки.

Однако обычно неизвестно, наоборот, его как правило надо определить.

Поэтому используют соотношение

, где - дисперсия в выборочной совокупности.

Если n – велико, то стремится к 1.

Тогда (1)

где s²- дисперсия в выборочной совокупности; n- объём выборки.

Формула (1) используется при повторном отборе.

При этом для показателя доли альтернативного признака w дисперсия в выборочной совокупности определяется по формуле:

, где w=m/n

m – доля единиц с изучаемым признаком; n – объем выборки.

Для бесповторного отбора: (2)

где N - численность генеральной совокупности.

Повторный отбор – каждая попавшая в выборку единица после фиксации значения изучаемого признака, должна быть возвращена в генеральную совокупность, где ей опять предоставляется равная возможность попасть в выборку. (Используется редко)

Возможные значения, в пределах которых может находиться доля единиц, обладающих изучаемым признаком, в генеральной совокупности определяется по формуле: . (3)

Для средних значений в генеральной совокупности установлены следующие границы: (4)

Формулы (3) и (4) гарантированы не с абсолютной достоверностью, а лишь с определённой степенью вероятности.

В математической статистике доказывается, что пределы значений характеристик генеральной совокупности (Р и ) отличаются от характеристик выборочной совокупности (w и ) на величину лишь с определенной вероятностью = 0,683. Т.е. в 317 случаях из 1000 значения могут выйти из этих пределов.

Эту вероятность можно увеличить, увеличив в t раз среднюю ошибку m.

Здесь t - коэффициент доверия. Величина коэффициента доверия t зависит о доверительной вероятности и определяется по специальным таблицам, исчисленным применительно к случаю нормально распределенной совокупности (таблицы интегральной функции Лапласа).

Тогда:

При изучении доли альтернативного признака показатели соотносятся следующим образом: , (5)

При изучении средней величины: . (6)

Ошибки репрезентативности выборочного наблюдения это разновидность случайных ошибок. Они появляются как результат неполноты наблюдения. Если провести несколько выборочных наблюдений по одной совокупности, то полученные расхождения между показателями выборочной и генеральной совокупностей (т.е. ошибки выборки) будут различны как по знаку, так и по величине. Вот почему с помощью теорем математической статистики определяется средняя из возможных ошибок.

Смысл средней ошибки выборки: средняя ошибка выборки, по существу, это средняя квадратическая величина из отдельных ошибок, взвешенная по вероятности их возникновения.

Предельная ошибка выборки D находится следующим образом:

D = t · m. (7)

t- зависит от вероятности, с которой гарантируется величина предельной ошибки выборки.

Расчёт D при бесповторном отборе может быть записан следующими алгоритмами:

- доля альтернативного признака (8)

- средняя величина количественного признака (9)

Если процент единиц, взятых в выборку небольшой (до 5 %) то и расчёт производится по формулам повторного отбора:

, (10)

. (11)

Однако в этом случае мы несколько преувеличиваем результаты выборки (т.е. немного повышается средняя ошибка выборки).

Определение оптимальной численности выборки.

Размер ошибки выборки прежде всего зависит от численности выборочной совокупности n. При доведении N до n ошибка выборки m =0. Однако это требует увеличения объемов исследований, дополнительных затрат труда и материальных средств.

Определение оптимальной численности выборки основывается на формуле предельной ошибки выборки. Необходимая численность выборки n_х (для среднего значения) и n_w (для доли альтернативного признака) определяется как:

отсюда (12)

отсюда (13)

В случае бесповторного отбора величины (12) и (13) примут следующий вид:

(14)

(15)

Малая выборка.

Под малой выборкой (МВ) понимается несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности.

К минимальному объему выборки прибегают, когда большая выборка невозможна, или экономически невыгодна (если проведение исследования связано с порчей или уничтожением обследуемых образцов).

Объем малой выборки обычно не превышает 30 единиц, но м.б. до 4-5 единиц.

Первые работы в области теории малой выборки были выполнены английским статистиком В. Госсетом в 1908г. (псевдоним Стьюдент) и продолжены в исследованиях Р. Фишера.

Величина ошибки МВ определяется по формулам, отличным от формул выборочного наблюдения со сравнительно большим объемом выборки (n > 100). Средняя ошибка малой выборки исчисляется по формуле:

где - дисперсия малой выборки. (16)

При МВ величина имеет существенной значение, поэтому вычисление дисперсии малой выборки проводится с учетом числа степеней свободы.

Число степеней свободы – это количество вариантов, которые могут принимать произвольные значения, не меняя величины средней.

При определении дисперсии число степеней свободы = n – 1,

Тогда дисперсия МВ находится по формуле: (17)

Предельная ошибка малой выборки: D_мв = t · m_мв.

При этом для МВ t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n.

Для отдельных значений t и n доверительная вероятность МВ определяется по таблицам Стьюдента, в которых даны распределения стандартизованных отклонений:

(18)

При увеличении n распределение Стьюдента приближается к нормальному и при

n = 20 оно уже мало отличается от нормального распределения.

Распространение характеристик выборки на генеральную совокупность.

В зависимости от цели исследования применяются следующих два метода:

1) способ прямого пересчета показателей выборки для генеральной совокупности

2) посредством расчета поправочных коэффициентов.

1) При использовании способа прямого пересчета показатели выборочной доли или средней распространяются на генеральную совокупность с учетом ошибки выборки.

2) способ поправочных коэффициентов применяется, если целью выборочного метода является уточнение результатов сплошного учета:

Распространение выборочных данных на генеральную совокупность производится с учетом доверительных интервалов. Для этого соответствующие обобщающие показатели выборочной совокупности w и корректируются величиной предельной ошибки выборки _w и :

Для доли альтернативного признака:

Для средней величины количественного признака:

Способы отбора единиц из генеральной совокупности.

Практика применения выборочного метода использует следующие методы отбора единиц из генеральной совокупности:

Индивидуальный отбор – в выборку отбираются отдельные единицы.
Групповой отбор – в выборку попадают качественно однородные группы или серии изучаемых единиц.
Комбинированный отбор – сочетание индивидуального и группового отбора.

Методы отбора определяются способами формирования выборочной совокупности:

а) собственно-случайная выборка

б) механическая выборка

в) типическая выборка

г) серийная выборка

д) моментная выборка

е) комбинированная выборка

Собственно-случайная выборка – случайный (непреднамеренный) отбор отдельных единиц из генеральной совокупности. Количество отобранных единиц определяется исходя из принятой доли выборки К_в.

К_в= n/N.

Принцип случайности попадания в выборку устраняет возникновение систематических (тенденциозных) ошибок выборки и обеспечивает ее репрезентативность (представительность).

Формирование этой выборки производится с помощью специальных фишек; таблицы случайных чисел.

Эта выборка м.б. осуществлена по схемам повторного и бесповторного отбора.

Для вычисления средней ошибки выборки используются формулы:

(19)

Механическая выборка – генеральная совокупность разбивается на равные интервалы (группы). Размер интервала в генеральной совокупности равен обратной величине доли выборки.

Например, при 20%-й выборке размер интервала = 1/0,2=5

Из каждой группы в интервал выбирается одна единица. Для обеспечения репрезентативности выборки все единицы генеральной совокупности должны располагаться в определенном порядке. Если это упорядочение сделано по существенному признаку (который всецело определяет поведение изучаемого показателя), то в выборку идет единица из середины каждой группы.

Если упорядочение сделано по нейтральному признаку, то из каждой группы м.б. отобрана любая единица, но одинаковая.

Для вычисления средней ошибки выборки используются формулы:

Типическая выборка - часто применяется в статистике торговли. Генеральная совокупность делится на качественно однородные группы. Внутри групп отбираются единицы в случайном порядке (или механическим способом отбора).

Применяется при изучении сложных статистических совокупностей. Она дает более точные результаты.

При определении ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.

Средняя из внутригрупповых дисперсий исчисляется:

- для доли альтернативного признака (20)