Тогда основная задача выборочного обследования состоит в том, чтобы на основе характеристик w и из выборки получить достоверные суждения о Р и в генеральной совокупности.
Их расхождения измеряются средней ошибкой выборки m.
- Ошибка выборки.
Ошибка выборки – это объективно возникающие расхождения между характеристиками выборки и генеральной совокупности
В математической статистике доказывается, что среднее значение ошибки выборки определяется по формуле:
где - генеральная дисперсия; n – объем выборки.
Однако обычно неизвестно, наоборот, его как правило надо определить.
Поэтому используют соотношение
, где
- дисперсия в выборочной совокупности.
Если n – велико, то стремится к 1.
Тогда (1)
где s2- дисперсия в выборочной совокупности; n- объём выборки.
Формула (1) используется при повторном отборе.
При этом для показателя доли альтернативного признака w дисперсия в выборочной совокупности определяется по формуле:
, где w=m/n
m – доля единиц с изучаемым признаком; n – объем выборки.
Для бесповторного отбора: (2)
где N - численность генеральной совокупности.
Повторный отбор – каждая попавшая в выборку единица после фиксации значения изучаемого признака, должна быть возвращена в генеральную совокупность, где ей опять предоставляется равная возможность попасть в выборку. (Используется редко)
Возможные значения, в пределах которых может находиться доля единиц, обладающих изучаемым признаком, в генеральной совокупности определяется по формуле: . (3)
Для средних значений в генеральной совокупности установлены следующие границы: (4)
Формулы (3) и (4) гарантированы не с абсолютной достоверностью, а лишь с определённой степенью вероятности.
В математической статистике доказывается, что пределы значений характеристик генеральной совокупности (Р и ) отличаются от характеристик выборочной совокупности (w и
) на величину
лишь с определенной вероятностью = 0,683. Т.е. в 317 случаях из 1000 значения могут выйти из этих пределов.
Эту вероятность можно увеличить, увеличив в t раз среднюю ошибку m.
Здесь t - коэффициент доверия. Величина коэффициента доверия t зависит о доверительной вероятности и определяется по специальным таблицам, исчисленным применительно к случаю нормально распределенной совокупности (таблицы интегральной функции Лапласа).
Тогда:
При изучении доли альтернативного признака показатели соотносятся следующим образом: , (5)
При изучении средней величины: . (6)
Ошибки репрезентативности выборочного наблюдения это разновидность случайных ошибок. Они появляются как результат неполноты наблюдения. Если провести несколько выборочных наблюдений по одной совокупности, то полученные расхождения между показателями выборочной и генеральной совокупностей (т.е. ошибки выборки) будут различны как по знаку, так и по величине. Вот почему с помощью теорем математической статистики определяется средняя из возможных ошибок.
Смысл средней ошибки выборки: средняя ошибка выборки, по существу, это средняя квадратическая величина из отдельных ошибок, взвешенная по вероятности их возникновения.
Предельная ошибка выборки D находится следующим образом:
D = t · m. (7)
t- зависит от вероятности, с которой гарантируется величина предельной ошибки выборки.
Расчёт D при бесповторном отборе может быть записан следующими алгоритмами:
- доля альтернативного признака (8)
- средняя величина количественного признака (9)
Если процент единиц, взятых в выборку небольшой (до 5 %) то и расчёт производится по формулам повторного отбора:
, (10)
. (11)
Однако в этом случае мы несколько преувеличиваем результаты выборки (т.е. немного повышается средняя ошибка выборки).
- Определение оптимальной численности выборки.
Размер ошибки выборки прежде всего зависит от численности выборочной совокупности n. При доведении N до n ошибка выборки m =0. Однако это требует увеличения объемов исследований, дополнительных затрат труда и материальных средств.
Определение оптимальной численности выборки основывается на формуле предельной ошибки выборки. Необходимая численность выборки nх (для среднего значения) и nw (для доли альтернативного признака) определяется как:
отсюда
(12)
отсюда
(13)
В случае бесповторного отбора величины (12) и (13) примут следующий вид:
(14)
(15)
- Малая выборка.
Под малой выборкой (МВ) понимается несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности.
К минимальному объему выборки прибегают, когда большая выборка невозможна, или экономически невыгодна (если проведение исследования связано с порчей или уничтожением обследуемых образцов).
Объем малой выборки обычно не превышает 30 единиц, но м.б. до 4-5 единиц.
Первые работы в области теории малой выборки были выполнены английским статистиком В. Госсетом в 1908г. (псевдоним Стьюдент) и продолжены в исследованиях Р. Фишера.
Величина ошибки МВ определяется по формулам, отличным от формул выборочного наблюдения со сравнительно большим объемом выборки (n > 100). Средняя ошибка малой выборки исчисляется по формуле:
где
- дисперсия малой выборки. (16)
При МВ величина имеет существенной значение, поэтому вычисление дисперсии малой выборки проводится с учетом числа степеней свободы.
Число степеней свободы – это количество вариантов, которые могут принимать произвольные значения, не меняя величины средней.
При определении дисперсии число степеней свободы = n – 1,
Тогда дисперсия МВ находится по формуле: (17)
Предельная ошибка малой выборки: Dмв = t · mмв.
При этом для МВ t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n.
Для отдельных значений t и n доверительная вероятность МВ определяется по таблицам Стьюдента, в которых даны распределения стандартизованных отклонений:
(18)
При увеличении n распределение Стьюдента приближается к нормальному и при
n = 20 оно уже мало отличается от нормального распределения.
- Распространение характеристик выборки на генеральную совокупность.
В зависимости от цели исследования применяются следующих два метода:
1) способ прямого пересчета показателей выборки для генеральной совокупности
2) посредством расчета поправочных коэффициентов.
1) При использовании способа прямого пересчета показатели выборочной доли или средней распространяются на генеральную совокупность с учетом ошибки выборки.
2) способ поправочных коэффициентов применяется, если целью выборочного метода является уточнение результатов сплошного учета:
Распространение выборочных данных на генеральную совокупность производится с учетом доверительных интервалов. Для этого соответствующие обобщающие показатели выборочной совокупности w и корректируются величиной предельной ошибки выборки w и
:
Для доли альтернативного признака:
Для средней величины количественного признака:
- Способы отбора единиц из генеральной совокупности.
Практика применения выборочного метода использует следующие методы отбора единиц из генеральной совокупности:
- Индивидуальный отбор – в выборку отбираются отдельные единицы.
- Групповой отбор – в выборку попадают качественно однородные группы или серии изучаемых единиц.
- Комбинированный отбор – сочетание индивидуального и группового отбора.
Методы отбора определяются способами формирования выборочной совокупности:
а) собственно-случайная выборка
б) механическая выборка
в) типическая выборка
г) серийная выборка
д) моментная выборка
е) комбинированная выборка
Собственно-случайная выборка – случайный (непреднамеренный) отбор отдельных единиц из генеральной совокупности. Количество отобранных единиц определяется исходя из принятой доли выборки Кв.
Кв= n/N.
Принцип случайности попадания в выборку устраняет возникновение систематических (тенденциозных) ошибок выборки и обеспечивает ее репрезентативность (представительность).
Формирование этой выборки производится с помощью специальных фишек; таблицы случайных чисел.
Эта выборка м.б. осуществлена по схемам повторного и бесповторного отбора.
Для вычисления средней ошибки выборки используются формулы:
(19)
Механическая выборка – генеральная совокупность разбивается на равные интервалы (группы). Размер интервала в генеральной совокупности равен обратной величине доли выборки.
Например, при 20%-й выборке размер интервала = 1/0,2=5
Из каждой группы в интервал выбирается одна единица. Для обеспечения репрезентативности выборки все единицы генеральной совокупности должны располагаться в определенном порядке. Если это упорядочение сделано по существенному признаку (который всецело определяет поведение изучаемого показателя), то в выборку идет единица из середины каждой группы.
Если упорядочение сделано по нейтральному признаку, то из каждой группы м.б. отобрана любая единица, но одинаковая.
Для вычисления средней ошибки выборки используются формулы:
Типическая выборка - часто применяется в статистике торговли. Генеральная совокупность делится на качественно однородные группы. Внутри групп отбираются единицы в случайном порядке (или механическим способом отбора).
Применяется при изучении сложных статистических совокупностей. Она дает более точные результаты.
При определении ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.
Средняя из внутригрупповых дисперсий исчисляется:
- для доли альтернативного признака (20)
- для средней величины количественного признака (21)
Формирование типической выборки осуществляется пропорционально численности единиц, составляющих типические группы.
Определение средней ошибки типической выборки:
а) для доли альтернативного признака
Повторный отбор: . (22)
Бесповторный отбор: (23)
Здесь (24)
б) для средней величины количественного признака
Повторный отбор: . (25)
Бесповторный отбор: (26)