Ошибка выборки

Так как признаки варьируют, то состав единиц, попавших в выборку, может не совпадать с составом единиц по всей совокупности. Это значит, что обобщающие показатели в выборке и w могут отличаться от значений этих характеристик в генеральной совокупности р и .

Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки .

В математической статистике доказывается, что значения средней ошибки выборки определяется по формуле:

Предполагается, что известна генеральная дисперсия . Но при выборочных обследованиях эти показатели не могут быть известны.

На практике для определения средней ошибки выборки обычно используются дисперсии выборочной совокупности . Эта замена основана на том, что при соблюдении принципа случайного отбора дисперсия выборки стремиться отобразить дисперсию в генеральной совокупности.

В математической статистике доказывается следующее отношение:

 

Если n достаточно велико, то 1.

Например, если n =100, то =1,01 и т.д.

При замене генеральной дисперсии дисперсией выборочной формула расчета средней ошибки примет вид:

При этом для показателя доли альтернативного признака дисперсия в выборочной совокупности определяется по формуле:

Для показателя средней величины дисперсия количественного признака в выборке определяется по формуле:

Формула для расчета ошибки применяется лишь при повторном методе отбора.

Сущность повторного отбора состоит в том, что каждая попавшая в выборку единица совокупности после фиксации значения должна быть возвращена в генеральную совокупность, где ей опять представляется равная возможность попасть в выборку.

На практике повторный отбор осуществляется редко. Обычно выборочное обследование проводится по схеме бесповторного отбора, при котором повторное попадание в выборку одних и тех же единиц исключено.

Посколько при бесповторном отборе численность генеральной совокупности в ходе выборки сокращается, то в формулу для расчета средней ошибки выборки включают дополнительный множитель 1- . Формула средней ошибки выборки примет вид: .

Полученное значение средней ошибки необходимо для установления возможного значения .

Одно из возможных значений средней определяется по формуле:

Итак, характеристика средней в генеральной совокупности отличается от средней на величину средней ошибки выборки .

Но такое суждение можно гарантировать не с абсолютной достоверностью, а лишь с определенной степенью вероятности.

В математической статистике доказывается, что пределы значений характеристик генеральной совокупности отличаются от характеристик выборочной совокупности лишь с вероятностью, которая определена числом 0,683.

Это означает, что в 683 случаях из 1000 генеральная средняя будет находиться в установленных пределах. В остальных 317 случаях они могут выйти за эти пределы. Вероятность можно повысить, если расширить пределы отклонений. Так, при удвоенном значении , вероятность достигает 0,954.

Если обозначить значение увеличения за t, то можно записать в общем виде:

Множитель t называется коэффициентом доверия. Известный русский математик А.М.Ляпунов дал выражение конкретных значений множителя t для различных степеней вероятности в виде функции:

На практике пользуются готовыми таблицами этой функции.

Крит. ошибка Вероятность
0,0 0,1 0,5 1,0 1,5 2,0 2,5 2,6 0,1 0,0797 0,3829 0,6827 0,8664 0,9545 0,9876 0,9907 0,9973 0,999937

 

Лишь с определенной степенью вероятности можно утверждать, что показатели генеральной совокупности и их отклонения не превысят величину t . Величина t называется предельной ошибкой выборки.

Тогда:

.