Внимание формулы средней ошибки выборки зависит от того какая выборка – повторная или бесповторная

Условные обозначения

Показатель Совокупность
Генеральная Выборочная
Объем (число единиц) совокупности N n
Среднее значение признака
Численность единиц, обладающих определенным вариантом или вариантами изучаемого признака M m
Доля единиц, обладающая изучаемым признаком p w
Доля единиц, не обладающая изучаемым признаком q 1-w
Дисперсия
Среднее квадратичное отклонение

 

Генеральное среднее значение определяется по данным генеральной совокупности и обозначается x. Форма для его расчета

имеет вид:

Выборочное среднее ( ) является несмещенной, состоятельной и эффективной оценкой генерального среднего и определяется по формуле:

 

 

Генеральная дисперсия единиц количественного признака определяется по формуле:

Так как генеральная дисперсия по большей части в ходе исследования остается неизвестной, то условно ее принимают равной дисперсии, рассчитываемой по выборочным данным:

При малочисленных выборках в формулу необходимо внести поправку:

 

 

Помимо определения характеристик количественных признаков можно произвести оценку характеристик альтернативных показателей. Численность единиц, обладающих изучаемыми признаками в генеральной совокупности обозначается M, а в выборочной — m. Тогда доля единиц, обладающих исследуемыми признаками в генеральной совокупности, определяется как:

в выборочной совокупности:

 

 

Генеральная дисперсия доли альтернативного признака рассчитывается по формуле:

где p — доля единиц, обладающих исследуемым признаком; q — доля единиц, не обладающих исследуемым признаком (q = 1 – p).

Выборочная дисперсия доли:

 

 

Ошибки регистрацииявляются следствием неправильного установления значения наблюдаемого признака или неправильной записи. Они свойственны не только выборочному, но и сплошному наблюдению.

Ошибки репрезентативностиобусловлены тем обстоятельством, что выборочная совокупность не может по всем параметрам в точности воспроизвести совокупность генеральную.

 

 

Ошибка выборки – расхождение (разность) между характеристиками генеральной и выборочной совокупности.

Ошибки выборки:

· средние (или стандартные);

· предельные

 

Из одной и той же генеральной совокупности объема N можно извлечь множество различных выборок заданного объема n. Тогда в каждом случае рассчитанные отклонения выборочных характеристик от генеральных будут различны. Если определить среднюю из ошибок всех возможных выборок заданного объема, извлеченных из одной и той же генеральной совокупности, то получим их обобщающую характеристику — среднюю ошибку выборки( ), которая показывает, насколько отклоняется в среднем параметр выборочной совокупности от соответствующего параметра генеральной.

 

 

Внимание формулы средней ошибки выборки зависит от того какая выборка – повторная или бесповторная

Повторная выборка

Величина средней (стандартной) ошибки выборки прямо пропорционально квадратному корню из дисперсии и обратно пропорциональны квадратному корню из объема выборочного наблюдения

где дисперсия изучаемого признака по выборочной совокупности.

Если признак альтернативный, то при оценивании доли определяется по формуле:

При бесповторная выборка

При бесповторной собственно случайной выборке учитывается поправка на конечность совокупности

Скорректировав формулу, получим формулу средней ошибки для бесповторного отбора:

для доли:

При определении возможных границ значений характеристик генеральной совокупности рассчитывается предельная ошибка выборки( ), которая зависит от величины ее средней ошибки и уровня вероятности, с которым гарантируется, что генеральная средняя не выйдет за указанные границы: =t .

t – коэффициент доверия или t-статистика

При обобщении результатов выборочного наблюдения наиболее часто используются следующие уровни вероятности и соответствующие им значения t (источник - значения коэффициента доверия из таблицы нормального распределения).

 

Значение доверительной вероятности Р 0,6827 0,8664 0,9545 0,9876 0,9973
Значение коэффициента доверия t 1,5 2,5

 

Например, если при расчете предельной ошибки выборки мы используем значение t=2, то с вероятностью 0,954 можно утверждать, что расхождение между выборочной средней и генеральной средней не превысит двухкратной величины средней ошибки выборки.

Построение доверительных интервалов для генеральной средней и доли осуществляется следующим образом:

Доверительный интервал – вычисленный на основе выборки интервал значений признака, который с известной вероятностью содержит оцениваемый параметр генеральной совокупности. «Мы на 95% уверены, что доля людей которым известна наша торговая марка находится где – то между 23,2% и 38,0%».