Внимание формулы средней ошибки выборки зависит от того какая выборка – повторная или бесповторная
Условные обозначения
Показатель | Совокупность | |
Генеральная | Выборочная | |
Объем (число единиц) совокупности | N | n |
Среднее значение признака | ![]() | ![]() |
Численность единиц, обладающих определенным вариантом или вариантами изучаемого признака | M | m |
Доля единиц, обладающая изучаемым признаком | p | w |
Доля единиц, не обладающая изучаемым признаком | q | 1-w |
Дисперсия | ![]() | ![]() |
Среднее квадратичное отклонение | ![]() | ![]() |
Генеральное среднее значение определяется по данным генеральной совокупности и обозначается x. Форма для его расчета
имеет вид:
Выборочное среднее ( ) является несмещенной, состоятельной и эффективной оценкой генерального среднего и определяется по формуле:
Генеральная дисперсия единиц количественного признака определяется по формуле:
Так как генеральная дисперсия по большей части в ходе исследования остается неизвестной, то условно ее принимают равной дисперсии, рассчитываемой по выборочным данным:
При малочисленных выборках в формулу необходимо внести поправку:
Помимо определения характеристик количественных признаков можно произвести оценку характеристик альтернативных показателей. Численность единиц, обладающих изучаемыми признаками в генеральной совокупности обозначается M, а в выборочной — m. Тогда доля единиц, обладающих исследуемыми признаками в генеральной совокупности, определяется как:
в выборочной совокупности:
Генеральная дисперсия доли альтернативного признака рассчитывается по формуле:
где p — доля единиц, обладающих исследуемым признаком; q — доля единиц, не обладающих исследуемым признаком (q = 1 – p).
Выборочная дисперсия доли:
Ошибки регистрацииявляются следствием неправильного установления значения наблюдаемого признака или неправильной записи. Они свойственны не только выборочному, но и сплошному наблюдению.
Ошибки репрезентативностиобусловлены тем обстоятельством, что выборочная совокупность не может по всем параметрам в точности воспроизвести совокупность генеральную.
Ошибка выборки – расхождение (разность) между характеристиками генеральной и выборочной совокупности.
Ошибки выборки:
· средние (или стандартные);
· предельные
Из одной и той же генеральной совокупности объема N можно извлечь множество различных выборок заданного объема n. Тогда в каждом случае рассчитанные отклонения выборочных характеристик от генеральных будут различны. Если определить среднюю из ошибок всех возможных выборок заданного объема, извлеченных из одной и той же генеральной совокупности, то получим их обобщающую характеристику — среднюю ошибку выборки( ), которая показывает, насколько отклоняется в среднем параметр выборочной совокупности от соответствующего параметра генеральной.
Внимание формулы средней ошибки выборки зависит от того какая выборка – повторная или бесповторная
Повторная выборка
Величина средней (стандартной) ошибки выборки прямо пропорционально квадратному корню из дисперсии и обратно пропорциональны квадратному корню из объема выборочного наблюдения
где — дисперсия изучаемого признака по выборочной совокупности.
Если признак альтернативный, то при оценивании доли определяется по формуле:
При бесповторная выборка
При бесповторной собственно случайной выборке учитывается поправка на конечность совокупности
Скорректировав формулу, получим формулу средней ошибки для бесповторного отбора:
для доли:
При определении возможных границ значений характеристик генеральной совокупности рассчитывается предельная ошибка выборки( ), которая зависит от величины ее средней ошибки и уровня вероятности, с которым гарантируется, что генеральная средняя не выйдет за указанные границы:
=t
.
t – коэффициент доверия или t-статистика
При обобщении результатов выборочного наблюдения наиболее часто используются следующие уровни вероятности и соответствующие им значения t (источник - значения коэффициента доверия из таблицы нормального распределения).
Значение доверительной вероятности Р | 0,6827 | 0,8664 | 0,9545 | 0,9876 | 0,9973 |
Значение коэффициента доверия t | 1,5 | 2,5 |
Например, если при расчете предельной ошибки выборки мы используем значение t=2, то с вероятностью 0,954 можно утверждать, что расхождение между выборочной средней и генеральной средней не превысит двухкратной величины средней ошибки выборки.
Построение доверительных интервалов для генеральной средней и доли осуществляется следующим образом:
Доверительный интервал – вычисленный на основе выборки интервал значений признака, который с известной вероятностью содержит оцениваемый параметр генеральной совокупности. «Мы на 95% уверены, что доля людей которым известна наша торговая марка находится где – то между 23,2% и 38,0%».