Формулы ошибок серийной выборки
В табл. 4 использованы следующие обозначения: – межгрупповая выборочная дисперсия средней, , где l – номер серии (гнезда); М – количество серий (гнезд); m – количество выбранных серий (гнезд); – средний уровень признака в серии; – средний уровень признака в выборочной совокупности; – межгрупповая выборочная дисперсия доли:
,
где – доля единиц, обладающих данным признаком в серии, –доля единиц, обладающих данным признаком во всей выборочной совокупности.
Если число ступеней отбора больше двух, то средняя ошибка многоступенчатой (многошаговой) выборки определяется по формуле
,
где – средние ошибки выборки на отдельных ступенях выборки; – численность выборок на соответствующих ступенях.
В случае комбинированной выборки средние ошибки рассчитываются по следующим формулам: при повторном отборе – ; при бесповторном отборе –
.
В тех случаях, когда численность генеральной совокупности очень велика по сравнению с числом отобранных единиц , величина будет близка к единице, а потому ею можно пренебречь. Тогда ошибку случайного бесповторного отбора определяют по формуле простой случайной повторной выборки, что повышает надежность оценок генеральных характеристик по выборочным данным.
Сопоставление формул, приведенных в табл. 2, свидетельствует о том, что применение бесповторного отбора взамен повторного приводит к уменьшению стандартной ошибки выборки.
В случаях малой выборки, когда объем выборки не превышает 30, необходимо учитывать коэффициент и оценивать среднюю ошибку малой выборки по формуле
.
Уровень предельной ошибки выборки зависит от следующих факторов:
· степени вариации единиц генеральной совокупности;
· объема выборки;
· выбранных схем отбора (повторный отбор дает величину ошибки);
· уровня доверительной вероятности.
Если объем выборки больше 30, то значение определяется по таблице нормального распределения, если меньше – по таблице распределения Стьюдента.
Выборочное наблюдение дает возможность определить среднюю арифметическую выборочной совокупности и величину предельной ошибки этой средней , которая показывает (с определенной вероятностью), насколько выборочная средняя может отличаться от генеральной средней в большую или меньшую сторону. Тогда величина генеральной средней будет представлена интервальной оценкой, для которой нижняя граница будет равна , а верхняя – . Пределы, в которых с данной степенью вероятности будет заключена неизвестная величина оцениваемого параметра, называют доверительными, а вероятность Р – доверительной вероятностью. Доверительный интервал для генеральной средней можно записать так:
,
где .
Чаще всего доверительную вероятность устанавливают равной 0,95 или 0,99, величины коэффициентов доверия равны соответственно 1,96 и 2,58.
Аналогичным образом могут быть записаны доверительные пределы генеральной доли:
Величина доверительного интервала для генеральной средней или генеральной доли зависит от величины предельной ошибки выборки или . Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки.
Поскольку величина предельной ошибки равна , точность оценки параметров генеральной совокупности будет зависеть от принятого уровня доверительной вероятности и от величины стандартной ошибки выборки.
Итак, определение границ генеральной средней и доли состоит из следующих этапов:
· нахождение в выборке среднего значения признака (или доли);
· определение в соответствии с выбранной схемой отбора и вида выборки;
· задание доверительной вероятности и определение коэффициента доверия по соответствующей таблице;
· вычисление предельной ошибки выборки ;
· построение доверительного интервала для средней (или доли).
Пример
Допустим, что доля бракованной продукции по данным выборки составила 0,02 (или 2%) при n = 1000. Известно, что выборка равна 10%, и, следовательно, N = 10 000. Тогда величина средней ошибки бесповторной выборки равна 0,0042:
С вероятностью 0,954 мы можем утверждать, что предельная ошибка доли брака не превысит 0,0084 ( ) и доля брака в генеральной совокупности будет находиться в интервале 0,0116 < р < 0,0284, то есть будет составлять от 1,16% до 2,84%.
Если принять доверительную вероятность равной 0,997, то величина предельной ошибки выборки составит 0,0126(0,0042*3) и доля брака в генеральной совокупности будет находиться в интервале 0,02±0,0126, то есть . Таким образом, с вероятностью 99,7% можно ожидать, что количество бракованных деталей во всей партии из 10 000 штук будет находиться в интервале от 74 до 326 штук, тогда как с вероятностью 95,4% доверительный интервал составит от 116 до 284 штук.
Пример
Для выявления доли простоев из-за несвоевременного поступления полуфабрикатов была проведена фотография рабочего дня 10% рабочих четырех различных цехов. Отбор рабочих внутри цехов производится методом механического отбора. В результате выборки были получены следующие данные (табл.5):
Таблица 5.