Формулы ошибок серийной выборки

В табл. 4 использованы следующие обозначения: – межгрупповая выборочная дисперсия средней, , где l – номер серии (гнезда); М – количество серий (гнезд); m – количество выбранных серий (гнезд); – средний уровень признака в серии; – средний уровень признака в выборочной совокупности; – межгрупповая выборочная дисперсия доли:

где – доля единиц, обладающих данным признаком в серии, –доля единиц, обладающих данным признаком во всей выборочной совокупности.

Если число ступеней отбора больше двух, то средняя ошибка многоступенчатой (многошаговой) выборки определяется по формуле

где – средние ошибки выборки на отдельных ступенях выборки; – численность выборок на соответствующих ступенях.

В случае комбинированной выборки средние ошибки рассчитываются по следующим формулам: при повторном отборе – ; при бесповторном отборе –

В тех случаях, когда численность генеральной совокупности очень велика по сравнению с числом отобранных единиц , величина будет близка к единице, а потому ею можно пренебречь. Тогда ошибку случайного бесповторного отбора определяют по формуле простой случайной повторной выборки, что повышает надежность оценок генеральных характеристик по выборочным данным.

Сопоставление формул, приведенных в табл. 2, свидетельствует о том, что применение бесповторного отбора взамен повторного приводит к уменьшению стандартной ошибки выборки.

В случаях малой выборки, когда объем выборки не превышает 30, необходимо учитывать коэффициент и оценивать среднюю ошибку малой выборки по формуле

Уровень предельной ошибки выборки зависит от следующих факторов:

· степени вариации единиц генеральной совокупности;

· объема выборки;

· выбранных схем отбора (повторный отбор дает величину ошибки);

· уровня доверительной вероятности.

Если объем выборки больше 30, то значение определяется по таблице нормального распределения, если меньше – по таблице распределения Стьюдента.

Выборочное наблюдение дает возможность определить среднюю арифметическую выборочной совокупности и величину предельной ошибки этой средней , которая показывает (с определенной вероятностью), насколько выборочная средняя может отличаться от генеральной средней в большую или меньшую сторону. Тогда величина генеральной средней будет представлена интервальной оценкой, для которой нижняя граница будет равна , а верхняя – . Пределы, в которых с данной степенью вероятности будет заключена неизвестная величина оцениваемого параметра, называют доверительными, а вероятность Р – доверительной вероятностью. Доверительный интервал для генеральной средней можно записать так:

где .

Чаще всего доверительную вероятность устанавливают равной 0,95 или 0,99, величины коэффициентов доверия равны соответственно 1,96 и 2,58.

Аналогичным образом могут быть записаны доверительные пределы генеральной доли:

Величина доверительного интервала для генеральной средней или генеральной доли зависит от величины предельной ошибки выборки или . Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки.

Поскольку величина предельной ошибки равна , точность оценки параметров генеральной совокупности будет зависеть от принятого уровня доверительной вероятности и от величины стандартной ошибки выборки.

Итак, определение границ генеральной средней и доли состоит из следующих этапов:

· нахождение в выборке среднего значения признака (или доли);

· определение в соответствии с выбранной схемой отбора и вида выборки;

· задание доверительной вероятности и определение коэффициента доверия по соответствующей таблице;

· вычисление предельной ошибки выборки ;

· построение доверительного интервала для средней (или доли).

Пример

Допустим, что доля бракованной продукции по данным выборки составила 0,02 (или 2%) при n = 1000. Известно, что выборка равна 10%, и, следовательно, N = 10 000. Тогда величина средней ошибки бесповторной выборки равна 0,0042:

С вероятностью 0,954 мы можем утверждать, что предельная ошибка доли брака не превысит 0,0084 ( ) и доля брака в генеральной совокупности будет находиться в интервале 0,0116 < р < 0,0284, то есть будет составлять от 1,16% до 2,84%.

Если принять доверительную вероятность равной 0,997, то величина предельной ошибки выборки составит 0,0126(0,0042*3) и доля брака в генеральной совокупности будет находиться в интервале 0,02±0,0126, то есть . Таким образом, с вероятностью 99,7% можно ожидать, что количество бракованных деталей во всей партии из 10 000 штук будет находиться в интервале от 74 до 326 штук, тогда как с вероятностью 95,4% доверительный интервал составит от 116 до 284 штук.

Пример

Для выявления доли простоев из-за несвоевременного поступления полуфабрикатов была проведена фотография рабочего дня 10% рабочих четырех различных цехов. Отбор рабочих внутри цехов производится методом механического отбора. В результате выборки были получены следующие данные (табл.5):

Таблица 5.