Распространение выборочных результатов на генеральную совокупность

Пределы для генеральных характеристик (доверительные интервалы) определяются на основе показателей, полученных по данным выборки. Доверительный интервал для генеральной средней:

;

.

Доверительный интервал для генеральной доли:

;

.

Определение необходимого объёма выборки

При проектировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно определить численность (объём) выборочной совокупности, который с определённой вероятностью обеспечит заданную точность результатов наблюдения.

Формулы для определения необходимой численности выборки n легко получить непосредственно из формул предельной ошибки выборки. Так, при собственно-случайном способе отбора необходимая численность выборки составит:

Численность выборки (n) Способ отбора единиц
повторный Бесповторный
Для средней
Для доли

 

Эти формулы показывают, что с увеличением предполагаемой ошибки выборки значительно уменьшается её необходимый объём.

Решение типовых задач

Пример 4.1.

В городе было проведено выборочное обследование 1% граждан (случайный, повторный отбор) с целью изучения их доходов в ноябре.

Месячный доход, руб. 1200 – 4200 4200 – 7200 7200 – 10 200 10 200 и более
Число обследованных

 

Определим:

1) среднемесячный доход у жителя города в ноябре, гарантируя результат с вероятностью 0,997;

2) долю жителей города с доходом 7 200 руб. и выше, гарантируя результат с вероятностью 0,954;

3) необходимую численность выборки при определении среднемесячного дохода, чтобы с вероятностью 0,997 предельная ошибка выборки не превышала 300 руб.;

4) необходимую численность выборки при определении доли жителей с доходом более 7 200 руб. и выше, чтобы с вероятностью 0,954 предельная ошибка не превышала 5%;

5) предельную относительную ошибку для выборочной средней и выборочной доли.

Решение

I. Среднее значение признака в выборке:

Дисперсия выборочной средней:

Предельная ошибка при вероятности 0,997 (коэффициент доверия 3):

Доверительный интервал:

Таким образом, с вероятностью 0,997 можно утверждать, что средний доход жителей города в ноябре будет находиться в пределах от 6 509 до 6 991 руб.

2. Доля жителей города с доходом выше 7 200 руб. по данным выборочного наблюдения:

.

Предельная ошибка при вероятности 0,954 (коэффициент доверия 2):

.

Доверительный интервал:

;

;

.

Таким образом, с вероятностью 0,954 можно утверждать, что в генеральной совокупности число жителей, имеющих доход свыше 7 200 руб., находится в пределах от 38,2 до 43,8%.

3. Для определения необходимой численности выборки при определении среднемесячного дохода с вероятностью 0,997 (коэффициент доверия) и предельной ошибкой не более 300 руб. воспользуемся формулой для расчёта предельной ошибки для средней при повторном отборе:

Таким образом, чтобы с вероятностью 0,997 ошибка выборки не превышала 300 руб., численность выборки должна составлять 775 человек.

4. Для определения необходимой численности выборки при определении доли жителей города с доходом более 7 200 руб. с вероятностью 0,954 (коэффициент доверия 2) и предельной ошибкой, не превышающего 5 %, воспользуемся формулой для расчёта предельной ошибки для доли при повторном отборе:

Таким образом, чтобы с вероятностью 0,954 ошибка выборки не превышала 5%, численность выборки должна составлять 387 человек.

5. Предельная относительная ошибка выборки определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:

для средней:

для доли: