Результаты выборочного обследования доходов населения

Район Численность населения, чел. Обследовано, чел. Доход в расчете на 1 человека
средняя, тыс. руб. дисперсия
120 000 2,9 1,3
170 000 2,5 1,1
90 000 2,7 1,6

Определите границы среднедушевых доходов населения по области в целом при уровне вероятности 0,997.

Решение.

Рассчитаем среднюю из внутригрупповых дисперсий:

=

Определим среднюю и предельную ошибки выборки:

Рассчитаем выборочную среднюю:

тыс. руб.

В результате проведенных расчетов с вероятностью 0,997 можно сделать вывод, что среднедушевые доходы жителей данной области находятся в следующих границах (тыс. руб.):

2,67-0,04 ≤ ≤ 2,67+0,04

или

2,63≤ ≤2,71.

 

· При определении необходимого объема типической выборки учитывается средняя из внутригрупповых дисперсий:

 

n= (повторный отбор);

 

n= (бесповторный отбор).

 

Полученное значение общего объема выборки необходимо распределить по типическим группам пропорционально их численности, чтобы определить, какое количество единиц следует отобрать из каждой группы:

 

,

где - объем i-й группы;

-объем выборки из i-й группы.

 

 

Ø Серийная выборка.

 

· В основе расчета средней ошибки серийной выборки лежит межгрупповая дисперсия:

( повторный отбор);

( бесповторный отбор),

где r- число отобранных серий;

R- общее число серий.

 

Межгрупповую дисперсию при равновеликих группах вычисляют следующим образом:

,

где - средняя i-й серии;

х- общая средняя по всей выборочной совокупности.

Например. В целях контроля качества комплектующих из партии изделий, упакованных в 50 ящиков по 20 изделий в каждом, была произведена 10%- ная серийная выборка. По попавшим в выборку ящикам среднее отклонение параметров изделия от нормы соответственно составило 9мм, 11, 12, 8 и 14мм. С вероятностью 0,954 определите среднее отклонение параметров по всей партии в целом.

Решение.

Рассчитаем выборочную среднюю:

мм.

Определим величину межгрупповой дисперсии:

С учетом установленной вероятности Р= 0,954 (t=2) предельная ошибка выборки составит :

мм.

Произведенные расчеты позволяют заключить, что среднее отклонение параметров всех изделий от нормы находится в следующих границах:

(10,8 -1,8) мм ≤ ≤ (10,8-1,8) мм.

 

· Для определения необходимого объема серийной выборки при заданной предельной ошибке используются следующие формулы:

r = (повторный отбор);

 

r= (бесповторный отбор).

 

 

5. Малая выборка представляет собой несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности.

 

Объем малой выборки обычно не превышает 30 единиц и может доходить до 4-5 единиц.

 

Величина ошибки малой выборки определяется по формулам, отличным от формул выборочного наблюдения со сравнительно большим объемом выборки (n=100). Средняя ошибка малой выборки вычисляется по формуле:

 

,

где - дисперсия малой выборки.

 

Вычисление дисперсии малой выборки производится с учетом так называемого числа степеней свободы (под которым понимается количество вариантов, которые могут принимать произвольные значения, не меняя величины средней). При определении дисперсии число степеней свободы равно n-1:

.

 

Предельная ошибка малой выборки определяется по формуле:

.

 

При этом значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Для отдельных значений t и n доверительная величина малой выборки определяется по специальным таблицам Стьюдента, которые приводятся в учебниках по математической статистике. Приведем некоторые значения из этих таблиц табл.4.

Таблица 4

n t
0,5 1,0 1,5 2,0 3,0
0,347 0,609 0,769 0,861 0,942
0,362 0,637 0,806 0,898 0,970
0,368 0,649 0,823 0,914 0,980
0,371 0,657 0,832 0,923 0,985
0,376 0,666 0,846 0,936 0,992
0,377 0,670 0,850 0,940 0,993

 

Согласно табл.4 по мере увеличения объема выборки распределение Стьюдента приближается к нормальному и при 20 оно уже мало отличается от нормального распределения.

 

При проведении малых выборочных обследований важно иметь в виду, что чем меньше объем выборки, тем больше различие между распределением Стьюдента и нормальным распределением. При минимальном объеме выборки. При минимальном объеме выборки ( n=4) это различие весьма существенно, что указывает на уменьшение точности результатов малой выборки.

 

Поскольку при проведении малой выборки в качестве доверительной вероятности практически принимается значение 0,95 или 0,99, то для определения предельной ошибки выборки исчисляются показания распределения Стьюдента представленные в таблице 5.

 

Таблица 5

n
t 0,95 3,183 2,777 2,571 2,447 2,364 2,307 2,263 2,119 2,078
0,99 5,841 4,604 4,032 3,707 3,500 3,356 3,250 2,921 2,832

 

Например. При контрольной проверке качества поставленной в торговлю колбасы получены следующие данные о содержании поваренной соли в пробах, %: 4,3; 4,2; 3,8; 4,3; 3,7; 3,9; 4,5; 4,4; 4,0; 3,9.

По данным выборочного обследования установить с вероятностью 0,95 предел, в котором находится средний процент содержания поваренной соли в данной партии товара.

 

Решение.

Определим среднюю пробу малой выборки:

Рассчитаем дисперсию и итоги расчетов представим в виде таблицы :

 

Пробы х-
4,3 0,2 0,04
4,2 0,1 0,01
3,8 0,3 0,09
4,3 0,2 0,04
3,7 -0,4 0,16
3,9 -0,2 0,04
4,5 0,4 0,16
4,4 0,3 0,09
4,0 -0,1 0,01
3,9 -0,2 0,04
- 0,68

 

=

Определим среднюю ошибку малой выборки:

=

Исходя из численности выборки (n=10) и заданной вероятности t=0,95 устанавливается по распределению Стьюдента (см. табл.5) значение коэффициента доверия t=2,263 .

 

Предельная ошибка малой выборки составит:

 

=2,263 ( =

Следовательно, с вероятностью 0,95 можно утверждать, что во всей партии колбасы содержание поваренной соли находится в пределах:

, т.е. от 4,1 - 0,2 % = 3,9 % до 4,1 + 0,2 % = 4,3 %.

Контрольные вопросы:

1. Какое наблюдение называется выборочным?

 

2. В чем преимущество выборочного наблюдения перед сплошным?

 

3. Почему при выборочном наблюдении неизбежны ошибки и как они классифицируются?

 

4. Какие существуют способы отбора единиц из генеральной совокупности?

 

5. Как производятся собственно- случайный, механический, типический и серийный отборы?

 

6. В чем отличие повторной и бесповторной выборки?

 

7. Что представляет собой средняя ошибка выборки?

 

8. По каким формулам определяются ошибки выборочного наблюдения?

 

9. По каким формулам определяется необходимая численность выборки, обеспечивающая с определенной вероятностью заданную точность наблюдения?

 

10. Что представляет собой малая выборка?

 

11. Каким образом определяется средняя и предельная ошибки малой выборки?