Результаты выборочного обследования доходов населения
Район | Численность населения, чел. | Обследовано, чел. | Доход в расчете на 1 человека | |
средняя, тыс. руб. | дисперсия | |||
120 000 | 2,9 | 1,3 | ||
170 000 | 2,5 | 1,1 | ||
90 000 | 2,7 | 1,6 |
Определите границы среднедушевых доходов населения по области в целом при уровне вероятности 0,997.
Решение.
Рассчитаем среднюю из внутригрупповых дисперсий:
=
Определим среднюю и предельную ошибки выборки:
Рассчитаем выборочную среднюю:
тыс. руб.
В результате проведенных расчетов с вероятностью 0,997 можно сделать вывод, что среднедушевые доходы жителей данной области находятся в следующих границах (тыс. руб.):
2,67-0,04 ≤ ≤ 2,67+0,04
или
2,63≤ ≤2,71.
· При определении необходимого объема типической выборки учитывается средняя из внутригрупповых дисперсий:
n= (повторный отбор);
n= (бесповторный отбор).
Полученное значение общего объема выборки необходимо распределить по типическим группам пропорционально их численности, чтобы определить, какое количество единиц следует отобрать из каждой группы:
,
где - объем i-й группы;
-объем выборки из i-й группы.
Ø Серийная выборка.
· В основе расчета средней ошибки серийной выборки лежит межгрупповая дисперсия:
( повторный отбор);
( бесповторный отбор),
где r- число отобранных серий;
R- общее число серий.
Межгрупповую дисперсию при равновеликих группах вычисляют следующим образом:
,
где - средняя i-й серии;
х- общая средняя по всей выборочной совокупности.
Например. В целях контроля качества комплектующих из партии изделий, упакованных в 50 ящиков по 20 изделий в каждом, была произведена 10%- ная серийная выборка. По попавшим в выборку ящикам среднее отклонение параметров изделия от нормы соответственно составило 9мм, 11, 12, 8 и 14мм. С вероятностью 0,954 определите среднее отклонение параметров по всей партии в целом.
Решение.
Рассчитаем выборочную среднюю:
мм.
Определим величину межгрупповой дисперсии:
С учетом установленной вероятности Р= 0,954 (t=2) предельная ошибка выборки составит :
мм.
Произведенные расчеты позволяют заключить, что среднее отклонение параметров всех изделий от нормы находится в следующих границах:
(10,8 -1,8) мм ≤ ≤ (10,8-1,8) мм.
· Для определения необходимого объема серийной выборки при заданной предельной ошибке используются следующие формулы:
r = (повторный отбор);
r= (бесповторный отбор).
5. Малая выборка представляет собой несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности.
Объем малой выборки обычно не превышает 30 единиц и может доходить до 4-5 единиц.
Величина ошибки малой выборки определяется по формулам, отличным от формул выборочного наблюдения со сравнительно большим объемом выборки (n=100). Средняя ошибка малой выборки вычисляется по формуле:
,
где - дисперсия малой выборки.
Вычисление дисперсии малой выборки производится с учетом так называемого числа степеней свободы (под которым понимается количество вариантов, которые могут принимать произвольные значения, не меняя величины средней). При определении дисперсии число степеней свободы равно n-1:
.
Предельная ошибка малой выборки определяется по формуле:
.
При этом значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Для отдельных значений t и n доверительная величина малой выборки определяется по специальным таблицам Стьюдента, которые приводятся в учебниках по математической статистике. Приведем некоторые значения из этих таблиц табл.4.
Таблица 4
n | t | ||||
0,5 | 1,0 | 1,5 | 2,0 | 3,0 | |
0,347 | 0,609 | 0,769 | 0,861 | 0,942 | |
0,362 | 0,637 | 0,806 | 0,898 | 0,970 | |
0,368 | 0,649 | 0,823 | 0,914 | 0,980 | |
0,371 | 0,657 | 0,832 | 0,923 | 0,985 | |
0,376 | 0,666 | 0,846 | 0,936 | 0,992 | |
0,377 | 0,670 | 0,850 | 0,940 | 0,993 |
Согласно табл.4 по мере увеличения объема выборки распределение Стьюдента приближается к нормальному и при 20 оно уже мало отличается от нормального распределения.
При проведении малых выборочных обследований важно иметь в виду, что чем меньше объем выборки, тем больше различие между распределением Стьюдента и нормальным распределением. При минимальном объеме выборки. При минимальном объеме выборки ( n=4) это различие весьма существенно, что указывает на уменьшение точности результатов малой выборки.
Поскольку при проведении малой выборки в качестве доверительной вероятности практически принимается значение 0,95 или 0,99, то для определения предельной ошибки выборки исчисляются показания распределения Стьюдента представленные в таблице 5.
Таблица 5
n | ||||||||||
t | 0,95 | 3,183 | 2,777 | 2,571 | 2,447 | 2,364 | 2,307 | 2,263 | 2,119 | 2,078 |
0,99 | 5,841 | 4,604 | 4,032 | 3,707 | 3,500 | 3,356 | 3,250 | 2,921 | 2,832 |
Например. При контрольной проверке качества поставленной в торговлю колбасы получены следующие данные о содержании поваренной соли в пробах, %: 4,3; 4,2; 3,8; 4,3; 3,7; 3,9; 4,5; 4,4; 4,0; 3,9.
По данным выборочного обследования установить с вероятностью 0,95 предел, в котором находится средний процент содержания поваренной соли в данной партии товара.
Решение.
Определим среднюю пробу малой выборки:
Рассчитаем дисперсию и итоги расчетов представим в виде таблицы :
Пробы | х- | |
4,3 | 0,2 | 0,04 |
4,2 | 0,1 | 0,01 |
3,8 | 0,3 | 0,09 |
4,3 | 0,2 | 0,04 |
3,7 | -0,4 | 0,16 |
3,9 | -0,2 | 0,04 |
4,5 | 0,4 | 0,16 |
4,4 | 0,3 | 0,09 |
4,0 | -0,1 | 0,01 |
3,9 | -0,2 | 0,04 |
- | 0,68 |
=
Определим среднюю ошибку малой выборки:
=
Исходя из численности выборки (n=10) и заданной вероятности t=0,95 устанавливается по распределению Стьюдента (см. табл.5) значение коэффициента доверия t=2,263 .
Предельная ошибка малой выборки составит:
=2,263 ( =
Следовательно, с вероятностью 0,95 можно утверждать, что во всей партии колбасы содержание поваренной соли находится в пределах:
, т.е. от 4,1 - 0,2 % = 3,9 % до 4,1 + 0,2 % = 4,3 %.
Контрольные вопросы:
1. Какое наблюдение называется выборочным?
2. В чем преимущество выборочного наблюдения перед сплошным?
3. Почему при выборочном наблюдении неизбежны ошибки и как они классифицируются?
4. Какие существуют способы отбора единиц из генеральной совокупности?
5. Как производятся собственно- случайный, механический, типический и серийный отборы?
6. В чем отличие повторной и бесповторной выборки?
7. Что представляет собой средняя ошибка выборки?
8. По каким формулам определяются ошибки выборочного наблюдения?
9. По каким формулам определяется необходимая численность выборки, обеспечивающая с определенной вероятностью заданную точность наблюдения?
10. Что представляет собой малая выборка?
11. Каким образом определяется средняя и предельная ошибки малой выборки?