Распространение выборочных данных на всю совокупность
Результаты всякого выборочного обследования должны быть распространены на всю генеральную совокупность. Это конечная практическая цель всякого выборочного наблюдения. Расчет объемных показателей генеральной совокупности на основе данных выборочного наблюдения называется в статистике распространением выборочных характеристик на всю совокупность.
Существует два способа такого распространения: способ прямого пересчета и способ коэффициентов.
Способ прямого пересчета заключается в том, что средние или частности выборочной совокупности умножаются на число единиц генеральной совокупности:
Например, средние затраты времени на изготовление 1 изделия по данным выборки ( ) составляют 24 мин, ошибка выборки (D) – 0,3 мин.
Тогда общие затраты времени на выпуск всех (N) изделий с той или иной вероятностью составят – Х = (24 ± 0,3) мин/шт – 10 000 шт, т.е. находятся в пределах от 3950 до 4050 часов.
Способ коэффициентов обычно применяют при проведении выборочного наблюдения для проверки и уточнения данных сплошного обследования. В этом случае сопоставляются данные выборки и сплошного обследования, вычисляют поправочный коэффициент. Эти коэффициентом и пользуются для внесения поправок в материалы сплошного наблюдения, в честности численности учтенных единиц совокупности.
При этом используется формула:
,
где N1– численность совокупности с поправкой на недоучет; N0– численность совокупности без этой поправки; n0– численность совокупности в контрольных точках по первоначальный данным; n1– численность совокупности в тех же точках по данным контрольных обходов.
Например, на 1 января текущего года по данным сплошного учете скота в хозяйствах населения в 40 населенных пунктах зарегистрировано 9300 коров. В результате контрольных обходов в четырех населенных пунктах оказалось 124 коровы против 812, зарегистрированных по данным учета. Следовательно, поголовье коров в целом по району с поправкой на недоучет составит:
голов.
Контрольные вопросы и задания
1. Какое наблюдение называется выборочным?
2. В чем преимущества выборочного метода в сравнения с другими видами статистического наблюдения?
3. Какие вопросы необходимо решать для проведения выборочного наблюдения?
4. Что означает ошибка репрезентативности, какие факторы определяют ее величину?
5. Каковы условия правильного отбора единиц совокупности при выборочном наблюдении?
6. Как производятся собственно-случайный, механический, типический и серийный отборы?
7. В чем различие повторной и бесповторной выборки?
8. Что представляет собой средняя ошибка выборки (для средней и доли)?
9. По каким расчетным формулам находят средние ошибки выборки (для средней и доли) при повторном и бесповторном отборе?
10. Что характеризует предельная ошибка выборки, и по каким формулам она исчисляется?
11. Что показывает коэффициент доверия?
12. По каким формулам определяется необходимая численность выборки, обеспечивающая с определенной вероятностью заданную точность наблюдения?
13. Какими способами осуществляется распространение результатов выборочного наблюдения на всю совокупность?
14. Назовите важнейшие области применения выборочного метода в практике государственной статистики.
7. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
7.1. Понятие корреляционной зависимости. Основные задачи корреляционного анализа. Способы выбора формы связи между факторными и результативными признакамиОшибка! Закладка не определена.
Проще всего понять сущность корреляционной зависимости на примере.
Стоимость ОФ, млн р. | Реализация путевок по отелям, млн р. | ||||
№1 | №2 | №3 | №4 | В среднем | |
6,0 | 2,4 | 2,8 | 2,0 | 2,2 | 2,4 |
7,0 | 2,5 | 2,8 | 3,0 | 3,1 | 2,9 |
8,0 | 3,2 | 3,0 | 3,5 | 3,8 | 3,4 |
9,0 | 5,0 | 4,8 | 4,6 | 5,2 | 4,9 |
Имеются данные о стоимости ОФ отелей и реализации ими путевок.
Таблицы такого вида называются корреляционными (т.е. отражают зависимость показателей).
Переменные X и Y связаны корреляционной зависимостью, если каждому значению одной из них соответствует ряд распределения другой. При этом связь между факторными и результативными признаками проявляется через изменения средних величин (см. пример).
Важной особенностью корреляционных связей является то, что они обнаруживаются не в единичных случаях, а в массе, что требует для исследования наличия значительного количества данных (не менее 15–20).