Точность статистического наблюдения

Под точностью в статистике понимают степень соответствия дан­ных, полученных в результате статистического наблюдения, реаль­ным их значениям. Возникающие расхождения между данными ста­тистического наблюдения и реальными значениями признака назы­ваются ошибками. Ошибки определяются как разность или как отношение между этими значениями. Как правило, ошибки возни­кают в результате следующих причин: ошибки при регистрации, ошибки при измерении. Следует отметить, что ошибки наблюдения наиболее опасны, поскольку их достаточно тяжело исправить, и они оказывают огромное влияние на дальнейшие расчеты.

В статистике выделяют ошибки регистрации и ошибки репрезен­тативности.

Ошибки регистрациивозникают вследствие неправильного уста­новления фактов в процессе наблюдения, или ошибочной их записи, или того и другого вместе. Ошибки регистрации могут иметь место как при сплошном, так и при несплошном наблюдении. При несплошном наблюдении возникают так называемые ошибки репрезентативности,или как их еще называют ошибки представительности. Они заключа­ются в том, что значения признаков по отобранной выборочной сово­купности не отражают реально существующей картины.

В зависимости от характера ошибки наблюдения бывают случай­ными и систематическими.

Случайные ошибки возникают случайным образом, в результате опечаток, описок, оговорок и т. п. Например, при регистрации регист­ратор в записи даты рождения вместо 15 июня написал 15 июля. При достаточно большом числе наблюдений благодаря действию закона больших чисел эти ошибки более или менее взаимно погашаются.

Систематические ошибки наиболее опасны, поскольку действуют только в одном направлении и приводят к сильному искажению дан­ных. Наиболее показательной систематической ошибкой являются ошибки при переписи населения, которые заключаются в том, что населению свойственно округлять свой возраст на цифры оканчи­вающиеся на 5 или 0. К этому же виду ошибок можно отнести сокры­тие реальных размеров финансовых результатов производствен­но-хозяйственной деятельности экономическими субъектами, стремление респондентов указать заниженное значение своего воз­раста и т. п.

С целью выявления ошибок проводят контроль полученных мате­риалов. С этой целью после проведения наблюдения весь собранный материал проверяют на полноту охвата объекта наблюдением и на ка­чество заполнения формуляров и других документов наблюдения. В последнем случае используют два вида контроля: логический и арифметический.

При контроле полноты охвата объекта наблюдения устанавлива­ется, от всех ли единиц совокупности, подлежащих наблюдению, по­лучены данные. Если выявлена неполнота охвата объекта наблюде­нием, дальнейшие действия зависят от того, представляется возмож­ным восполнение пробелов или нет.

Логический контрольсостоит в сопоставлении между собой отве­тов на вопросы формуляра наблюдения и выяснения их логической совместимости. При обнаружении несовместимых ответов пытаются путем дальнейших сопоставлений с ответами на другие вопросы или каким-либо иным путем установить, какой из ответов является не­правильным.

Арифметический контрольсостоит в проверке различных расчетов, результаты которых проведены в формуляре наблюдения, в частно­сти, итогов, вычисления процентов, расчетов средних величин и т. п.

Контрольный тест

1. Основными принципами статистического наблюдения являются:

а) планомерность, массовость, научная организация;

б) повторяемость, закономерность, организация;

в) планомерность, закономерность, массовость;

г) повторяемость, организованность, научное обоснование;

2. Одной из форм статистического наблюдения является:

а) отчетность;

б) социологический опрос;

в) регистрация транспортных средств в ГИБДД;

г) выборы президента РФ.

3. По охвату единиц совокупности статистическое наблюдение бывает:

а) сплошное;

б) непосредственное;

в) непрерывное;

г) единичное.

4. Критическим моментом статистического наблюдения называется:

а) период времени, в течение которого проводится наблюдение;

б) момент времени, по состоянию на который проводится наблюдение;

в) момент времени, с которого начинается наблюдение;

г) момент времени, когда должно окончится наблюдение.

5. План статистического наблюдения включает:

а) программно-методологический раздел;

б) учебный раздел;

в) разработочный;

г) подготовительный раздел.

6. Единовременным называется наблюдение:

а) проводимое только один раз;

б) проводимое время от времени по мере необходимости;

в) проводимое только один раз в год;

г) проводимое только в течение одного дня.

7. Перечень признаков (или вопросов), подлежащих регистрации в процессе наблюдения,
называется:

а) статистическим формуляром;

б) планом наблюдения;

в) инструментарием наблюдения;

г) программой наблюдения.

8. Объектом статистического наблюдения называется:

а) совокупность единиц наблюдения, подлежащих статистическому исследованию;

б) первичная ячейка совокупности, от которой должны быть получены сведения в про­цессе наблюдения;

в) совокупность явлений и процессов, реально существующих во времени и простран­стве;

г) население РФ

9. Ошибки репрезентативности возможны только при:

а) сплошном наблюдении;

б) выборочном наблюдении;

в) единовременном наблюдении;

г) периодическом наблюдении.

10. При большом объеме совокупности в определенной степени взаимопогашаются:

а) арифметические ошибки наблюдения;

б) логические ошибки наблюдения;

в) систематические ошибки наблюдения;

г) случайные ошибки наблюдения.

 

Тренировочные задания

№ п\п Задание
Определите форму и вид статистического наблюдения:
Годовая отчетность промышленных предприятий о проиводственно-хозяйственной деятельности
Ежедневная регистрация пациентов, поступивших в стационар лечебного учреждения
Перепись крупного рогатого скота
Определите объект и единицу статистического наблюдения
Перепись населения страны
Обследование сельхозпроиводителей Омской области
Обследование уровня жизни жителей Саратовской области
С помощью логического и арифметического контроля выявите ошибки в следующем формуляре (дата заполнения формуляра – 1 марта 2004 года)
1. Пол
Женский
2. Возраст
8 лет
3. Национальность
русская
4. Дата рождения
5 марта 1955 года
Сформулируйте цель проведения статистического наблюдения
Перепись населения
Обследование сельхозпроиводителей Омской области

 

 

1.2. Требования, предъявляемые

к статистическим данным. Формы и виды

статистического наблюдения

Основной задачей государственной статистики является фор­мирование государственных информационных ресурсов. Это до­стигается посредством статистического наблюдения. Адекватность отражения важнейших социально-экономических процессов, про­исходящих в стране, во многом зависит от используемых методов сбора и обработки первичных данных. В настоящее время нет стан­дартного определения качества данных, принято отмечать два ос­новных требования к материалам статистического наблюдения: до­стоверность и сопоставимость.

Достоверность — это соответствие первичных данных фактиче­скому положению. Исходя из практической потребности, достовер­ность обычно описывают в терминах ошибок. Для предупреждения ошибок наблюдения выявляют их виды и причины возникновения. Ошибки наблюдения подразделяют на два вида: ошибки регистра­ции и ошибки репрезентативности.

Ошибки регистрации — это погрешности, которые возможны независимо от вида наблюдения. Они бывают случайными и си­стематическими (тенденциозными). Существуют преднамеренные ошибки, причиной которых становится сознательное искажение данных. Непреднамеренные ошибки, как правило, носят случай­ный характер, они могут возникнуть в результате низкой квалифи­кации работников.

Ошибки репрезентативности присущи только выборочному на­блюдению. Причина их возникновения заключается в том, что вы­борочная совокупность недостаточно точно отображает состав всей изучаемой совокупности. Подробнее о таких ошибках говорится в гл. 5.

Сопоставимость статистических данных рассматривается в раз­ных аспектах:

1) сопоставимость в рамках одного наблюдения;

2) сопоставимость данных разных наблюдений;

3) сравнимость с данными прошлых исследований.

Причины различий могут быть вызваны организационно-ме­тодологическими факторами, влияющими на изменение методики сбора данных, времени регистрации и т.п.

В настоящее время устанавливается более широкое понятие ка­чества статистических данных с точки зрения их адаптации к по­требностям пользователей. К компонентам такого определения ка­чества, наряду с сопоставимостью и достоверностью, относятся востребованность, доступность, интерпретируемость.

Достижение необходимого уровня качества результатов стати­стической деятельности требует соблюдения научно разработан­ных методик сбора, обработки и распространения статистических данных (включая соответствие принятым международным стан­дартам).

Статистическое наблюдение — первая стадия статистическо­го исследования, представляющая собой организованный по еди­ной программе сбор данных о социально-экономических явлениях и процессах путем регистрации их существенных признаков с це­лью получения первичной статистической информации.

Различают формы организации и виды статистического наблю­дения, источники получения первичных данных и способы сбора данных.

К формам организации относятся:

— отчетность;

—специально организованное наблюдение.
Виды наблюдения делят:

— по времени регистрации фактов на непрерывное (текущее),
периодическое и единовременное;

—охвату единиц на сплошное и несплошное.
Источниками получения первичных данных являются:

—непосредственное наблюдение;

—документальный способ;

—опрос.

К способам сбора данных относятся:

—экспедиционный;

—саморегистрация;

—корреспондентский.

Организация статистического наблюдения предполагает реше­ние определенных программно-методологических вопросов:

• конкретизация цели и формулировка задач статистического
исследования;

• составление программ наблюдения и разработки полученной статистической информации;

• ограничение обследуемой совокупности (установление ее ра­мок);

• создание статистической основы (для выборочного наблюде­ния — основы выборки), определение ее единицы и единицы на­блюдения;

• выбор метода наблюдения (для выборочного наблюдения — установление оптимального процента отбора);

• формирование выборочной совокупности;

• сбор и редактирование первичной информации, включающее логический и арифметический способы контроля, основанные на
соотношениях между связанными пунктами вопросника и допу­стимыми значениями статистических признаков, представленных респондентами.

 

Количественные признаки могут выражаться дискретными или непрерывными величинами, соответственно, и вариационный ряд будет либо дискретным, либо интервальным (непрерывным в пределах интервала). Так, количество детей в семье может выражаться только целыми числами, а вес человека может отличаться от веса другого на сколь угодно малую величину, определяемую точностью измерения.

При построении вариационного ряда непрерывного признака невозможно указать абсолютно точное значение варианта, поэтому совокупность распределяется по интервалам его значений. Интервалы можно брать как равные, так и неравные. Для каждого из них указывается частота или частость, т.е. абсолютное или относительное число единиц, у которых значение признака находится внутри данного интервала.

Первый и последний интервалы рядов чаше всего берутся открытыми. Использование открытых интервалов удобно, когда в совокупностях встречается незначительное число единиц с очень малыми или очень большими значениями вариантов, резко отличающимися от всех остальных значений.

Если построен ряд с равными интервалами, то частоты дают представление о том, как заполнен единицами совокупности тот или иной интервал. При сравнении частот ряда с неравными интервалами для характеристики их заполненности рассчитывают плотность распределения. Средняя плотность в интервале — это частное от деления частоты или частости на величину интервала: в первом случае получается абсолютная, во втором — относительная плотность распределения. Средняя плотность показывает, сколько единиц (или сколько процентов единиц) совокупности приходится на единицу изменения варианта.

Для характеристики распределения используют также накопленные частоты. Если вместо абсолютных частот взять частости, то аналогично получим накопленные частости.

Накопленная частота (частость) для данного варианта или для верхней границы данного интервала получается суммированием (накапливанием) частот (частостей) всех предшествующих интервалов, включая данный. Накопленная частота показывает, какое число единиц имеет значение признака, не большее данной варианта или верхней границы интервала. Частота, частость, плотность и накопленная частота вариационного ряда — это различные функции от величины варианта.

Зависимость частот, иди, точнее, плотностей распределения от величины вариантов в идеальном случае может быть представлена в виде некоторой функции, изображаемой графически кривой определенною вида. Любое реальное распределение можно также изобразить схематически в виде некоторой кривой, воспроизводящей основные особенности данного распределения. В зависимости от вида кривых, изображающих распределение, выделяют несколько основных типов распределений. Прежде всего распределения по виду их графического изображения можно разделить на одновершинные и многовершинные. К одновершинным относятся те, в которых один, обычно центральный, вариант имеет наибольшую частоту (точнее, наибольшую плотность распре­деления), частоты же остальных вариантов убывают по мере удаления от центрального. Если частоты убывают одинаково и справа и слева от центрального значения, то такие распределения называются симметричными. Если частоты убывают слева и справа от центра распределения с разной скоростью, то такие распределения называют асимметричными, выделяя при этом распределения, растянутые вправо и влево. Степень асимметрии может быть различной: от совершенно незначительной до крайней, при которой наибольшая частота относится к одному из крайних значений вариантов — самому большому или, наоборот, наименьшему. Различные виды распределений представлены на рис. 3.1.

 

РИСУНОК НЕ ОТСКАНИРОВАЛСЯ

 

 

Идеальное симметричное распределение крайне редко встречается на практике. Достаточно близки к нему распределения мужчин и женщин по несу или росту (при достаточно большом количестве людей, включенных в совокупность). Основная масса распределений, с которыми приходится иметь дело экономисту. — это асимметричные распределения с разной степенью асимметрии.

Многовершинные распределения - это распределения, в которых несколько центров, т.е. такие, у которых несколько максимумов частот. Многовершинность распределения часто является свидетельством того, что совокупность состоит из неоднородных, с точки зрения изучаемою признака, единиц. Поэтому, убедившись в том. что распределение имеем более чем один максимум частоты, исследователь должен тщательно проверить, можно ли считать однородными единицы совокупности.

В практической деятельности очень важно фактическое распределение (структуру совокупности) привести к известному теоретическому. Обычно в экономических расчетах апроксимируют к таким теоретическим распределениям, как:

нормальное

равномерное

показательное

распределение Пуассона (для дискретных распределений)

Возникает задача проверки соответствия выбранной кривой для представления фактической структуры. т.е. проверки тою, действительно ли различия между теоретической и эмпирической кривой распределения настолько малы, что их можно считать случайными, а не закономерными.

Наиболее известный метод проверки соответствия факти­ческого ряда распределения теоретическому — применение критерия согласия Пирсона. Определяем …. Сравниваем Х²расч с Х²табл при заданном уровне значимости и числе степеней свободы. Если Х²расч < Х²табл , можно считать, что фактическое распределение адекватно теоретическому. Например, имеется следующий интервальный ряд распределения рабочих цеха по уровню заработной платы:

 

Уровень заработной платы, руб. Численность рабочих

До 200 10

200-250 20

250-300 40

300-350 20

350 и более 10

Итого 100

 

Предполагая, что распределение рабочих но уровню заработной платы является нормальным, рассчитаем теоретические частоты распределения (табл. 3.1)

 

Расчет теоретических частот распределения

 

X — f факт   х´ f факт (х´)² f факт   f (t)* Г твор = Округлен-
середины интервалов         = f (t) К= ные теоре-
            = f (t)• 91,29 тические
                частоты
                 
-2 -20 -1,823 0,0761 6,947
-1 -20 20 -0,913 0,2637 24,073
0,0 0,3989 36,416
0,913 0,2637 24,073
1,823 0,0761 6,947
Итого        

· Здесь f (t) — плотность нормального распределения. Для определения используются либо таблицы f (t),. либо непосредственно формула плотности f (t)

Рассчитаем х и а метолом моментов, где центральный момент А = 275, а величина интервала i = 50; x¯ = 275 + 50-0 = 275;

Ð = 50 √(120/100)-0 =54,77

где а — уровень значимости; v — число степеней свободы; L — число групп; r — число параметров распределения;

X²расч < X²табл = распределение является нормальным.

Аналитическая (факторная) группировкапредназначена для установления тесноты связи между взаимодействующими признаками — факторным и результативным. Она позволяет выявить наличие и направление связи, а также измерить ее тесноту и силу. Методологическими вопросами построения факторной группировки являются выбор группировочного признака, определение числа групп и величины интервала, выбор системы показателей для характеристики групп. Если типологическая группировка, преследующая цель разграничения качественно однородных совокупностей, должна отвечать их объективной качественной природе, то для аналитической группировки, цель которой исследование взаимосвязи признаков, такого объективного критерия нет. Поэтому в качестве группировочного чаше всего принимают факторный признак, выделенный на основе априорного анализа. Интервалы в аналитической группировке берутся преимущественно равные либо равнонаполненные (группы с приблизительно одинаковой частотой). Величина интервала рассчитывается так же, как при построении структурной группировки. Среди показателей групп обязательным является среднее значение результативного показателя по каждой группе. Теснота связи оценивается сравнением вариации этих средних значений с обшей дисперсией резуль­тативного показателя. Эмпирический коэффициент детерминации определяется как