ПРЕДМЕТ И МЕТОД СТАТИСТИКИ 2 страница

в) корреспондентскийзаключается в том, что сведения в органы, ведущие наблюдения сообщают корреспонденты,

г) анкетныйсостоит в том, что определенному кругу лиц вручаются специальные анкеты. Заполнение этих анкет носит добровольный характер. Такой способ наблюдения применяется там, где не требуется высокая точность, а нужны приближенные результаты.

 

2.3. Ошибки статистического наблюдения

В процессе исследований явлений может возникать отклонение исчисленных показателей от их действительной величины, то есть могут возникать ошибки статистического наблюдения.

По источникам происхождения ошибки наблюдения можно подразделить на:

1) преднамеренные;

2) непреднамеренные, которые в свою очередь делятся на:

а) случайные;

б) систематические;

в) репрезентативности (представительности).

Преднамеренные(сознательные, злостные) получаются в результате того, что сознательно сообщаются неправильные данные. Например, сокрытие фирмами прибыли от налогообложения, искажение сведений об объеме выпускаемой продукции, приписки и т. д.

Законом предусматривается применение экономических и административных мер к предприятиям и лицам за злостные ошибки (иногда и уголовная ответственность).

Непреднамеренные случайныеошибки чаще связаны с невнимательностью регистратора, небрежностью в заполнении документов, неточностью измерительных приборов, ошибками в ответах опрашиваемых.

Непреднамеренные систематическиеошибки возникают при округлении признака в большую или меньшую сторону, при использовании ЭВМ.

Ошибки репрезентативности(представительности) свойственны несплошному наблюдению, они возникают вследствие неправильного выбора единиц для обследования, если нарушен принцип случайного отбора, и выборочная совокупность не полно характеризует генеральную.

Чтобы предупредить возникновение ошибок или уменьшить их размеры необходимо:

1) обеспечивать правильный подбор и подготовку кадров;

2) вести широкую разъяснительную работу, применять меры взыскания за искажение фактов;

3) проводить систематический контроль.

Контроль может быть счетным и логическим.

Счетный контроль заключается в проверке точности арифметических расчетов.

Логическийконтроль проводится путем сопоставления полученных данных с известными признаками, логическое осмысление, сопоставление с данными за прошлый период.

Например, о заработной плате работников предприятия можно судить по отчету по труду и по отчету о себестоимости продукции. Сведения о заработной плате должны быть одинаковыми и сопоставимыми.

 

2.4. Программно методологические вопросы

Цель наблюдения – необходимо четко формулировать цель наблюдения, чтобы избежать излишнего или неполного сбора данных.

Объект наблюдения – исследуемая статистическая совокупность.

Единица наблюдения представляет собой элемент совокупности, по которому собираются необходимые данные.

Выбор объекта и единиц наблюдения зависит от конкретных условий.

Единицы наблюдения обладают множеством различных признаков.

Статистический признак – это конкретное свойство, качество, отличительная черта единицы наблюдения.

Место наблюдения – место, где необходимо собирать данные.

Момент или период наблюдения – это время, по состоянию на которое регистрируются данные. Момент наблюдения устанавливается в соответствии с целью, особенностями наблюдения. На практике его называют также критическим моментом.

Программа статистического наблюдения – перечень показателей, характеризующих изучаемый объект.

Инструментарий программы статистического наблюденияразрабатывается для реализации программы наблюдения и включает формуляры и инструкции.

Формуляры – бланки, анкеты, табеля, формы отчетности, переписные листы и т.д.

Они могут быть: индивидуальными (содержат сведения об одной единице) и списочными (содержат данные по нескольким единицам).

Инструкции – пояснения к выполнению программы. Выпускаются в виде листков и брошюр.

В программе статистического наблюдения содержатся вопросы, на которые необходимо дать ответ в статистическом формуляре, обосновывается вид и метод проведения наблюдения. Программа, характеризующая главную цель статистического исследования, должна носить комплексный характер, дать ответы на все возникающие в процессе наблюдения вопросы.

 

Контрольные вопросы к теме:

 

1. Что такое «статистическое наблюдение», какие требования к нему предъявляются.

2. Как классифицируется статистическое наблюдение по способу организации.

3. Как классифицируется статистическое наблюдение по полноте охвате единиц совокупности.

4. Как классифицируется статистическое наблюдение по времени проведения.

5. Как классифицируется статистическое наблюдение по источникам сведений.

6. Расскажите об ошибках статистического наблюдения.

7. Раскройте основные программно-методологические вопросы статистического наблюдения.


3. СВОДКА И ГРУППРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ

 

3.1. Статистическая сводка – второй этап

статистического исследования

 

 

Статистическая сводка – это второй этап статистического исследования, под которым понимается подсчёт или систематизация данных, полученных при наблюдении (см. рис. 5. ).

 

Рис. 5. Классификация статистической сводки

Статистическая сводка различается по ряду признаков:

1) по сложности построения:

а) простая;

б) групповая;

2) по способу разработки материалов:

а) централизованная;

б) децентрализованная.

Простая сводкапредставляют собой общие итоги по изучаемой совокупности в целом без какой-либо систематизации данных, определяет общий размер изучаемого явления.

Однако, часто недостаточно простого получения общих итогов по изучаемой совокупности. Чаще всего на этой стадии вся информация систематизируется, образуются отдельные группы, т.е. осуществляется групповая сводка.

Например: разделение работников предприятия по половозрастному составу, либо по образованию, по квалификации и т.д.

При централизованной сводке все данные сосредотачиваются в одном месте и разрабатываются по определённой методике.

При децентрализованной сводке обобщение материала осуществляется снизу до верху по иерархической лестнице управления, подвергаясь на каждом из них соответствующей обработке. В настоящее время децентрализованная сводка приобретает всё большее значение, т.к. расширяется самостоятельность предприятий.

3.2. Статистическая группировка

 

Группировка - расчленение (разъединение) единиц изучаемой совокупности на однородные группы по определённым, существенным для них признакам.

 

Рис. 6. Классификация группировки

В зависимости от решаемых задач могут быть следующие виды группировок:

Типологическиеобразование социально-экономических типов явлений (например, группировка предприятий на невыполнившие и выполнившие договорные обязательства).

Структурные – позволяют проследить строение и изучаемых явлений (например, группировка работников по профессиям).

Аналитические – помогают выявлению связей между явлениями (например, зависимость качества продукции от продолжительности связей между производителями и потребителями).

Комбинированная (сложная) – образование групп по двум и более признакам (например, группировка работников предприятия по профессиям и возрасту).

Комбинированная (вторичная) – это перегруппировка по старому признаку в новые группы.

Группировочный признак

Группировочный признак (основание группировки) – это признак, по которому производится распределение единиц изучаемой совокупности на группы (см. рис 7.).

Итак, группировочные признаки можно классифицировать следующим образом:

1. По форме выражения

а) атрибутивные, не имеющие количественного значения (профессия, образование и т.д.);

б) количественные – принимающие различные цифровые значения у различных единиц изучаемой совокупности (число работающих, заработная плата и другие).

В свою очередь количественные признаки могут быть:

- дискретными (прерывными), значения которых выражаются только целыми числами (число комнат в квартире);

- непрерывными, принимающими как целые, так и дробные значения (например, сумма издержек обращения).

Рис. 7. Классификация группировочного признака

 

2. По характеру колеблемости

а) альтернативные, которыми одни единицы обладают, а другие нет (например, поставка товаров может быть качественной и некачественной);

б) Имеющие множество количественных значений (например, размер торговой площади).

3. По роли во взаимосвязи изучаемых явлений

а) факторные (воздействующие на другие признаки);

б) результативные (испытывающие на себе влияние других).

Причём признаки могут меняться ролями. В одних случаях они могут быть факторными, в других – результативными.

Так величина прибыли предприятий зависит от качества их деятельности, с другой стороны она является основным источником расширения предприятия (увеличение размера основных фондов числа работников и т.д.) Таким образом, в первом случае прибыль выступает результативным признаком, а во втором – факторным.

4. По роли в конкретном статистическом исследовании

а) основные - наиболее ярко характеризуют изучаемый объект;

б) второстепенные - также характеризуют объект, но не так ярко.

Например, основным признаком характеризующим деятельность студентов является их успеваемость, а участие в общественных мероприятиях является второстепенным признаком,интервал группировки, число групп.

Следующим важным шагом после определения группировочного признака является распределение единиц совокупности по группам. Здесь встает вопрос о количестве групп ивеличине интервала, которые между собой взаимосвязаны.

Интервал группировкиколичественно различает разность между наибольшим и наименьшим значением признака в группе.

Количество групп во многом зависит от того, какой признак служит основанием группировки.

 

Рис. 8. Интервал группировки

 

Интервалы бывают:

1. По степени колеблемости:

а) Равные–применяются при однородной совокупности, например: классификация работников цеха по дневной выработке;

б) Неравные–используются при значительной колеблемости количественных значений признака, например, будет неправильным применять равновеликий интер­вал по товарообороту для мелких, средних и крупных магазинов.

2. По способу указания границ:

а) открытые (у них указана одна граница - верхняя или нижняя);

б) закрытые (имеющие нижнюю и верхнюю границы).

Точное установление границ интервала имеют большое значение. Чаще всего они обо­значаются "от" и "до".

Вопрос об отнесении границ объекта в ту или иную группу решается двояко по принципу «включительно» и «исключительно».

Например, группы работников магазина по производительности труда обозначаются следующим образом:

1) До 90 руб.;

2) 90–120;

3) 150–180;

4) свыше 180 руб.

Применение принципов отнесения зависит от формы написания интервалов, особенно первой и последней групп.

В данном примере работника, производительность которого равна 180 руб., включают в предпоследнюю группу, поскольку ее интервал обозначен 150–180, а последний–свыше 180 руб. принцип «включительно».

Если бы запись была «180 и более», то по принципу «исключительно» работник, имею­щий выработку 180 руб., включался бы в последнюю группу.

Формула Стерджесса:

n=1+3,322lg N,

где n – число групп; N – число единиц совокупности.

Другой способ основан на применении среднего квадратического отклонения.

Если величина интервала равна 0,5 σ, то совокупность разбивается на 12 групп, когда 2/3σ – то на 9; когда σ то на 6.

Приведем пример, когда для группировки использован непрерывный признак:

 

 

Таблица 1

Распределение коммерческих банков по объявленным уставным фондам

Группы коммерческих банков по объявленным уставным фондам, млн руб. Количество коммерческих банков, в % к итогу
на 01.03.2011 на 01.03.2012
до 100 10,1 3,4
100 – 500 64,7 42,3
500 – 1000 14,1 14,8
1000 – 5000 9,3 31,4
5000 и более 1,8 8,1
Итого 100,0 100,0

 

Группы банков по объявленным уставным фондам отмечены с помощью неравных интервалов, у которых разности между верхней и нижней границами неодинаковы в разных группах.

Задача 1

Построить интервальный ряд с равными интервалами используя данные о стоимости основных фондов у 50 предприятий, млн руб.:

9,4 8.0 6,3 10,0 15,0 8,2 7,3 9,2 5,8 8,7
5,2 13,2 8,1 7,5 11,8 14,6 8,5 7,8 10,5 6,0
5,1 6,8 8,3 7,7 7,9 9,0 10,1 8,0 12,0 14,0
8.2 9,8 13,5 12,4 5,5 7,9 9,2 10,8 12,1 12,4
12,9 12,6 6,7 9,7 8,3 10,8 15,0 7,0 13,0 9,5

 

Чтобы показать распределение предприятий по стоимости основных фондов, сначала решим вопрос о количестве групп, которые мы хотим выделить. Предположим, решено выделить 5 групп заводов. Определим величину интервала в группе:

 

,

где Хмах – наибольшее значение признака; Хмin – наименьшее значение признака; n – количество интервалов.

(млн руб.).

Выделим теперь группы с интервалом 2 млн. руб. и подсчитаем число заводов в каждой группе (частоту):

Стоимость основных фондов, млн руб. Число заводов (частоты)
5–7 7–9 9–11 11–13 13–15
Итого

 

Это интервальный вариационный ряд с равными интервалами.

Контрольные вопросы к теме:

 

1. Статистическая сводка. Классификация статистической сводки.

2. Дайте определение статистической группировке. Расскажите о ее классификации.

3. Раскройте понятие «группировочный признак».

4. Расскажите об интервале группировки и его видах.

5. Какими способами определяют число групп и величину интервала.

 


ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ

 

4.1. Понятие о выборочном наблюдении

 

 

Выборочное наблюдение представляет собой один из наиболее широко применяемых видов сплошного наблюдения.

Выборочное наблюдение – это метод статистического исследования, при котором характеристика всей совокупности фактов (генеральной совокупности) дается по некоторой ее части (выборочной совокупности) (см. рис.4 )

В последние годы выборочное наблюдение широко применяется в работе органов статистики, так как это позволяет:

– сэкономить затраты средств и труда на обработку информации;

– сократить ошибки регистрации на этапе сбора данных;

– повысить оперативность получения сведений.

В отличие от других методов несплошного наблюдения (монографического наблюдения, метода основного массива) выборочное наблюдения имеет важную особенность – возможность попадания в выборочную совокупность равна для всех единиц генеральной совокупности.

Это предупреждает появление тенденциозных ошибок при формировании выборки.

 

 

4.2. Виды выборочного наблюдения

Рис. 9. Классификация выборочного наблюдения

В зависимости от способа отбора единиц различают:

повторную выборку – после отбора, какой-то единицы, она снова возвращается в совокупность и может быть снова набрана, т.е. вероятность попадания каждой отдельной единицы в выборочную совокупность остается постоянной;

бесповторную выборку– отобранная единица не возвращается обратно и возможность попадания у оставшихся единиц в выборочную совокупность постоянно возрастает.

По форме организации способа отбора выборочное наблюдение может быть:

– случайным – случайный отбор;

– механическим – отбор единиц в выборочную совокупность из генеральной производится через равные интервалы (группы);

– типическим – в выборочной совокупности более равномерно представлены различные типы (части) генеральной совокупности;

– серийным – отбираются серии единиц, которые подвергаются сплошному исследованию;

– комбинированным – комбинация нескольких форм организации выборочного наблюдения.

4.3. Ошибки выборочного наблюдения

Между характеристиками выборочной и генеральной совокупности, как правило, существует расхождение, которое называется ошибкой.

Ошибки выборочного наблюдения могут быть двух видов:

– ошибки регистрации – свойственны любому наблюдению, вызваны несовершенством измерительных приборов, недостаточной квалификацией работников и т.п.;

– ошибки репрезентативности(представительности) присущи только несплошным наблюдениям, возникают из-за того, что выборочная совокупность не точно характеризует генеральную.

Ошибка выборки зависит от следующих факторов:

– степени вариации изучаемого признака;

– численности выборки;

– метода отбора единиц в выборочную совокупность;

– принятого уровня достоверности результатов исследования.

В математической статистике доказывается, что значение средней ошибки повторной выборки равно:

1. средняя

2. среднее квадратическое отклонение выборочное или генеральное

где µ − ошибка выборки; δ2 − дисперсия (средний квадрат отклонений); n − объем выборки (число обследованных единиц).

При бесповторном отборе формула средней ошибки выборки принимает вид:

,

где N – объем генеральной совокупности.

Предельная ошибка выборки , где t – коэффициент доверия. Определяется по справочным таблицам в зависимости от уровня вероятности.

В целом ряде случаев средние и относительные величины для какой-либо совокупности рассчитываются на основе данных выборочного наблюдения, суть которого заключается в том, что из генеральной совокупности, наудачу, чисто случайно, отбирается n единиц, составляющих выборочную совокупность; для отобранных единиц рассчитываются обобщенные характеристики (средние или относительные показатели), а затем результаты выборочного обследования распространяются на всю генеральную совокупность. Основной задачей при этом является определение ошибок выборки, т.е. возможных расхождений между выборочной средней ( ) и генеральной ( ) или выборочной долей единиц (w), обладающих изучаемым признаком, и генеральной долей (p).

Различают среднюю и предельную ошибки выборки.

Средняя ошибкавыборки (µ) характеризует среднюю величину возможных расхождений выборочной и генеральной средней (или доли) и представляет собой по форме и содержанию среднее квадратическое отклонение возможных значений выборочной средней от генеральной.

В математической статистике доказывается, что - дисперсия возможных значений выборочной средней – в n раз меньше дисперсии изучаемого признака и генеральной совокупности, т.е. .

Исходя из этого средняя ошибка выборочной средней при повторном отборе определяется по формуле:

,

где - дисперсия изучаемого показателя в генеральной совокупности (т.к. дисперсия изучаемого показателя в генеральной совокупности неизвестна, то фактически в формулу подставляется дисперсия выборочная, которая при большом числе наблюдений близка к генеральной), а n – объем (численность) выборки.

Как видно из формулы, средняя ошибка выборки (µ) при повторном отборе зависит от показателя вариации ( ) и от объема выборки (n).

Средняя ошибка выборочной доли определяется по формуле:

,

где w – выборочная доля единиц, обладающих изучаемым признаком, а w(1 − w) – дисперсия доли (альтернативного признака).

При бесповторном отборе в формулах под знаком радикала появляется множитель ,

где N –численность генеральной совокупности.

Говоря об ошибках выборки, следует иметь в виду, что в каждой конкретной выборке разность может быть меньше, больше или равна µ. И вероятность каждой такой ошибки различна.

Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки.

Предельная ошибка выборки, обозначаемая через , рассчитывается как

,

где µ − средняя ошибка выборки, t – коэффициент доверия.

При бесповторной выборке формула ошибки выборки имеет вид:

,

где δ2 – межсерийная дисперсия; s – число отобранных серий;S –число серий в генеральной совокупности.

Все рассмотренные выше формулы используются при так называемой большой выборке.

Если n < 20 (у некоторых авторов n <30), то выборка именуется малой и при расчете ошибок выборки необходимо учитывать следующие моменты. Во-первых, в формуле средней ошибки в знаменателе принимается n – 1, т.е.

.

И, во-вторых, при нахождении вероятности допуска той или иной ошибки или определении доверительных интервалов исследуемого показателя в генеральной совокупности пользуются таблицами вероятность Стьюдента, где определяется в зависимости от объема выборки и t.

Формулы предельной ошибки выборки позволяют решить следующие три задачи:

1. Определить доверительные пределы.

для генеральной средней:

;

для доли:

.

2. Определить вероятность допуска той или иной заданной ошибки .

В этом случае определяется и по таблице (при n>20) находится вероятность (P).

3. Определить необходимую численность выборки (n), обеспечивающую с определенной вероятностью заданную точность ( ).

Формулы для n определяются из соответствующих формул предельной ошибки.

Так, для определения средней ( ) из формулы при повторном отборе имеем:

,

Для доли аналогично из получаем:

.

При бесповторном отборе из и имеем:

− для средней ( );

− для доля (w).

Как видно, в формулах для определения необходимой численности выборки, получаемых из формул случайной ошибки выборки, предполагается обязательное знание величины дисперсии признака ( ) или [w (1 – w)].

Обычно в этих формулах используется значение дисперсии признака в аналогичных предшествующих исследованиях или же проводится пробное обследование небольшого числа единиц, для которых определяется значение . В случае изучения доли определенных единиц в совокупности при отсутствии каких-либо сведений о дисперсии принимается максимальное значение [w (1 – w)], равное 0,25.

Рассмотрим решение некоторых задач к этой теме с применением формул предельной ошибки выборки.

Задача 1.

Методом собственно случайной выборки обследована жирность молока у 100 коров. По данным выборки средняя жирность молока оказалась равной 3,64%, а дисперсия составила 2,56.