Группировка статистического материала

Общее представление о сводке и группировке

Сводка — особая стадия статистического исследования, в ходе которой систематизируются первичные материалы статистического наблюдения. Сводка бывает простая, когда это операция по подсчету итоговых данных по совокупности единиц наблюдения и, соответственно, оформление полученного материала в виде таблицы. Сложная сводка представляет собой комплекс операций, включающих распределение единиц наблюдения изучаемого явления на группы, составление системы показателей для характеристики выделенных групп и подгрупп изучаемой совокупности явлений, подсчет итогов в каждой группе и подгруппе, оформление результатов работы в виде статистических таблиц. Итак, компоненты сложной сводки — это:

- программа проведения (составления) сводки;

- группировочный признак и само группирование;

- система показателей, характеризующая изучаемую совокупность и каждую выделенную группу;

- подсчет итогов в группах, подгруппах и в целом по совокупности;

- статистические таблицы, представляющие результаты сводки.

Нередко, упрощая, разбивают проведение сводки на следующие три этапа:

1. предварительный контроль материалов, т.е. проверка исходных данных;

2. группировка данных по заданным признакам и определение производных показателей;

3. оформление результатов сводки в виде статистических таблиц, удобных для восприятия информации.

Программа сводки содержит перечень групп, на которые может быть разбита или разбивается совокупность единиц наблюдения по отдельным признакам, а также систему показателей, характеризующих изучаемую совокупность явлений в целом и отдельных ее частей. Программа сводки включает следующие этапы ее проведения:

1. выбор группировочного признака для образования однородных групп;

2. определение порядка формирования и числа групп;

3. разработка системы статистических показателей для характеристики групп и объекта в целом;

4. разработка макетов статистических таблиц для представления результатов сводки.

Кроме программы сводки составляется план проведения сводки. План проведения статистической сводки содержит информацию о последовательности, сроках и технике ее проведения, а также об исполнителях, порядке и правилах оформления ее результатов в виде статистических таблиц.

По форме и способу обработки статистических данных различают децентрализованную и централизованную сводки. Если данные наблюдений обрабатываются на местах, т.е. отчеты предприятий сводятся в единые формы статистическими органами субъектов РФ, а полученные итоговые формы поступают в Росстат РФ и в нем определяются итоговые показатели в целом по всей стране, то имеем децентрализованную статистическую сводку. Если же все первичные статистические данные сначала собираются в центральной организации и в ней подвергаются полной обработке от начала и до конца, то имеем централизованную сводку.

Группировка статистического материала

Одним из основных наиболее распространенных методов обработки и анализа первичной статистической информации является группировка.

Под группировкой понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучения структуры и взаимосвязей.

Признак, на основе которого производится подразделение единиц наблюдения на группы, называется группировочным признакомили основанием группировки. Группировка — это разделение единиц совокупности на группы по выбранным варьирующим признакам.

Группировки различают по:

- задачам систематизации данных;

- числу группировочных признаков;

- используемой информации.

Статистической группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким признакам на однородные группы, различающиеся между собой в качественном и количественном отношении и позволяющие выделить социально-экономические типы явлений, исследовать структуру совокупности или проанализировать взаимосвязи и зависимости между признаками. Группировки являются важнейшим инструментом формирования обобщающих статистических показателей. Группировка — важнейший компонент статистической сводки. В следующих лекциях мы увидим, что группировка играет весьма важную роль в формировании статистического ряда распределения, а правильное ее использование очень существенно для исчисления взвешенных средних.

По числу группировочных признаков (способу построения) различают простые (по одному признаку) и сложные (по нескольким признакам — комбинационные и многомерные) группировки. Комбинационные группировки строятся путем разбиения каждой группы на подгруппы в соответствии с дополнительными признаками. При построении комбинационных группировок сначала разделяют по атрибутивным признакам, а уже затем разбивают полученные группы на подгруппы по количественному признаку.

Многомерные группировки строятся с помощью специальных алгоритмов, когда ищутся скопления в N-мерном пространстве, где каждый объект — точка, т.е. построить многомерную группировку — найти скопление точек. Для решения таких сложных задач построения многомерной группировки успешно применяются методы прикладного искусственного интеллекта — методы распознавания образов.

По задачам систематизации данных различают: типологические, структурные и аналитические.

Типологические группировки предназначены для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности. Типологическая группировка разбивает разнородную совокупность единиц наблюдения на качественно однородные группы (классы, типы явлений). При ее построении в качестве группировочных признаков могут использоваться количественные и атрибутивные признаки.

Структурные группировки — это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации. Другим примером структурной группировки является группировка отраслей экономики в топливно-энергетическую, нефтехимию, аграрно-промышленный комплекс, горнодобывающую, телекоммуникационную, транспортную, металлургию, оборонные отрасли и т.п. По своей природе структурная группировка является также достаточно общей, хотя в отдельных случаях по общности она и уступает типологическим группировкам.

Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие признаки, т.е. признаки, которые изменяются под влиянием факторных признаков, и факторные признаки, т.е. те, зависимость результирующих признаков от которых исследуется. Аналитическая группировка отличается следующими особенностями: единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними значениями результативного признака, по изменению величины которых определяется наличие связи и зависимостей между признаками. Каждая выделенная группа должна содержать статистически однородные единицы совокупности по группировочному признаку. Количество единиц в каждой выделенной группе должно быть достаточным для получения надежных статистических характеристик исследуемого явления или процесса.

По используемой информации различают первичные и вторичные группировки.

Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

Вторичные группировки — результат объединения или расщепления первичных группировок, они позволяют преодолевать несопоставимость исходных данных в первичных группировках и тем самым объединять их в одну общую и выполнять сравнение, сопоставление данных, представленных в них после проведения вторичной группировки.

Выбор группировочных признаков всегда должен быть основан на анализе качественной природы изучаемого явления. Всесторонний теоретико-экономический анализ сущности и закономерностей развития явления должен быть направлен на то, чтобы в соответствии с целью исследования положить в основание группировки существенные признаки.

Группировочные признаки могут быть атрибутивными и количественными. Атрибутивные признаки регистрируются в виде текстовой записи (например, профессия рабочих, социальная группа населения). Количественные признаки имеют цифровое выражение (стаж работы, размер дохода).

При группировке по атрибутивному признаку число групп определяется количеством соответствующих наименований, если число этих наименований не очень велико. Если признак имеет большое количество разновидностей, то при группировке ряд наименований объединяют в одну группу.

При группировке по количественному признаку число групп определяется в зависимости от характера изменения признака и задач исследования. Если количественный признак меняется прерывно (дискретно), т.е. может принимать только некоторые – чаще целые значения (например, тарифный разряд рабочих), то число групп должно соответствовать количеству значений признака.

При непрерывном изменении признак принимает любые значения (например, стаж работы или возраст рабочих), поэтому группы ограничиваются значениями признака в интервале «от - до». Интервалом называется разница между максимальным и минимальным значениями признака в каждой группе. На практике используются три вида интервалов: равные, неравные (постепенно увеличивающиеся) и специализированные.

Величина равного интервала исчисляется по формуле:

, (3.1)

где Xmax, Xmin – соответственно наибольшее и наименьшее значения признака в изучаемой совокупности;

m – принятое число групп.

Для расчета величины интервала по этой формуле необходимо заранее установить число групп. Возможен и другой способ определения величины интервала, не требующий предварительного установления числа групп. В этом случае используется формула Стерджесса:

, (3.2)

где n – число наблюдений.

Выполняя расчет величины интервала по этой формуле, следует знаменатель предварительно округлить до целого числа, поскольку количество групп не может быть дробным.

Неравные интервалы (постепенно увеличивающиеся) выбираются так, чтобы число единиц в образованных группах было достаточно велико (т.е. чтобы группы были приблизительно одинаково заполнены).

Численность единиц в группе (m) в равнонаполненных интервалах рассчитывается по формуле:

, (3.3)

где N - численность единиц совокупности;

n - число групп.

Границы специализированных интервалов устанавливаются там, где намечается переход от одного качества к другому. Наметить точки перехода можно только на основе теоретического анализа, используя для выделения типов совокупность признаков, характеризующих различные стороны изучаемого явления.

Интервалы группировки могут быть закрытыми и открытыми. Закрытые интервалы– это интервалы, имеющие как нижние («от»), так и верхние («до») границы. Открытые интервалы – это интервалы, имеющие какую-либо одну границу – верхнюю или нижнюю.

Иногда имеющуюся группировку необходимо несколько изменить: объединить ранее выделенные относительно мелкие группы в небольшое число более крупных, типичных групп или изменить границы прежних групп чтобы сделать группировку сопоставимой с другими. Такая переработка результатов первичной группировки называется перегруппировкойили вторичной группировкой.