Понятие сводки, группировки и классификации статистических данных

 

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки, группировки и классификации первичного статистического материала.

Статистическая сводка – научно-организованная обработка материалов наблюдения для последующего описания статистической совокупности по обобщающими показателям. Суть статистической сводки заключается в объединении единиц совокупности в группы, классы, типы и агрегировании информации о них как в границах групп, так и в целом за совокупностью. Основное задание сводки заключается в выявлении типичных черт и закономерностей в совокупности.

Статистические сводки различают по ряду признаков: сложностью построения, организацией работы, степенью обработки данных (таблица 3.1).

Таблица 3.1 – Классификация видов статистических сводок

Признак Название Содержание сводки
По сложности построения Простая подведение итогов первичного материала в целом без любой его систематизации.
Сложная это комплекс операций: группировка единиц; подведение групповых и общих итогов; представление результатов сводки в форме статистических таблиц, графиков, рядов распределения.
По организации работы Централизованная все данные сосредоточиваются в одном месте (центре), где и обрабатываются. Такой способ сводки используется при переписях населения, социологических опросах.
Децентрализованная обработка статистической информации осуществляется от нижнего до высшего звена управления: отчеты предприятий производятся региональными статистическими органами, итоги за регионами передаются в Госкомстат, где обобщаются в целом по стране.
По степени автоматизации обработки Автоматизированная Выполняется на автоматизированных рабочих местах с использованием ПК
Ручная Выполняется вручную

Научную основу статистической сводки составляют классификации и группировки.

Если признаками совокупности выступают количественные показатели, то такой вид работ (в отличие от классификаций) называют в узком смысле непосредственно статистической группировкой.

Если же разграничение элементов совокупности на группы осуществляется по атрибутивным признакам, то такой вид группировки называют классификацией или номенклатурой. Они разрабатываются международными и национальными статистическими органами и рекомендуются как статистический стандарт.

В таблице 3.2 представлены основные виды группировок.

Таблица 3.2 – Виды группировок

Признак Название и характеристика группировки
Цель Типологическая это разделение исследуемой совокупности на однородные группы, социально-экономические типы. Примерами таких видов группировок являются группировка населения по возрасту, группировка предприятий по форме собственности и т. п.
Структурная это группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-то варьирующему признаку. К ним принадлежат группировки населения по полу, возрасту и др.
Аналитическая позволяет выявить взаимосвязи между изучаемыми явлениями и их признаками. Примерами таких группировок могут быть группировки, в которых изучаются взаимосвязи между себестоимостью и ее факторами, производительностью труда и ее факторами и т.п.
Число группировочных признаков Простая группировка, которая проводится по одному признаку.
Сложная группировка, которая проводится по двум и более признакам.
Комбинированная группировка, которая проводится по 2-4 признакам.
Многомерная группировка, которая проводится по 4 и более признакам
Соподчиненность группировочных признаков Фасетная в ней последовательно перечисляются объекты классификации по одному признаку.
Иерархическая в ней исходное множество единиц последовательно распределяется на подмножества по соподчиненным группировочным признакам. Более крупная группа единиц является суммой единиц входящих в нее групп.    
Продолжение таблицы 3.2
Упорядоченность исходных данных Первичная получается, если исходные группируемые данные были не упорядоченными.
Вторичная группировка производится на основании систематизированных в результате первичной группировки данных

При построении группировки решают такие задачи:

1) выбор группировочного признака;

2) определение количества групп и величины интервала;

3) установление перечня показателей, которыми должны характеризоваться выделенные группы относительно конкретной группировки;

4) составление макетов таблиц, где будут представлены результаты группировки;

5) вычисление абсолютных, относительных и средних показателей:

6) табличное и графическое оформление результатов группировки.

Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Определение числа групп можно осуществить математическим путем с использованием формулы Стерджесса:

(3.1)

где m - число групп; n - число единиц совокупности.

Число групп зависит от численности единиц совокупности и определяется на основании номограммы Стерджесса:

Число единиц совокупности (n) 10-24 25-44 45-89 90-179 180-359 360-719 720-1439
Число групп(m)

Когда определено число групп, то следует определить интервалы группировки.

Интервал– это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границейинтервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Для группировок с равными интервалами величина интервала (h) определяется как отношение разности между максимальным и минимальным значениями признака к количеству выделяемых групп:

(3.2)

где хmax – максимальное значение признака в совокупности; хmin – минимальное значение признака в совокупности; n – количество выделяемых групп.

Величину интервала обычно округляют до целого (всегда большего) числа.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Интервалы групп могут быть открытые (если указана одна из границ) и закрытые (если указаны и верхняя и нижняя граница интервала). Величина открытого интервала приравнивается к величине смежного с ним интервала.

Для удобства представления результаты группировки чаше всего представляются в виде таблиц. Статистическая таблица – это рациональная форма изложения и анализа цифровых характеристик изучаемого социально-экономического явления.

Современный анализ социально-экономических явлений немыслим без применения графического метода представления данных. И если таблицы служат удобным инструментом анализа, то графики предназначены для облегчения восприятия полученных результатов. Основная цель создания графиков: наглядность представления материалов исследования.

Статистический график – это условное изображение числовых величин или их соотношений посредством геометрических фигур, линий или на географических картосхемах. При правильном построении графиков статистические показатели привлекают к себе внимание, становятся более понятными, выразительными, лаконичными, запоминающимися.

 

Ряды распределения

 

В результате сводки образуются ряды величин, характеризующих состав изучаемых явлений по одному признаку, которые называются рядами распределения. Ряд распределения – это ряд чисел, показывающий, как распределяются единицы некоторой совокупности по изучаемому признаку.

Ряды, построенные по атрибутивному признаку, называются атрибутивными рядами распределения. Примером атрибутивных рядов могут служить распределения населения регионов по полу, занятости, национальности.

Ряды распределения, построенные по количественному признаку, называются вариационными рядами. Примером вариационного ряда распределения могут служить распределения населения регионов по возрасту.

Вариационные ряды распределения состоят их двух элементов вариантов и частот. Вариантаминазываются упорядоченные значения количественного признака в ряду распределения, они могут быте положительными и отрицательными, абсолютными и относительными. Частоты – это абсолютные числа, показывающие сколько раз встречаются те или иные варианты в вариационном ряду. Сумма всех частот называется объемом совокупности и определяет число единиц всей совокупности.

Отношение частоты того или иного варианта к сумме всем частот ряда называется частостью или относительной частотой.

В таблице 3.3 представлен пример вариационного ряда.

Таблица 3.3 – Группировка рабочих по стажу

Номер группы Группы рабочих по стажу, лет Число рабочих, чел Относительные частоты (φi) Накопленные частоты (Σfi-1)
варианты (хi) Частоты (fi)
1 – 4 0,23
4 – 7 0,33
7 – 10 0,20
10 – 13 0,13
13 - 16 0,10
Итого - 1,00  

Для выявления характера распределения единиц совокупности по значениям группировочного признака широко используется графическое представление рядов. Оно представлено полигонами, гистограммами и кумулятами распределения.