Лекция 3. Сводка и группировка статистических данных

Сводка – научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных, систематизацию, группировку материалов, составление таблиц, получение итогов по группам и в целом. Программа сводки включает определение групп и подгрупп, системы показателей и видов таблиц. По технике и способу выполнения сводка может быть ручной либо механизированной.

Группировка – разбиение совокупности на группы, однородные по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам. Устойчивое разграничение объектов называется классификацией или стандартом, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Метод группировки основывается на двух категориях – группировочном признаке и интервале.

Группировочный признак – признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Он может носить как количественный, так и качественный характер. В ряде случаев группировка, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.

Интервал очерчивает количественные границы групп и представляет собой промежуток между максимальным и минимальным значениями признака в группе. Интервалы бывают равные, неравные, закрытые (когда имеется верхняя и нижняя граница) и открытые (когда одна из границ отсутствует).

Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования взаимосвязи факторных и результативных признаков. Каждой из этих целей соответствует особый вид группировки: типологическая, структурная и аналитическая.

В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки.

Простая группировка выполняется по одному признаку. Среди простых группировок особо выделяются ряды распределения. Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака применяется один показатель – численность группы.

Оптимальное число групп выбирается так, чтобы в достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, то не проявится закономерность вариации; если групп будет чрезмерно много, то случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:

где k – число групп (округляемое до ближайшего целого числа); N – численность совокупности.

Зная число групп, рассчитывают длину (размах) интервала по формуле:

По очередности обработки информации группировки бывают первичными, составленные на основе первичных данных, и вторичные, являющиеся результатом перегруппировки ранее уже сгруппированного материала.

В соответствии со временным критерием различают статические группировки, дающие характеристику совокупности на определенный момент или за определенный период, и динамические, показывающие переходы единиц из одних групп в другие.