Сводка и группировка статистических данных
В результате статистического наблюдения получают сведения о каждой единице наблюдаемого объекта, которые характеризуют ее с многих сторон. Изучение взаимосвязей – важная познавательная задача статистики, которую она решает с помощью специальных методов в зависимости от характера исходного материала и целей познания.
Наиболее простым, но эффективным приемом является сопоставление статистических рядов, который дает возможность сравнить изменение двух или нескольких признаков и не только сравнить, но и установить тенденции их сопряженного изменения.
Статистические группировки – основной метод, при помощи которого сложное экономическое явление дифференцируется на качественно однородные группы. Они составляют основу для применения корреляционного и дисперсионного анализа.
При наличии функциональных связей между признаками статистика использует индексный метод анализа, который позволяет измерить изменение сложного результативного признака за счет каждого из его компонентов – факторов в отдельности при абстракции от влияния других факторов, как в относительном, так и в абсолютном выражении.
Методами, позволяющими количественно выразить статистическую связь между отдельными признаками и их системами, являются корреляционно-регрессионный анализ и дисперсионный анализ. Оба метода основываются на изучении вариации взаимосвязанных признаков, но это самостоятельные методы, решающие специфические задачи.
Корреляционно-регрессионный метод анализа позволяет дать развернутую характеристику взаимосвязей между факторами. Для описания зависимостей исчисляется ряд специфических показателей, которые позволяют с разных позиций оценить взаимодействие и дать его количественную меру. При этом сам по себе корреляционный метод измеряет лишь связь признаков, но не доказывает наличия между ними причинно-следственной зависимости. Последняя должна быть обоснована материальным анализом процесса при выборе факторных признаков. Существенную помощь при выборе оказывают статистические группировки.
Статистические группировки играют важную роль при изучении связи между признаками, проявляя эту связь и создавая возможность ее количественной характеристики. Группировка явлений позволяет глубже понять сущность происходящих процессов, причины различий, выявить новые закономерности в развитии, вскрыть имеющиеся резервы.
В зависимости от решаемых задач, группировки подразделяются на типологические, аналитические, структурные. По числу признаков, положенных в основание группировок, последние делятся на простые и комбинационные. При проведении статистического исследования студент должен уяснить, какие виды группировок будут использованы в курсовой работе.
Первым и наиболее сложным вопросом группировок является правильный выбор признаков (показателей), по которым будет проводится группировка. В литературе имеется ряд указаний по выбору группировочного признака, которые можно свести к следующему:
· в основании группировки должен быть положен наиболее существенный признак, выражающий сущность изучаемого явления;
· при выборе группировочного признака обязательно нужно учитывать конкретные исторические и территориальные условия, в которых протекает развитие явлений;
· при изучении сложных явлений общественной жизни группировку следует производить не по одному признаку, а по нескольким.
Основанием группировки могут служить количественные и качественные признаки. К группировкам по количественному признаку можно отнести группировку сельскохозяйственных предприятий по размерам сельскохозяйственных угодий, по плотности скота на 100 га земельных угодий, по уровню урожайности, себестоимости и т. д.
В качестве группировочных признаков могут быть взяты признаки, являющиеся результатом хозяйственной деятельности (выход валовой продукции на 100 га угодий или себестоимость 1 ц продукции) или признаки, являющиеся факторами производства (обеспеченность основными средствами производства, трудовыми ресурсами и т. д.).
Группировки по результативным признакам позволяют выделить производственные типы хозяйств, различающиеся продуктивностью земли, производительностью труда и т. д., охарактеризовать в среднем их особенности. Однако такая группировка не дает возможности выделить все разнообразие форм, типов и показать степень влияния определенного фактора на результат. Эти задачи решает группировка, проведенная по факторному признаку. Следует знать, что при группировке по результативному признаку группы должны быть охарактеризованы комплексом наиболее существенных факторов, а при группировке по факторному – результативными показателями, а также важнейшими факторами.
Количество групп в статистической группировке определяют следующим образом. Если признак атрибутивный, то по каждому его значению (форма собственности, порода коров и т. п.) все единицы составляют особую группу. Также выделяют группы, если признак дискретный (принимает только целые числовые значения) и изменяется в небольших пределах (число членов семей, число отдельных хозяйств и т. п.).
При группировке статистических данных по количественному признаку число групп выделяют исходя из экономической сущности исследуемого явления с учетом объема совокупности и вариации группировочного признака. Группа считается однородной, если коэффициент вариации изучаемого показателя не превышает 33 % среднего уровня. Если совокупность невелика, то выделение большого числа групп приводит к тому, что группы будут малочисленными и окажутся нетипичными для характеристики связей и закономерностей.
Число групп на первой стадии группировок, то есть при построении интервального ряда, может быть определено по формуле Стерджесса:
n = 1 + 3,322 ℓg N, (1)
где n – число групп,
N – число единиц совокупности.
В ходе экономической оценки полученных групп путем сопоставления уровней показателей может быть проведено укрупнение групп, объединение их в типические.
При определении числа групп можно использовать рекомендации В. П. Левинского при средней вариации признака в группе.
Число единиц совокупности (N) | Число рекомендуемых групп интервалов (n) |
20 – 40 | 3 – 4 |
40 – 60 | 6 – 8 |
60 – 100 | 7 – 10 |
100 – 120 | 9 – 12 |
Величиной интервала называется разность между максимальным и минимальным значениями признака в каждой группе. В зависимости от характера распределения совокупности по данному признаку интервалы по величине могут быть равными и неравными.
Равные интервалы – это интервалы, размеры которых во всех группах имеют одну и ту же величину. Они применяются в тех случаях, когда изменение количественного признака внутри совокупности происходит равномерно. Величина равных интервалов определяется по формуле:
, (2)
где x max – максимальное значение признака;
x min – минимальное значение признака;
n – число образуемых групп.
Интервалы групп образуются следующим образом:
1. от x min до x min + h;
2. от x min + h до x min + 2h;
3. от x min + 2h до x min + 3h и т.д.
При образовании интервалов необходимо точно обозначить количественные границы, избегая таких групп, в которых отдельные значения могут быть отнесены в две соседние группы. В этом случае стоит использовать десятичные знаки.
Неравные интервалы – это интервалы, размеры которых изменяются по величине от группы к группе. Неравные интервалы применяются для ограничения групп в тех случаях, когда группировочный признак изменяется в больших пределах и совокупность многочисленна. Они используются чаще равных интервалов и делятся на интервалы возрастающие и убывающие. Возрастающие интервалы увеличиваются от одной группе к другой, а убывающие – уменьшаются.
При построении группировки с неравными интервалами необходимо построить ранжированный ряд распределения единиц совокупности по группировочному признаку. Для большей наглядности следует изобразить ранжированный ряд графически в виде огивы Гальтона, в которой на оси абсцисс – номера предприятий в ранжированном ряду, на оси ординат – величина группировочного признака. Далее следует оценить характер и интенсивность различий между предприятиями и выделить существенно-отличные группы предприятий. Там, где группировочный признак имеет резкие переходы по количественному значению и соответственно заметны различия в уровне других признаков, следует установить границу интервала. Таким образом, по ранжированному ряду определяются границы, где количество переходит в качество, и выделяются качественно своеобразные группы, представляющие типы явлений. При затруднении выделения групп можно построить интервальный вариационный ряд с достаточно большим числом групп, а затем применить промежуточную аналитическую группировку, что обеспечит переход от нее к типологической группировке. Такая группировка позволяет оценить состояние и качественные особенности каждой группы интервального ряда, объединить однородные и таким образом обеспечить переход к типологической группировке.
После разделения сложного массового явления на группы по каждой из них определяются абсолютные и относительные величины. Средние величины по каждой группе следует рассчитывать по средней арифметической взвешенной (например, среднюю урожайность определяют путем деления валового сбора на посевную площадь и т. п.).
Выбор самих показателей обычно проводится одновременно с определением задачи исследования, то есть еще на стадии составления программы статистического наблюдения. В число показателей, характеризующих группы, включаются только такие, которые существенны для этих групп и достаточно полно освещают состояние изучаемого явления. Показатели должны быть прямо или косвенно связаны с группировочным признаком.