Понятие статистической группировки
Группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным, существенным для них признакам. Группировка является важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.
С помощью метода группировок решаются следующие задачи:
· выделение социально-экономических типов явлений;
· изучение структуры явления и структурных сдвигов, происходящих в нем;
· выявление связи и зависимости между явлениями.
В соответствии с задачами группировки различают следующие ее виды: типологическая, структурная, аналитическая.
Типологическая группировка– это расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений.
Структурнойназывается группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему (изменяющемуся) признаку.
Аналитической называется группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками. Особенностями аналитической группировки является то, что единицы группируются по факторному признаку, а каждая выделенная группа характеризуется средними значениями результативного признака.
Все рассмотренные группировки могут быть построены по какому-то одному или нескольким существенным признакам.
Группировка, в которой группы образованы по одному признаку, называется простой.
Сложнойназывается группировка, в которой расчленение совокупности на группы производится по двум и более признакам, взятым в сочетании. Сложные группировки дают возможность изучить единицы совокупности одновременно по нескольким признакам.
Построение группировки начинается с определения состава группировочных признаков. Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. В основание группировки могут быть положены как количественные, так и атрибутивные признаки.
После того как определено основание группировки, следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, численности совокупности, степени вариации признака.
Если группировка строится по атрибутивному (качественному) признаку, то групп, как правило, будет столько, сколько имеется градаций, видов состояний у этого признака.
Если группировка проводится по количественному признаку, то количество групп зависит в первую очередь от степени колеблемости (вариации) группировочного признака: чем она больше, тем больше можно образовать групп.
Определение числа групп можно осуществить по формуле Стерджесса:
n = 1+3,322∙lgN, (1)
где n – число групп;
N – число единиц совокупности.
Недостаток формулы Стерджесса состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.
Когда определено число групп, то следует определить интервалы группировки.
Интервал– это значение варьирующего признака, лежащее вопределенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.
Нижней границейинтервала называется наименьшее значение признака в интервале, а верхней границей– наибольшее значение признака в интервале.
Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле:
, (2)
где xmax и xmin – максимальное и минимальное значения признака в совокупности;
n – число групп.
Если размах вариации признака совокупности велик и значения признака варьируются неравномерно, то необходимо использовать группировку с неравными интервалами.
Неравные интервалы могут быть прогрессивно-возрастающими или прогрессивно-убывающими в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом: hi+1=hi+a, а в геометрической прогрессии: hi+1=hiq.
Интервалы группировок могут быть закрытыми и открытыми.
Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы. У открытых интервалов указана только одна граница.
При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по-разному в зависимости от того, непрерывный это признак или прерывный. Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов. Для того чтобы правильно отнести к той или иной группе единицу объекта, значение признака у которой совпадает с границами интервалов, можно использовать открытые интервалы. Если в основании группировки лежит прерывный признак, то нижняя граница i-го интервала равна верхней границе (i-1) интервала, увеличенной на 1.
При определении границ интервалов статистических группировок необходимо исходить из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала должна устанавливаться там, где происходит переход от одного качества в другое. Это достигается путем использования группировок со специализированными интервалами. Специализированныминазываются интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.
При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными.Они используются при группировке предприятий, например, по уровню рентабельности.
Вторичная группировка- операция по образованию новых групп на основе ранее осуществленной группировки.
Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаше укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.
Ряд распределения
Ряд распределения– это упорядоченное распределение единиц совокупности на группы по определенному признаку.
В зависимости от признака, положенного в основу ряда распределения, различают атрибутивные и вариационные ряды распределения.
Атрибутивныминазывают ряды распределения, построенные по качественным признакам. Они характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов эти данные позволяют исследовать изменение структуры.
Вариационнымирядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
Вариантаминазываются отдельные значения признака, которые он принимает в вариационном ряду, т.е. конкретные значение варьирующего признака.
Частотаминазываются численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.
Частостяминазываются частоты, выраженные в долях единицы или в процентах к итогу. Сумма частостей равна 1 или 100%.
Накопленные частоты показывают, сколько единиц совокупности имеют значения признака, не большие, чем рассматриваемое значение.
В зависимости от характера вариации признака различают дискретные и интервальные ряды.
Дискретный вариационный рядхарактеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, распределение семей по числу детей.
В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколь угодно малую величину. Построение интервальных вариационных рядовцелесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т.е. число вариантов прерывного признака достаточно велико.
Правила построения рядов распределения аналогичны правилам построения группировки.
Статистические таблицы
Табличная форма является рациональной, наглядной и компактной формой представления статистических данных, изложения результатов сводки и группировки материалов статистического наблюдения.
Анализ данных статистических таблиц как метод научного исследования позволяет выявить соотношения и пропорции между группами явлений по одному или нескольким признакам, провести сравнительный анализ, охарактеризовать типы социально-экономических явлений, выявить характер и направление взаимосвязей и взаимозависимостей между различными, определенными логикой экономического анализа признаками, сформулировать выводы и определить резервы развития изучаемого явления, объекта или процесса.
Статистической таблицейназывается таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.
Название таблицы
Содержание строк | Наименование граф | Итоговая графа | ||
А | … | |||
Наименование строк | ||||
Итоговая строка |
Рис.2. Статистическая таблица
Подлежащимстатистической таблицы называется объект, который в ней характеризуется цифрами. Это могут быть: совокупность, отдельные единицы совокупности в порядке их перечня или сгруппированные по одному или нескольким признакам территориальные единицы, временные периоды и т.д. В соответствии с этим в зависимости от структуры подлежащего различают статистические таблицы:
· Простые перечневые(в подлежащем дается простой перечень единиц совокупности).
· Простые монографические (в подлежащем дается одна единица, выделенная по определенному признаку).
· Сложные групповые(подлежащее содержит группы единиц совокупности по одному количественному или атрибутивному признаку).
· Сложные комбинационные(подлежащее содержит группы единиц совокупности по нескольким количественным или атрибутивным признакам).
Наряду с подлежащим важным составным элементом статистической таблицы является сказуемое.
Сказуемое – это система показателей, которыми характеризуется объект изучения. Сказуемое формирует заголовки граф и составляет их содержание.
По структурному строению сказуемого различают статистические таблицы с простой и сложной его разработкой.
При простой разработке сказуемого показатель, его определяющий, получается путем простого суммирования значений по каждому признаку отдельно независимо друг от друга.
Сложная разработка сказуемого предполагает деление признака, его формирующего, на группы.
Статистические таблицы, как средство наглядного и компактного представления цифровой информации, должны быть статистически правильно оформлены.
Основными правилами, определяющими технику формирования статистических таблиц, являются следующие:
1. Таблица должна быть компактной и содержать только те исходные данные, которые непосредственно отражают исследуемое социально-экономическое явление в статике и динамике и необходимы для познания его сущности.
2. Заголовок таблицы и названия граф и строк должны быть четкими, краткими, представлять собой законченное целое, органично вписывающееся в содержание текста.
Необходимо избегать большого количества точек и запятых в названии таблицы и граф, которые затрудняют чтение. Если название таблицы состоит из двух и более предложений, точка ставится с целью отделения предложений друг от друга, но не после последнего.
В заголовках граф допускаются точки только при необходимых сокращениях. В заголовке таблицы должны найти отражение объект, признак, время и место совершения события. Например: «Курс доллара США на торгах ММВБ в 2013 г.» Названия таблицы, граф и строк пишутся полностью, без сокращений.
3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой.
В групповых и комбинационных таблицах всегда необходимо давать итоговые графы и строки.
4. В достаточно больших таблицах (по количеству приведенных строк) целесообразно оставлять двойной промежуток после каждых пяти (и далее кратных пяти) строк для того, чтобы было удобнее читать и анализировать таблицу.
5. Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то необходимо присвоить общий объединяющий заголовок.
Данный прием используется и для подлежащего, и для сказуемого таблиц.
6. Графы и строки полезно нумеровать. Графы подлежащего принято обозначать заглавными буквами алфавита А, В и т. д., а графы сказуемого - цифрами в порядке возрастания.
7. Взаимосвязанные данные, характеризующие одну из сторон анализируемого явления (например, число предприятий и удельный вес заводов (% к итогу) и т. д.) целесообразно располагать в соседних друг с другом графах.
8. Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям. При этом используются общепринятые сокращения единиц измерения.
9. Располагать в таблицах сопоставляемую в ходе анализа цифровую информацию лучше в одной и той же графе, одну под другой, что значительно облегчает процесс их сравнения.
В групповых таблицах группы по изучаемому признаку более грамотно располагать в порядке убывания или возрастания его значений при сохранении логической связи между подлежащим и сказуемым.
10. Для более удобной работы с цифровым материалом числа в таблицах следует представлять в середине граф, одно под другим: единицы под единицами, запятая под запятой, четко соблюдая при этом их разрядность.
11. Числа целесообразнее по возможности округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинаковой степенью точности.
12. Отсутствие данных об анализируемом социально-экономическом явлении может быть обусловлено различными причинами и по-разному отмечается в таблице:
а) если данная позиция (на пересечении соответствующих графы и строки) вообще не подлежит заполнению, то ставится знак «х»;
б) если по какой-либо причине отсутствуют сведения, то ставится многоточие «...» или «нет свед.», или «н. св.»;
в) если отсутствует явление, то клетка заполняется тире «-».
Для отображения очень малых чисел используют обозначения (0,0) или (0,00), что предполагает возможность наличия числа.
13. В случае необходимости дополнительной информации, разъяснений к таблице могут даваться примечания.
Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально-экономических явлений.
Статистические графики
Наряду со статистическими таблицами, при анализе статистической информации используются статистические графики. Они должны включать в себя следующие элементы: графический образ, поле графика, масштабные ориентиры и систему координат.
Графический образ – геометрические знаки, совокупность точек, линии, фигуры, с помощью которых изображаются статистические величины. Поле графика – представляет собой пространство, где размещаются перечисленные геометрический знаки. Масштабные ориентиры определяются масштабом и масштабной шкалой в классическом их понимании.
Для размещения геометрических знаков в поле графика необходима система координат. Как правило, на практике используется прямоугольная Декартова система координат, а для изображения циклических явлений и процессов полярная система координат.
Вся совокупность статистических графиков очень велика, однако можно выделить отдельные ее элементы, которые чаще всего встречаются в практических статистических исследованиях:
· Столбиковая диаграмма.
· Полосовая диаграмма.
· Квадратная диаграмма.
· Круговая диаграмма.
· Секторная диаграмма.
· Линейная диаграмма.
· Радиальная диаграмма.
· Картограмма.
Методы построения данных видов диаграмм известны из школьного курса математики и в данном пособии отдельно не рассматриваются. Приведем лишь схематично некоторые из них (рис.3).
Секторная диаграмма | Радиальная диаграмма |
Квадратная диаграмма | Столбчатая диаграмма |
Рис.3. Некоторые виды статистических графиков