Построение интервалов группировки

Важным этапом построения статистической группировки является определение интервалов.

Интервал — это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей называется наименьшее значение признака в интервале. Верхней границей выступает наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки классифицируют по следующим признакам.

В зависимости от величины интервалы группировки бывают равные и неравные.

Равными называют интервалы, в которых ширина интервала от интервала к интервалу составляет одно и то же число. Они применяются в случае, если изменение количественного признака внутри изучаемой совокупности происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширину равного интервала определяют по следующей формуле:

где Я — размах вариации признака; п — число групп.

Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то необходимо использовать группировку с неравными интервалами.

Неравные интервалы могут быть получены следующим образом: в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов; путем построения прогрессивно-возрастающих или прогрессивно-убывающих интервалов.

Неравные интервалы подразделяют:

• на прогрессивно-возрастающие;

• прогрессивно-убывающие;

• специализированные;

• произвольные.

При построении прогрессивно-возрастающих и прогрессивно-убывающих интервалов используется принцип арифметической или геометрической прогрессии.

Величину интервалов, изменяющихся в арифметической прогрессии, определяют следующим образом:

а в геометрической прогрессии

где а — константа (для прогрессивно-возрастающих интервалов имеет знак "+", а для прогрессивно-убывающих -знак "-"); д — константа (для прогрессивно-возрастающих — больше 1; для прогрессивно-убывающих — меньше 1).

Специализированными называются интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроэкономическом уровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными. Пример произвольных интервалов представлен в табл. 3.4.

Таблица 3.4. Распределение населения РФ по величине среднедушевых денежных доходов в месяц в 2009 г.*

Группа населения по величине среднедушевых денежных доходов в месяц, руб.

Удельный вес населения, % к итогу

До 2000,0

1,0

2000,1-4000,0

(1.1

4000,1-6000,0

10.3

6000,1-8000,0

11.1

8000.1 10 000.0

10,4

10 000,1 15 000,0

20.4

15 000.1 25 000.0

21.8

Свыше 25 000,0

1 8.6

Итого

100,0

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях, как правило, имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки инвестиционно-финансовых компаний города по численности работающих, которая варьирует от 50 до 550 человек, нецелесообразно рассматривать равные интервалы, так как учитываются как малые, так и крупные инвестиционно-финансовые компании. Поэтому лучше образовывать неравные интервалы: 50-100, 100-200, 200-350, 350-550, т.е. ширина каждого последующего интервала больше предыдущего на 50 человек и увеличивается в арифметической прогрессии.

Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае — объединять.

В зависимости от наличия границ интервалы группировки бывают закрытые и открытые.

Закрытыми называются интервалы, у которых имеются и верхняя, и нижняя границы. Например, группы стран СНГ по объему инвестиций в экономику России в 2011 г. (млн долл. США): 7-113, 113-219, 219-325.

Открытыми называются интервалы, у которых указана только одна граница: как правило, верхняя у первого интервала и нижняя у последнего. Например, распределение безработных по возрастным группам (лет): до 20, 20—24, 25-29,30-34,35-39,40-44,45-49,50-54,55-59,60 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями признака, которые в несколько раз отличаются от всех остальных его значений.

При группировке единиц совокупности по количественному признаку обозначение границ интервалов зависит от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы сотрудников строительных организаций по среднемесячной начисленной заработной плате (тыс. руб.): 25—40, 40—55, 55—70, 70—85), то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов. В данном случае среднемесячная начисленная заработная плата 40 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго; 55 тыс. руб. — верхнюю границу второго и нижнюю границу третьего интервалов; 70 тыс. руб. — соответственно, третьего и четвертого интервалов, т.е. верхняя граница 1-го интервала равна нижней границе + 1 )-го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должен войти сотрудник со среднемесячной заработной платой 55 тыс. руб.?

Для того чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно использовать открытые интервалы.

При атом возможны два варианта обозначения открытых интервалов. По приведенному выше примеру, группы сотрудников строительных организаций по среднемесячной начисленной заработной плате (тыс. руб.) могут быть преобразованы в следующие группы:

1-й вариант: до 40, 40—55, 55—70, 70 и более;

2-й вариант: 40 и менее, 40—55, 55—70, более 70.

При первом варианте сотрудники строительных организаций со среднемесячной заработной платой 40 тыс. руб. попадут во вторую группу; при втором варианте — в первую. Сотрудники строительных организаций со среднемесячной заработной платой 55 тыс. руб. попадут в третью группу в первом случае; при втором варианте — во вторую.

Если в основании группировки лежит дискретный признак, то нижняя граница /-го интервала равна верхней границе (г - 1)-го интервала, увеличенной на 1. Например, распределение телеграмм по числу слов в них: до 5, 6—10, 11-15 и т.д.

Если изменение количественного признака приводит к появлению нового качества, то граница интервала устанавливается там, где происходит переход от одного качества к другому. Строя такую группировку, следует дифференцированно устанавливать границы интервалов для различных видов экономической деятельности. Это достигается путем использования группировок со специализированными интервалами.