Ряды распределения. Их виды. Построение дискретных и интервальных вариационных рядов.

Статистический ряд распределения – это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку (предыдущий пример – это ряд распределения). Он, являясь разновидностью структурной группировки, характеризует состав (или структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Ряды распределения, построенные по атрибутивному признаку, называются атрибутивными (распределение населения по полу, занятости, профессии и т.д.).
Ряды, построенные по количественному признаку, - вариационными (распределение населения по стажу работы, з/п, возрасту.).

Конструктивно вариационный ряд распределения представляет собой таблицу, в первом столбце которой расположены варианты или их интервалы, во второй – частоты или (и) частости (третий столбец) . Принято варианты обозначать , частоты - , частости - .
Варианты, т.е. числовые значения количественного признака в вариационном ряду распределения, могут быть положительными или отрицательными. Так, при группировке предприятий по результатам деятельности варианты положительные (прибыль) или отрицательные (убыток).

Частотыэто числа, показывающие, как часто встречаются те или варианты в данной совокупности. Сумма всех частот называется объемом совокупности и показывает число единиц совокупности, обозначается N.

Частостиэто частоты, выраженные в виде относительных величин: долях единицы или в процентах, рассчитываются как отношение частоты к объему совокупности. Сумма частостей всегда равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Для анализа совокупности вариационный ряд дополняют такими элементами, как накопленная частота, накопленная частость и плотность распределения.

Накопленная частота (Sf)показывает число единиц совокупности, у которых значение варианты не больше данной, определяется суммированием частот всех предшествующих интервалов, включая данный:

, , и т.д.

Если вместо частот использовать частости, то аналогично получим накопленные частости(Sw):

, , и т.д.

Абсолютная плотность распределения – это частота, приходящаяся на единицу длины интервала, т. е. , а относительная плотность распределения – частость, приходящаяся на единицу длины интервала, т. е. . Плотность распределения используется в рядах с неравными интервалами для приведения частот и частостей к сопоставимому виду.
Вариационные ряды в зависимости от характера вариации делят на дискретныеиинтервальные.
Дискретные вариационные ряды строятся на основе дискретных (прерывных) признаков. Дискретные – это признаки, варианты которых имеют только целые значения и количество их невелико. Интервальные вариационные ряды основаны на непрерывных признаках (т.е. принимающих любые значения, в том числе и дробные) или дискретных, варьирующих в широком диапазоне.

Пример построения дискретного ряда распределения. Стаж работы в годах 10 рабочих бригады характеризуются следующими данными: 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.
Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариант в возрастающем или убывающем порядке.
Ранжированный ряд: 2, 3, 3, 4, 4, 4, 4, 5, 5, 5.

Таблица 5 – Дискретный вариационный ряд распределения рабочих по стажу работы

Стаж работы (варианты хi) Количество рабочих определенного стажа (частота fi) Частости Накопленные частоты Накопленные частости
2 3 4 5 1 2 4 3 (1:10)*100=10 (2:10)*100=20 40 30 1 1+2=3 3+4=7 7+3=10 10 30 70 100
  100 % - -

Пример построения интервального ряда. Имеются данные о среднемесячной з/п 30 работников, которая варьируется от 600 до 1200 грн. Построить интервальный ряд распределения.

Число интервалов (групп): к = 1+3,322 lg N = 1+3,322 lg 30 = 5,91 = 6

Шаг интервала

 

Таблица 6 – Интервальный вариационный ряд распределения рабочих по размеру среднемесячной заработной платы

Группы рабочих по размеру з/п (интервалы вариант хi) Количество рабочих (частоты fi ) Частости Накопленные частоты Накопленные частости
1) 600-700 2) 700-800 3) 800-900 4) 900-1000 5) 1000-1100 6) 1100-1200 3 6 8 9 3 1 26,7 30 10 3,3 3 3+6=9 9+8=17 26 29 30 10,0 30,0 56,7 86,7 96,7 100,0
Итого - -
           

 

Графически ряды распределения можно представить в виде гистограммы, кумуляты, полигона.
Интервальный вариационный ряд изображают в виде гистограммы. Для ее построения в прямоугольной системе координат по оси абсцисс откладывают отрезки, равные длине интервала. Затем на этих отрезках, как на основаниях, строят прямоугольники, высота которых пропорциональна частоте или частости. Для интервального ряда с неравными интервалами по оси ординат откладывают плотность распределения, так как в этом случае именно она дает представление о заполненности интервала. Площадь всей гистограммы численно равна сумме частот.
Пример построения гистограммы.

Если соединить середины каждого интервала отрезками прямой, то получим замкнутую фигуру в виде многоугольника, которая называется полигоном.
Полигон чаще используется для дискретных рядов. Для этого в прямоугольной системе координат строят точки с координатами (x1, f1), (x2, f2), …, (xN, fN), затем последовательно соединяют их отрезками, а из первой и последней точек опускают перпендикуляры на ось х. Полученный многоугольник является полигоном дискретного вариационного ряда.

Кумулята строится по накопленным частотам (или частостям), которые откладывают по оси у, а по оси х – варианты или верхние границы интервалов.