Структурные средние

Являясь важной обобщающей характеристикой вариационного ряда средняя величина характеризует центр распределения. Однако значение средней может не совпадать ни с какой вариантой, например средний тарифный разряд получился равным 3,6 хотя разряд не может быть дробным числом. Поэтому наряду со средней для анализа рядов распределения применяют структурные характеристики: моду, медиану, квартиль. Мода и медиана широко применяются при методах контроля качества услуг, надежности работы оборудования, при изучении потребительского спроса.

Медианой является вариант, делящий численность вариационного ряда на две равные части. Для определения медианы в дискретных рядах необходимо придать всем единицам рядя порядковые номера.. Положение медианы определяется ее номером NMe = (п + 1)/2, где п — число единиц в совокупности.

Табл.1

Тарифный разряд рабочего (х) Число рабочих, имеющих соответствующий разряд f Накопленная частота
Итого -

В данном примере NMe, = (20 + 1)/2 = 10,5, т.е. медиана равна средней арифметической из 10-го и 11-го значений признака. По накопленным частотам определяем, что 10-я и 11-я единицы ряда имеют величину признака, равную четвертому разряду, т.е. в примере медиана равна четвертому разряду.

Нахождению медианы в интервальном ряду предшествует определение медианного интервала, накопленная (кумулятивная) частота которого равна или превышает полусумму всех частот ряда. Затем медиана рассчитывается по формуле:

Ме=х0+к/fm·(Σf/2–Sm-1)

Где х0 – начальная граница медианного интервала;

к - медианный интервал;

Σf – сумма накопленных частот (численность) ряда;

Sm-1 – сумма накопленных частот интервалов, предшествующих медианному;

fm – частота медианного интервала.

Мода (Мо) — наиболее часто встречающееся значение признака в совокупности — для данного ряда распределения также равна четвертому разряду, так как этому разряду соответствует максимальная частота, равная 8.

В интервальном ряду с равными интервалами мода рассчитывается по следующей формуле:

Мо= х0+к·[fm–fm-1/(fm–fm-1)+(fm-fm+1)]

Где х0 – начальная граница модального интервала;

к – модальный интервал интервал;

fm-1 – частота предшествующая модальному интервалу;.

fm– частота модального интервала;.

fm+1 – частота следующая за модальным интервалом;.

Например, Имеются данные о размере прибыли 20 коммерческих банков региона за год (млн. руб.):

Размер прибыли, млн. руб Число банков (частота) f Накопленная частота Si Середина интервала Х Х f
3,7–4,6 4,15 8,30
4,6–5,5 5,05 20,20
5,5–6,4 5,95 35,70
6,4–7,3 6,85 34,25
7,3–8,2 7,75 23,25
Итого - - 121,70

Используя данные примера, приведенные в табл.2, рассчитаем медиану. По накопленным частотам (графа 3) определяем, что медиана находится в интервале 5,5—6,4. Тогда

Ме=5,5+0,9/6·(10–6)=6,1 млн. руб.

Таким образом, 50% банков имеют прибыль менее 6,1 млн. руб., а 50% банков - более 6,1 млн. руб.

Наибольшая частота соответствует также интервалу 5,5—6,4, т.е. мода должна находиться в этом интервале. Ее величину определяем по формуле:

Мо=5,5+0,9[(6-4)/(6-4)+(6-5)]=6,1 млн. руб.

Таким образом, в данной совокупности банков наиболее часто встречается размер прибыли 6,1 млн. руб.

Медиану и моду можно также определить графически. Медиана определяется по кумуляте (см. рис. 1). Для ее определения высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

Мода определяется по гистограмме распределения. Для этого правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника — с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения (см. рис. 2)

Квартили–это значения признака, делящие совокупность на четыре части. Первый квартиль (Q1) определяет1/4 часть совокупности с наименьшими значениями признака. Вторым квартилем является медиана. Третий квартиль (Q3) отсекает 1/4 часть с наибольшими значениями признака.

Это означает, что 25% единиц совокупности будут меньше по величине Q1, 25% единиц заключены между Q1 и Q2, 25% единиц–между Q2 и Q3, остальные 25% превосходят Q3.

Для расчета квартилей в интервальном вариационном ряду применяют формулы:

Q1Q1+k·1/fQ1·1/4Σf-SQ1-1

Q3Q3+k·1/fQ3·3/4Σf-SQ3-1

Где ХQ1 и ХQ3-верхняя граница интервала, содержащего первый и третий квартиль (интервал определяется по накопленной частоте, первой превышающей 25%, 75%);

к- величина интервала;

SQ1-1, SQ3-1- накопленная частота интервала, предшествующего интервалу, содержащему первый, третий квартиль;

fQ1, fQ3·- частота интервала, содержащего первый, третий квартиль.

Q1=4,6+0,9(5-2)/4=5,28 млн. руб.

Q3=6,4+0,9(15-12)/5=6,94 млн. руб.

Следовательно, у 25% банков прибыль не превышает 5,28 млн. руб., у 75% банков прибыль превышает 6,94 млн. руб.