Средние структурные величины

 

В условиях недостаточности средних используют структурные средние величины – моду и медиану.

Медиана (Ме) – это вариант, который находится а середине вариационного ряда. Медиана делит ряд на две равные (по числу наблюдений) части. В ранжированных рядах не сгруппированных данных нахождение медианы сводится к отысканию порядкового номера и значения варианта у этого номера.

Медиана в интервальныхвариационных рядах рассчитывается по формуле:

, (1.17)

где х0 – нижняя граница медианного интервала (накопленная частота которого превышает половину общей суммы частот);

– величина медианного интервала;

– накопленная частота интервала, предшествующего медианному;

– частота медианного интервала.

Также в интервальных вариационных рядах медиана может быть найдена с помощью кумуляты как значение признака, для которого

или . (1.18)

Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины: .

Модой(Мо) вариационного ряда называется вариант, которому соответствует наибольшая частота.

Для вычисления моды в интервальном ряду сначала находится модальный интервал, имеющий наибольшую частоту (или наибольшую плотность распределения – отношение частоты интервала к его величине ni/hi – в интервальном ряду с неравными интервалами), а значение моды определяется линейной интерполяцией:

, (1.19)

где хо нижняя граница модального интервала;

– величина модального интервала;

, , – частота ni (в интервальном ряду с равными интервалами) или плотность распределения ni/hi (в интервальном ряду с неравными интервалами) модального, до и послемодального интервала.

Мода так же, как и медиана обладает определенной устойчивостью к вариации признака. Если в совокупности первичных признаков нет повторяющихся значений, то для определения моды проводят группировку.

Графически отобразить моду по гистограмме можно следующим образом: нужно взять столбец, имеющий наибольшую высоту, и из его левого верхнего угла провести отрезок в угол последующего столбца, а из правого угла – в верхний правый угол предыдущего столбца, абсцисса точки пересечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности. Медиану приближенно можно определить графически - по кумуляте. Для этого высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения и есть медиана (рисунок 1.1)

 
 

Рис. 1.1 Графическое отображение интервального вариационного ряда

В симметричных рядах имеет место следующее соотношение моды, медианы и средней арифметической (1.20).

В случае, если (1.21), имеет место левосторонняя асимметрия ряда.

В случае, если (1.22), имеет место правосторонняя асимметрия ряда.

Мода и медиана,в отличие от степенных средних, являются конкретными характеристиками ряда. Медиана – характеризует центр, вычисляется проще и не чувствительна к концам интервала. Мода – наиболее вероятное значение в изучаемой совокупности (например, наиболее возможные результаты).

1 2 3

 

 

1 – распределение с левосторонней асимметрией

2 – распределение с правосторонней асимметрией

3 – нормальное (симметричное) распределение

Анализ вариационных рядов

Показатели вариации

Вариациейназывается изменяемость, колеблемость величины признака. Вариация проявляется в отклонениях от средних и зависит от множества факторов, влияющих на социально-экономическое явление. Вариация бывает случайной и систематической, существует в пространстве и во времени. Показатели вариации делятся на абсолютные и относительные (таблица 2.1).

 

Таблица 2.1 - Показатели вариации

  Показатель Формула расчета показателя
простой взвешенный
Абсолютные Размах (2.1)
Среднее линейное отклонение (2.2) * (2.3)
Дисперсия σ2 (2.4) (2.5)
Среднее квадратическое отклонение (2.6) (2.7)
относительные Коэффициент вариации (2.8)
Линейный коэффициент вариации (2.9)
Коэффициент осцилляции (2.10)

*– Здесь fi – частота ( ).

Относительные показатели (коэффициент вариации, линейный коэффициент вариации, коэффициент осцилляции) строятся с учетом базы (в виде средней), выражаются в процентах и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации

. (2.11)

Для расчета дисперсии можно использовать модифицированную формулу:

. (2.12)

Выведем эту формулу из формулы (2.5)

Для расчета дисперсии можно использовать способ отсчета от условного нуля, который позволяет упростить вычисления при больших значениях признака. Тогда дисперсия вычисляется по формуле:

, (2.13)

где h – величина интервала;

А – условный нуль, в качестве которого можно использовать как середину серединного интервала, так и середину интервала с наибольшей частотой.

 

Свойства дисперсии

1.Дисперсия постоянной величины равна нулю.

2.Если у всех значений вариантов отнять какое-то постоянное число А, то средний квадрат отклонений (дисперсия) от этого не изменится

. (2.14)

Это значит, что дисперсию можно вычислить не по заданным значениям признака, а по их отклонениям от какого-то постоянного числа, например условного нуля (см. формулу 2.13).

 

3.Если все значения вариантов разделить на какое-то постоянное число А, то дисперсия уменьшится в А2 раз:

. (2.15)

 

4.Если распределение признака близко к нормальному или симметричному, то по правилу мажорантности (т.к. среднее квадратическое отклонение – средняя геометрическая величина, а среднее линейное отклонение – средняя арифметическая) среднее квадратическое отклонение больше среднего линейного отклонения ( ), причем

, . (2.16)

 

Размах вариации, среднее линейное и среднее квадратичное отклонение – это именованные величины. Единицей измерения у них и у исходных значений признака совпадают. Дисперсия может быть задана в ед.2 признака или в % отклонений.