Структурные средние величины

Для характеристики среднего значения признака в вариационном ряду применяются показатели центра распределения: средняя величина , мода и медиана . Средняя величина характеризует типичный уровень признака в совокупности.

Структурные средние (мода, медиана) применяются для изучения внутреннего строения, структуры совокупности. В отличие от средней арифметической, на которую оказывают влияние все значения признака , структурные средние: не зависят от крайних значений признака; выступают как конкретные величины; совпадают с вполне определенными вариантами совокупности. Поэтому, когда для характеристики совокупности расчет средних степенных невозможен, применяются структурные средние величины.

Мода( ) – это значение признака, повторяющееся с наибольшей частотой.

Мода широко используется в коммерческой практике при изучении покупательского спроса, регистрации цен и т.д. Мода обладает определенной устойчивостью к вариации признака. Поэтому ее наиболее удобно применять при изучении рядов с неопределенными границами.

При расчете моды следует учитывать, что она по-разному определяется в дискретных и интервальных вариационных рядах.

В дискретном ряду модой является вариант с наибольшей частотой (частостью).

В интервальном вариационном ряду с равными интервалами для расчета моды сначала определяют модальный интервал (интервал, имеющий наибольшую частоту или частость), а затем применяют формулу:

, где:

нижняя граница модального интервала;

величина модального интервала;

частоты (частости)соответственно модального, предыдущего и последующего интервалов.

В интервальном ряду моду можно определить графически по гистограмме (см. § 3.5).

Для ряда с неравными интервалами модальный интервал определяется по наибольшей плотности распределения или . Это объясняется тем, что моду можно рассматривать как значение признака, которому соответствует максимальная плотность распределения.

Медиана ( )– это значение признака, которое делит единицы ранжированного (упорядоченного) ряда на две равные по объему части.

Таким образом, медианой является значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности: половина единиц совокупности имеют значения признака, меньше, чем медиана, а половина – больше. Медиана используется при статистическом контроле качества продукции, при изучении распределения семей по величине дохода и др.

Ранжированный ряд – это ряд, построенный в порядке возрастания или убывания индивидуальных значений признака. В этой связи можно сказать, что медиана лежит в середине ранжированного ряда и делит его пополам.

Также как и мода, медиана не зависит от крайних значений признака, и поэтому применяется для характеристики центра в ряду распределения с неопределенными границами.

В этой связи медиана является лучшей характеристикой центральной тенденции в следующих случаях:

1) границы крайних интервалов открыты;

2) в ряду имеются чрезмерно большие или малые значения признака;

3) имеют место рез­кие различия между максимальным и минимальным значениями признака.

Из этого следует, что медиана практически выполняет функции средней для неодно­родной совокупности.

Расчет медианы имеет свою специфику. Способ расчета зависит от вида ряда распределения (дискретный или интервальный) и от объема совокупности (четный или нечетный).

Положение медианы в ранжированном ряду определяется ее номером:

, где n – число единиц совокупности. Затем по накопленным частотам определяют ее численное значение.

В дискретном вариационном ряду с нечетным числом единиц ( ) медианной является срединное значение ранжированного ряда.

Пример 5.4.Рассчитать значение медианы по данным о стаже работы 11 –ти сотрудников предприятия: 7, 7, 5, 3, 3, 2, 4, 5, 6, 2, 2 (лет).

Решение. Строим ранжированный ряд:

х1 х2 х3 х4 х5 х6 х7 х8 х9 х10 х11

Число единиц равно 11 (нечетно). Находим номер медианы: = . На шестом месте стоит х6=4, который и является медианной: = 4 года.

В дискретном вариационном ряду с четным числом единиц ( ) медианной также является срединное значение ранжированного ряда. Вначале определяют ее место , а затем - находят как среднюю из двух центральных значений по формуле: .

Пример 5.5.Рассмотрим порядок вычисления медианы в случае четного числа индивидуальных значений.

Допустим, число сотрудников равно не 11, а 12 человек: 7, 7, 5, 3, 3, 2, 4, 5, 6, 2, 2, 6 (лет).

Тогда ранжированный ряд будет выглядеть следующим образом (добавляем одно значение, равное 6):

х1 х2 х3 х4 х5 х6 х7 х8 х9 х10 х11 х12

Порядковый номер медианы:

=

Это означает, что медиана расположена между шестым и седьмым значениями признака в ранжированном ряду, который содержит четное число единиц.

В этом случае медиана равна средней арифметической из соседних значений: 4 и 5.

=

В интервальном вариационном ряду сначала указывают интервал, в котором находится медиана. Медианный интервал – это первый интервал, в котором сумма накопленных частот превысит половину объема совокупности , т.е. > . Для его определения необходимо подсчитать сумму накопленных частот (частостей) до числа, превышающего половину объема совокупности.

Численное значение медианы определяется по формуле:

,

где: нижняя граница медианного интервала;

величина медианного интервала;

- половина объема совокупности;

- сумма накопленных частот, предшествующих медианному интервалу;

- частота медианного интервала.

В интервальном ряду медиану можно определить графически по кумуляте (см. § 3.5).

Пример 5.6.По данным табл. 3.4. рассчитать средний стаж работы 20-ти сотрудников туристского предприятия, моду и медиану распределения (табл. 5.3).

Решение. Ряд распределения является интервальным. Поэтому переходят к серединам соответствующих интервалов:

Таблица 5.3

Распределение сотрудников туристского предприятия по стажу работы

Стаж работы, лет (хi) Количество сотрудников, чел. (fi) Середин интервала, хi Накопленная частота, Fi
- 3 1,5 6,0
3 – 6 4,5 27,0
6 – 9 7,5 60,0
9 – 12 10,5 10.5
12 - 13,5 13,5
Итого - 117,0 -

Cредняя арифметическая = лет.

Для нахождения моды сначала определяется модальный интервал: , следовательно, модальным является интервал от 6 до 9 лет.

;

лет - наиболее часто встречающийся стаж сотрудников.

При нахождении медианы сначала определяют накопленную частоту каждого последующего интервала до тех пор, пока она не превысит 1/2 суммы накопленных частот > =10.

В нашем случае медианным является интервал с границами 6-9.

Теперь рассчитаем медиану:

лет – половина сотрудников имеет стаж до 6 лет, а половина – более 6 лет.

Следует заметить, что расчет модального и медианного значений для вариационных рядов с неравными интервалами осуществляется по аналогичным формулам. Для сопоставимости неравных интервалов вместо показателей частот (частостей) используются показатели абсолютной и относительной плотности распределения.

Медиана находит свое практическое применение вследствие особого свойства – сумма абсолютных отклонений членов ряда от медианы есть величина наименьшая, т.е. Это свойство медианы находит широкое применение в маркетинговой деятельности.

Таким образом, в соответствии с вышеизложенным, приходим к выводу:

§ средняя арифметическая - часто используется в качестве показателя центра распре­деления, положительные и отрицательные отклонения от которого индивидуальных значений признака в сумме взаимно погашаются;

§ мода М0 - это величина, вокруг которой группируется наибольшее количество единиц сово­купности.

§ медиана Ме- отражает значение признака, сумма отклонений от кото­рого является наименьшей величиной.

Соотношение моды М0, медианы Ме и средней арифметической указы­вает на характер распределения признака в совокупности, позволяет судить о симметричности эмпи­рического ряда распределения.

Рассмотрим возможные случаи соотношения моды, медианы и средней величины, определяющие характер распределения:

1. х = Me = Mo - симметричное рас­пределение;

2. < Ме < Мо - ле­восторонняя асимметрия;

3. Мо < Ме < - правосторонняя асимметрия.

Симметричное распределение –это распределе­ние, в котором частоты двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.

При левосторонней асиммет­рии большая часть единиц совокупности имеет значе­ния признака ниже модального. На графике распределения левая ветвь вытянута больше, чем правая.

При правостороннейасиммет­рии большая часть единиц совокупности имеет значения изучаемого признака, превышающие модальное значение. На графике распреде­ления правая ветвь относительно максимальной ординаты вытянута больше, чем левая.

Нашему примеру соответствует соотношение < Ме < Мо (5, 9 лет < 6 лет < 6,7 лет), характерное для левосторонней асим­метрии, что подтверждается графиком - гистограммой (рис. 3.3). Наличие левосторонней асиммет­рии свидетельствует о том, что большая часть сотрудников имеет стаж работы меньше, чем его модальное значение (8 лет).

Чем больше расхождение между средней арифметической и модой, тем более асимметричен ряд. Для умеренно ассиметричных рядов разность между модой и средней примерно в три раза превышает разность между медианой и средней:

.

В нашем случае, что свидетельствует о сильной асимметрии.

При анализе вариационного ряда важно знать не только направ­ление асимметрии (правосторонняя или левосторонняя), но и ее сте­пень, которая измеряется с помощью коэффициента асимметрии.

 

Контрольные вопросы

1. Дайте определение средней величины.

2. Каково значение средних величин в статистике?

3. Перечислите условия и задачи применения средних величин.

4. Назовите категории средних величин.

5. В чем состоит отличие простой средней от взвешенной?

6. Приведите формулы расчета степенных средних величин.

7. Сформулируйте правило мажорантности средних.

8. В чем состоит особенность расчета средних величин в интервальных рядах?

9. Назовите сферу применения степенных средних величин.

10. Перечислите свойства средней арифметической величины.

11. В чем состоит применение метода моментов при расчете средних величин?

12. Дайте определение и назовите сферу применения структурных средних величин.

13. В чем состоит специфика расчета структурных средних величин в дискретных и интервальных рядах распределения?

14. Перечислите возможные случаи соотношения моды, медианы и средней величины, определяющие характер распределения.