Виды средних величин и порядок их вычисления

Средние величины являются наиболее распространенной формой статистических показателей, используемой в социально – экономических исследованиях. Средняя дают обобщенную характеристику, и ее можно во многих случаях определить через исходное соотношение средней (ИСС) или ее логическую формулу:

ИСС=

В статистике выделяют несколько видов средних величин:

1. По наличию признака - веса:

а) невзвешенная средняя величина;

б) взвешенная средняя величина.

2. По форме расчета:

а) средняя арифметическая величина;

б) средняя гармоническая величина;

в) средняя геометрическая величина;

г) средняя квадратическая, кубическая и т.д. величины.

3. По охвату совокупности:

а) групповая средняя величина;

б) общая средняя величина.

Средние величины различаются в зависимости от учета признаков, влияющих на осредняемую величину:

Если средняя величина рассчитывается для признака, без учета влияния на него каких-либо других признаков, то такая средняя величина называется средней невзвешенной или простой средней.

Если имеются сведения о влиянии на осредняемый признак некоторого признака или нескольких признаков, которые необходимо учесть при расчете для корректного расчета средней величины, то рассчитывается средняя взвешенная.

Средние, которые применяются в статистике, относятся к классу степенных, общая форма которых имеет вид[2]:

В зависимости от значения m определяется вид средней:

m=1 - средняя арифметическая

m=2 - средняя квадратическая

m=3 - средняя кубическая

m=-1 -средняя гармоническая

m=0 - средняя геометрическая

Следует отметить, что вид средней зависит от цели исследования и исходной информации.

- правило мажорантности. Это соотношение будет сохраняться при любых значениях признаков.

Средняя арифметическая

Средняя арифметическая является самым распространенным видом средней. Поэтому, когда речь идет о средней величине и не указывается ее вид, то чаще всего подразумевается именно средняя арифметическая. Она применяется, когда объем варьирующего признака для всей совокупности образуется как сумма значений признака у отдельных единиц. Она может быть простой и взвешенной.

Простая средняя арифметическая. Простой средней арифметической называется сумма данных величин, деленная на их число.

Если даны величины то их средняя арифметическая есть[3]:

.
Простая средняя арифметическая применяется тогда, когда каждое явление, характеризующее индивидуальное значение варьирующего признака, встречается в совокупности один раз, т.е. не повторяется или повторяется одинаковое число раз. Простая средняя применяется для сгруппированных данных.

Приведем пример. В зависимости от условий и качества работы месячная заработная плата аппаратчиков колеблется от 12 до 16 тысяч рублей и принимает следующие размеры: 12000, 13000, 14000, 15000 и 16000 рублей.

В этом примере данные о значении признака встречаются один раз , и поэтому средний размер заработной платы следует рассчитывать по формуле средней арифметической простой.

=

Средняя арифметическая взвешенная применяется тогда, когда каждое значение варьирующего признака встречается в совокупности по несколько раз. При этом используются веса или частота признака f:

В целом, использование частот в работе с большими числами позволяет упрощать расчеты, когда частота выражена большими, многозначными числами.

 

Далее перечислим свойства средней арифметической[4]:

1. Средняя постоянной величины равна ей самой

2. Произведение средней на сумму частот равно сумме произведений вариантов на частоты:

3. Изменение каждого варианта на одну и ту же величину изменяет среднюю на ту же величину:

4. Изменение каждого варианта в одно и то же число раз изменяет среднюю в столько же раз:

5. Изменение каждого из весов в одно и то же число раз не изменяет величины средней:

 

6. Алгебраическая сумма отклонений всех вариантов от средней равна нулю:

 

7. Средняя суммы равна сумме средних:

8. Сумма квадратов отклонений вариантов от средней арифметической меньше, чем от любых других величин:

Существует также упрощенный способ расчета арифметической (способ моментов). Среднюю арифметическую можно рассчитать следующим образом, используя ее свойства:

1. Вычесть из всех вариант постоянное число (середина ряда, любое значение варианты)

2. Разделить полученные разности на постоянное число (величину интервала)

3. Частоты выразить в долях

4. Применить способ отсчета от условного начала (момента)

m – момент первого порядка

- начало отсчета

d – величина интервала

k – величина интервала всего ряда

 

Средняя хронологическая

Другим видом средней является средняя хронологическая. Средняя

хронологическая представляет собой средний уровень ряда динамики, т.е. средняя, исчисленная по совокупности значений показателя в разные моменты или периоды времени[5]. В зависимости от вида ряда динамики применяются различные способы ее расчета, а именно расчет: средней хронологической интервального ряда; средней хронологической моментного ряда.

Средней хронологической интервального ряда является средняя величина из уровней интервального ряда динамики. Она исчисляется по формуле:

,

где -средний уровень ряда;

y – уровень ряда динамики;

n – число членов ряда.

Средней хронологической моментного ряда является средняя величина из уровней моментного ряда динамики. Если f(t) есть функция, выражающая изменение моментного показателя во времени, то за время t от a до b средняя хронологическая моментного ряда равна:

Однако данных непрерывного наблюдения значения f(t) в распоряжении статистики, как правило, нет. Поэтому в зависимости от характера изменения показателя и имеющихся данных применяются различные методы расчета. При равных промежутках времени между датами, на которые имеются данные, и равномерном изменении размера показателя между датами средняя хронологическая моментного ряда обычно исчисляется оп формуле:

,

где y – уровень ряда;

n – число всех членов ряда;

- средний уровень.

Если периоды времени, отделяющие одну дату от другой, не равны между собой, то расчет средней хронологической моментного ряда производится по формуле средней взвешенной арифметической, в качестве весов которой принимаются отрезки времени между датами, т.е по формуле:

,

где Т – время, в течение которого данный уровень ряда остается без изменения.

 

Средняя гармоническая

Средняя гармоническая применяется в тех случаях, когда имеются общие веса и индивидуальные значения признаков. Она рассчитывается, частоты не приводятся непосредственно, а входят сомножителями в один из имеющихся показателей. Средняя гармоническая – это величина, обратная средней арифметической из обратных значений признаков. Применяется простая и взвешенная.

Простая:

Используется в том случае, когда значения общего веса для единиц совокупности равны.

Взвешенная[6]:

,

где - значения общего веса для единиц совокупности.

В качестве весов принимают не единицы совокупности, носительницы признака, а произведения этих единиц на значения признаков.

Например, имеются данные о плановом и фактическом объеме добычи нефти в отдельных ПО Поволжья (см. табл. 3).

Таблица 1

Добыча нефти

(тыс.т)

ПО План Фактическое выполнение Выполнение плана, %
Татнефть Башнефть Куйбышевнефть 100,1

 

Источник: В.П.Калинина, Т.В. Диденко «Статистика нефтяной и газовой промышленности», часть I, Москва, 1983, с.29

Для вычисления средней гармонической нужно:

1) веса разделить на соответствующие варианты;

2) суммировать веса;

3)суммировать частные от деления весов на варианты;

4) сумму весов разделить на сумму частных от деления весов на варианты.

В вышеприведенном примере степень выполнения плана будет рассчитана следующим образом:

Средняя геометрическая

Средняя геометрическая рассчитывается также по формуле простой и взвешенной[7].

Простая:

Взвешенная:

Средняя арифметическая взвешенная получила наиболее широкое примение при анализе рядов динамики для расчета среднего темпа роста.

Средняя квадратическая

Для средней квадратической существуют формулы постой и взвешенной:

- простая;

-взвешенная .

Наиболее широко эту среднюю применяют при анализе вариационного ряда для расчета дисперсии и коэффициента вариации.

В статистике находят применение степенные средние и более высокого порядка.

Структурные средние

В статистике употребляется еще две разновидности средних величин, которые вытекают из характеристики статистических рядов и не являются результатом каких – либо алгебраических действий – это структурные средние: мода и медиана. При условии недостаточности исходных данных, которая в ряде случаев объективно может возникнуть при сборе информации (например, коммерческая тайна), предпочтение отдается структурным, или позиционным средним – моде или медиане.

Модой называют значение признака, которой наиболее часто встречается в данной совокупности. Т.е. это величина признака с наибольшей частотой или частостью.

Существуют случаи, когда два и даже более значений признака повторяются одинаково максимальное число раз. В этом случае имеют дело с бимодальным распределением признака и его мультимодальным его распределением. Наличие двух и более модальных значений может означать неоднородность исследуемой совокупности.

При отсутствии повторяющихся значений признака в совокупности первичных данных для определения моды необходимо предварительно выполнить группировку, в результате чего получить интервальный ряд распределения.

Тогда мода определяется по формуле[8]:

,

где - нижняя граница модального интервала,

- частота модального интервала,

- частота предмодального интервала,

- частота послемодального интервала,

d – величина модального интервала.

Модальным называется интервал, которому соответствует наибольшая частота.

Итак, приведем пример расчета моды из интервального ряда на основании данных проходки на долото.

 

 

Таблица 2

Проходка на долото

Проходка на долото,м Число долот Кумулятивная частота
0,5 – 3,0 3,0 – 5,5 5,5 – 8,0 8,0 – 10,5 10,5 – 13,0  
Итого *

Источник: В.П.Калинина, Т.В. Диденко «Статистика нефтяной и газовой промышленности», часть I, Москва, 1983, с.46

Для нахождения моды, в первую очередь, нужно определить модальный интервал. Модальным будет интервал, которому соответствует наибольшая частота. В данном примере наибольшей частотой обладает(42) обладает интервал (3,0 – 5,5), где значение варианты лежит в пределах от 3,0 до 5,5м. Это и есть модальный интервал.

Его нижняя граница 3,0 величина модального интервала, определяемая как разность между максимальным и минимальным значением признака. равна: 42 -15=27; 42 -19=23.

Следовательно:

Медиана – это значение варьирующего признака, которое делит ранжированный ряд данных на две равные части. Вследствие, 50% единиц исследуемой совокупности имеют значения признака меньше, чем медиана, а 50% - значения признака больше чем медиана.

Если число членов ряда нечетное, медианой будет средний член ряда по порядку: при 9 членах ряда – пятый, при 5 – третий и т.д. Когда число членов ряда четное, медианой является средняя из двух вариант, находящихся в середине ряда.

Когда медиану определяют по несгруппированным (первичным)

данным, сначала необходимо расположить их в порядке возрастания. После определяют номер той единицы, значение признака у которой будет соответствовать медиане: ,

порядковый номер медианы,

n – число единиц совокупности.

Когда расчет медианы производят по сгруппированным данным, то медиана соответствует варианте, стоящей в середине ранжированного ряда[9]:

,

где - верхняя граница предмедианного интервала;

- частота медианного интервала;

d- величина медианного интервала;

- сумма накопленных частот в интервале, предшествующем медианному.

Медианным называют интервал, кумулятивная (накопленная) частота которого равна или превышает полусумму накопленных частот ряда и ближе всего к ней расположена.

Кумулятивную частоту образуют путем постепенного суммирования частот, начиная с первого интервала.

Далее приведем пример расчета медианы в интервальном ряду на основе данных таблицы 2.

Медианным будет интервал от 3,0 до 5,5. Расчет медианы будет следующий:

 

Далее необходимо отметить, что медиана обладает свойством, которое заключается в том, что сумма абсолютных величин линейных отклонений от медианы минимальна[10].

Это свойство очень важно при практическом применении медианы.