Глава 6. Показатели вариации

Понятие вариации

Показатели вариации

Правило сложения дисперсий

Показатели структуры распределения

6.5. Показатели формы распределения

 

Понятие вариации

Статистическая совокупность содержит однокачественные и в то же вре­мя варьирующие единицы в пределах изучаемой закономерности. Поэтому для того чтобы судить о типичности средней, ее следует дополнить показа­телями, характеризующими вариацию величины изучаемого при­знака.

В этой связи обязательным этапом в изучении вариационных рядов является расчет показателей размера и интенсивности вариации. Термин «вариация» происходит от лат. variatio – изменение, колеблемость, различие. Различают случайную и систематическую вариацию.

Средняя величина дает обобщающую характеристику всей со­вокупности единиц, типический уровень признака, которым обладают все единицы. При этом два ряда распределения, имеющие одинаковую среднюю арифметическую величину , могут значительно отличаться друг от друга по степени колеблемости (ва­риации) величины изучаемого признака (рис 6.1).

 

Рис. 6.1. Вариация величины изучаемого признака

 

Поэтому следует учитывать два обстоятельства:

1) если индивидуальные зна­чения признака мало отличаются друг от друга, то средняя арифметическая будет достаточно показательной характеристикой свойств совокупности;

2) если ряд распределения характе­ризуется значительным рассеиванием индивидуальных значении признака , то средняя арифметическая будет ненадежной характеристикой этой совокупности и ее практическое применение будет ограничено.

Таким образом, в ряде случаев ряды распределения, построенные по одному и тому же признаку, могут иметь разную степень вариации этого признака при одной и той же величине его средне­го уровня. Средняя величина не показывает структуру совокупности.

Исследование вариации в статистике имеет большое значение, так как помогает изучить сущность явления. Измерение вариации, выяснение ее причин, выявление влияния отдельных факторов дают важную информацию для принятия обоснованных управленческих решений.

Обязательным этапом в изучении вариационных рядов является расчет показателей размера и интенсивности вариации.

Показатели вариации

 

Для измерения вариации признака используются абсолютные и относительные показатели вариации.

Показатели вариации рассчитываются для статистических совокупностей, упорядоченных путем группировок, классификаций, построения рядов распределений.

Расчет показателей вариации позволяет:

1) дать характеристику отклонения отдельных значений признака от общей средней;

2) оценить однородность статистической совокупности.

Для характеристики размера вариации в статистике применяются абсолютные показатели вариации:

• размах вариации (R);

• среднее линейное отклонение ( );

• дисперсия ;

• среднее квадратическое отклонение .

Размах вариации R (размах колебаний) - представляет собой разность между максимальным хтax. и минимальным xmin. значениями при­знака:

Размах вариации зависит от величины только крайних значений признака и не отражает его колеблемость внутри совокупности.

Для группировок с открытым интервалами (первым и последним), когда неизвестны реальные минимальные и максимальные значения признака, расчет размаха вариации некорректен.

Поэтому область его применения ограничена достаточно однородными совокупностями. В частности, на практике он находит применение в предупредительном контроле качества продукции.

Более точно характеризуют вариацию признака показатели, основанные на учете колеблемости всех значений признака. Среднее линейное отклонение и среднее квадратическое отклонение показывают, на сколько в среднем отличаются индивидуальные значения признака от его среднего значения. Эти показатели имеют те же единицы измерения, что и варианты признака, и его средняя величина. Порядок расчета показателей различен для несгруппированных и сгруппированных данных.

Среднее линейное отклонение ( ) - это средняя арифметическая из абсолютных значений отклонений отдельных вариантов признака от средней арифме­тической .

Для расчета этого показателя применяют сле­дующие формулы:

• для несгруппированных данных (простое):

где: - индивидуальные значения признака у единицы совокупности;

- сред­няя величина признака в совокупности;

n - число единиц совокуп­ности.

• для сгруппированных данных (взвешенное):

Простое среднее линейное отклонение вычисляется в случае, когда каждый вариант повторяется один раз, а расчет взвешенного среднего линейного отклонения производится на основе вариационного ряда с неравными частотами.

В расчетах по указанным формулам отклонения представлены без учета знака. Это объясняется тем, что по свойству средней арифметической сумма отклонений индиви­дуальных значений признака от средней равна нулю. Поэтому сфера применения среднего линейного отклонения как меры вариации признака ограничена, за исключением тех случаев, когда суммирование показа­телей без учета знаков имеет экономический смысл. В связи с этим более широкое распространение в качестве показателя степени ва­риации получило среднее квадратическое отклонение .

Дисперсия - это средний квадрат отклонений значе­ний признака от их средней величины.

В зависимости от исходных данных, дисперсию можно вычислять по средней арифметической простой или взве­шенной.

Для ее расчета используют следующие формулы:

для несгруппированных данных (простая):

для сгруппированных данных (взвешенная):

Формулу для расчета дисперсии можно преобразовать:

Таким образом, дисперсия равна разности средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,

При использовании этой формулы исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от его средней величины. В результате, за счет этого уменьшается ошибка, связанная с округлением значений промежуточных вычислений.

Свойства дисперсии

Дисперсия обладает рядом свойств, которые позво­ляют упростить ее вычисления:

1. дисперсия постоянной величины равна нулю;

2. если все варианты значений признака уменьшить на одно и то же число С, то дисперсия не изменится (это означает, что дисперсия не зависит от начала отсчета);

3. если все варианты значений признака уменьшить (увеличить) в к раз, то дисперсия уменьшится (увеличиться) в к2 раз (это означает, что величина дисперсии зависит от масштаба измерения исследуемого признака);

4. Дисперсия алгебраической суммы независимых случайных величин равна сумме их дисперсий:

5. Свойство минимальности дисперсии: , т.е. для любого постоянного числа, не равного средней арифметической, справедливо равенство,

Дисперсия не дает представления об однородности совокупности, по ней трудно дать экономическую интерпретацию, так как она рассчитывается в квадратных единицах. Эту проблему можно преодолеть, рассчи­тав среднее квадратическое отклонение.

В ходе расчетов следует помнить, что размах вариации, среднее линейное и среднее квадратическое отклонение являются именованными величинами, т.е. имеют ту же единицу измерения, что и изучаемый признак. Дисперсия единицы измерения не имеет.

Среднее квадратическое отклонение является абсолютной ме­рой вариации и представляет собой корень квадратный из диспер­сии:

Смысловое содержание этого показателя такое же, как и сред­него линейного отклонения: чем меньше его величина, тем од­нороднее совокупность и тем, соответственно, типичнее средняя величина.

Формулы для расчета среднего квадратического отклонения имеют следующий вид:

для несгруппированных данных (простое):

для сгруппированных данных (взвешенное):

Величина часто используется в качестве единицы измерения отклонений от средней арифметической. Отклонение, выраженное в , называется нормированным (стандартизованным).

Среднее квадратическое отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних.

В симметричных распределениях среднее квадратическое отклонение составляет приблизительно 1,25 среднего линейного отклонения, т.е. или

Это соотношение зависит от наличия в совокупности резких отклонений и может служить индикатором «засоренности» совокупности нетипичными, выделяющимися из основной массы единицами.

Дисперсия и среднее квадратическое отклонение являются наиболее широко применяемыми показателями вариации. Это объясняется тем, что они входят в большинство теорем теории вероятностей, служащих фундаментом математической статистики. Также дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов на вариацию признака. В последующих главах будет показано, как дисперсия используется для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений и т.д.

Квартильное отклонение ,

где: и - соответственно третий и первый квартиль распределения.

Оно применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.

В симметричных или умерено асимметричных распределениях выполняется равенство: Так как на квартальное отклонение не влияют отклонения всех значений признака, то его следует использовать, когда определение среднего квадратического отклонения затруднительно или невозможно. Например, этот показатель может применяться для рядов распределения с открытыми интервалами, где в качестве характеристики центра распределения использовалась медиана.

Дисперсия и среднее квадратическое отклонение используются в следующих случаях:

§ расчеты, связанные с организацией выборочного наблюдения;

§ оценка полученных на основе выборки статистических показателей;

§ построение показателей тесноты корреляционной связи.

В условиях нормального (симметричного) распределения существует следующая зависимость между величиной среднего квадратического отклонения и количеством наблюдений (правило «трех сигм»):

§ в пределах располагается 0,683 количества наблюдений;

§ в пределах располагается 0,954 количества наблюдений;

§ в пределах располагается 0,997 количества наблюдений.

Отклонение ±3 можно считать максимально возможным.

Для оценки интенсивности вариации, а также для сравнения ее ве­личины в разных совокупностях или по разным признакам использу­ют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака (или медиане). К ним относятся:

§ Коэффициент осцилляции:

§ Относительно линейное отклонение:

§ Относительный показатель квартильной вариации:

§ Коэффициент вариации:

Наиболее часто применяется коэффициент вариации. Его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности.

Чем больше величина коэффициента ва­риации , тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определе­ния степени однородности совокупности в зависимости от значений коэффициента вариации (табл. 6.1).

Таблица 6.1