Асимметрия и эксцесс распределения

ТЕМА 3. Первичные описательные статистики

Цель:формирование представлений об основных числовых характеристиках статистического распределения; усвоение методов расчета статистических показателей.

Литература: [1], с. 58-89; [2], с. 10-14; [4], с.40-47; [5], с.20-23.

 

Меры центральной тенденции

Среднее
= + С
=0
= С
= С

 

 


Рис. 3.1. Среднее и его основные свойства

Пусть совокупность разбита на группы со средними объемами n грi.
, где n=  

 

 


Рис. 3.2. Нахождение общей средней по групповым средним

 

Мода
Значение признака mo, которое имеет наибольшую частоту встречаемости
Медиана
Значение признака me, которое делит вариационный ряд пополам

 


Рис. 3.3. Понятия моды и медианы

Меры положения

Квантили распределения
Процентили
Квартили
Медиана
99 значений признака (Р1,…, Р99), которые делят вариационный ряд на 100 частей, равных по численности
3 значения признака (Р25, Р50, Р75), которые делят все значения на 4 равные по количеству части

 


Рис. 3.4. Квантили распределения

Меры изменчивости

Дисперсия

 

 

D(Х+С) =D(Х)
D(С) = 0
D(СХ) =С2 D(Х)

 


Рис. 3.5. Дисперсия и ее основные свойства

Пусть совокупность разбита на группы со средними , дисперсиями Dгрi и объемами n грi.
Внутригрупповая дисперсия
Межгрупповая дисперсия

 

 


 

 

 


Рис. 3.6. Нахождение общей дисперсии

 

Размах
Разность максимального и минимального значений признака
Исключающий
Включающий
Разность между естественными верхней и нижней границами интервала, включающего минимальное и максимальное значения признака

 


Рис. 3.7. Типы размаха

 

Среднее отклонение
md =
Стандартное отклонение

 


Рис. 3.8. Понятия среднего и стандартного отклонений

 

 

Асимметрия и эксцесс распределения

 

Показатель асимметрии Аs=
Показывает степень отклонения графика распределения частот от симметричного вида относительно среднего значения
Показатель эксцесса Еk=
Показывает степень плосковершинности или остроконечности графика распределения измеренного признака

 

 


Рис. 3.9. Показатели асимметрии и эксцесса

Рис. 3.10. Соотношение моды, медианы и среднего

при разной асимметрии

 

 

АЛГОРИТМ 3 нахождения медианы для выборочных данных:

1) упорядочить все значения признака по возрастанию;

2) если объем выборки равен нечетному числу n=2к+1, то медиана является центральным значением признака, т.е. meк+1;

3) если объем выборки равен четному числу n=2к, то медианой является среднеарифметическое двух центральных значений, т.е. me=(хкк+1)/2;

4) если по данным выборки составлено частотное распределение, значение медианы, определяемое п.п. 2) или 3), определяется подсчетом частот для выяснения хк и хк+1.

 

ПРИМЕР 1.Получена выборка объемом n = 14. Признак имеет следующие значения 1, 1, 2, 2, 3, 3, 3, 5, 5, 5, 5, 6, 6, 8. Найти среднее, моду и медиану для данного вариационного ряда.

Решение.

Составим частотное распределение:

 

Х
n

 

Тогда среднее = .

Для нахождения моды выясним, какое значение имеет наибольшую частоту встречаемости. Это n=4 у х=5. Поэтому мода mo=5.

Объем выборки n = 14, число четное, тогда медиана будет равна me=(х78)/2. Чтобы найти х7 и х8 будем складывать частоты до тех пор, пока не получим 7 и 8: 2+2+3… В результате х7=3, х8=5. Тогда me=(3+5)/2=4.

ПРИМЕР 2.Для предыдущего примера 1 найти дисперсию среднеквадратичное отклонение.

Решение. Первый способ. По определению . Тогда = 4,07.

Найдем = 2,02.

Второй способ. По теореме D= - 2.

Найдем = . Тогда

19,5 – 2 4,07.

 

ЗАДАНИЯ для самоконтроля

1. Выберите из ниже перечисленных понятий те, которые являются мерами центральной тенденции: мода, квартиль, среднее, размах, отклонение, медиана.

2. Какая мера центральной тенденции является подходящей для номинативных данных?

3. В каком случае мода, медиана и среднее совпадают?

4. С каким действием над вариационным рядом связано нахождение квантилей?

5. Каким процентилям соответствуют медиана? Квартили?

6. Чем отличается исключающий размах от включающего? В каком случае важно это различие?

7. Почему на практике чаще используют стандартное отклонение, чем дисперсию?

8. Назовите способы вычисления дисперсии.

9. Какие из ниже перечисленных мер не изменятся и почему, если одно из крайних значений вариационного ряда увеличить в 2 раза: мода, среднее, медиана, квартиль, размах, стандартное отклонение. А если уменьшить на 2?

10. Как определяется коэффициент вариации, и что он характеризует?

11. Как по соотношению среднего и медианы можно судить о виде асимметрии?

12. Каким по знаку эксцессом характеризуется островершинное распределение? Плосковершинное?

13. При каком распределении показатели асимметрии и эксцесса совпадают и равны нулю?