Асимметрия и эксцесс распределения
ТЕМА 3. Первичные описательные статистики
Цель:формирование представлений об основных числовых характеристиках статистического распределения; усвоение методов расчета статистических показателей.
Литература: [1], с. 58-89; [2], с. 10-14; [4], с.40-47; [5], с.20-23.
Меры центральной тенденции
Среднее
|
= + С
|
=0
|
= С
|
= С
|
Рис. 3.1. Среднее и его основные свойства
Пусть совокупность разбита на группы со средними объемами n грi.
|
,
где n=
|
Рис. 3.2. Нахождение общей средней по групповым средним
| Мода |
| Значение признака mo, которое имеет наибольшую частоту встречаемости |
| Медиана |
| Значение признака me, которое делит вариационный ряд пополам |
Рис. 3.3. Понятия моды и медианы
Меры положения
| Квантили распределения |
| Процентили |
| Квартили |
| Медиана |
| 99 значений признака (Р1,…, Р99), которые делят вариационный ряд на 100 частей, равных по численности |
| 3 значения признака (Р25, Р50, Р75), которые делят все значения на 4 равные по количеству части |
Рис. 3.4. Квантили распределения
Меры изменчивости
Дисперсия
|
| D(Х+С) =D(Х) |
| D(С) = 0 |
| D(СХ) =С2 D(Х) |
Рис. 3.5. Дисперсия и ее основные свойства
Пусть совокупность разбита на группы со средними , дисперсиями Dгрi и объемами n грi.
|
Внутригрупповая дисперсия
|
Межгрупповая дисперсия
|
|
Рис. 3.6. Нахождение общей дисперсии
| Размах |
| Разность максимального и минимального значений признака |
| Исключающий |
| Включающий |
| Разность между естественными верхней и нижней границами интервала, включающего минимальное и максимальное значения признака |
Рис. 3.7. Типы размаха
| Среднее отклонение |
md =
|
| Стандартное отклонение |
|
Рис. 3.8. Понятия среднего и стандартного отклонений
Асимметрия и эксцесс распределения
Показатель асимметрии
Аs=
|
| Показывает степень отклонения графика распределения частот от симметричного вида относительно среднего значения |
Показатель эксцесса
Еk=
|
| Показывает степень плосковершинности или остроконечности графика распределения измеренного признака |
Рис. 3.9. Показатели асимметрии и эксцесса
Рис. 3.10. Соотношение моды, медианы и среднего
при разной асимметрии
АЛГОРИТМ 3 нахождения медианы для выборочных данных:
1) упорядочить все значения признака по возрастанию;
2) если объем выборки равен нечетному числу n=2к+1, то медиана является центральным значением признака, т.е. me=хк+1;
3) если объем выборки равен четному числу n=2к, то медианой является среднеарифметическое двух центральных значений, т.е. me=(хк+хк+1)/2;
4) если по данным выборки составлено частотное распределение, значение медианы, определяемое п.п. 2) или 3), определяется подсчетом частот для выяснения хк и хк+1.
ПРИМЕР 1.Получена выборка объемом n = 14. Признак имеет следующие значения 1, 1, 2, 2, 3, 3, 3, 5, 5, 5, 5, 6, 6, 8. Найти среднее, моду и медиану для данного вариационного ряда.
Решение.
Составим частотное распределение:
| Х | ||||||
| n |
Тогда среднее
=
.
Для нахождения моды выясним, какое значение имеет наибольшую частоту встречаемости. Это n=4 у х=5. Поэтому мода mo=5.
Объем выборки n = 14, число четное, тогда медиана будет равна me=(х7+х8)/2. Чтобы найти х7 и х8 будем складывать частоты до тех пор, пока не получим 7 и 8: 2+2+3… В результате х7=3, х8=5. Тогда me=(3+5)/2=4.
ПРИМЕР 2.Для предыдущего примера 1 найти дисперсию среднеквадратичное отклонение.
Решение. Первый способ. По определению
. Тогда
=
4,07.
Найдем
=
2,02.
Второй способ. По теореме D=
-
2.
Найдем
=
. Тогда
19,5 –
2 4,07.
ЗАДАНИЯ для самоконтроля
1. Выберите из ниже перечисленных понятий те, которые являются мерами центральной тенденции: мода, квартиль, среднее, размах, отклонение, медиана.
2. Какая мера центральной тенденции является подходящей для номинативных данных?
3. В каком случае мода, медиана и среднее совпадают?
4. С каким действием над вариационным рядом связано нахождение квантилей?
5. Каким процентилям соответствуют медиана? Квартили?
6. Чем отличается исключающий размах от включающего? В каком случае важно это различие?
7. Почему на практике чаще используют стандартное отклонение, чем дисперсию?
8. Назовите способы вычисления дисперсии.
9. Какие из ниже перечисленных мер не изменятся и почему, если одно из крайних значений вариационного ряда увеличить в 2 раза: мода, среднее, медиана, квартиль, размах, стандартное отклонение. А если уменьшить на 2?
10. Как определяется коэффициент вариации, и что он характеризует?
11. Как по соотношению среднего и медианы можно судить о виде асимметрии?
12. Каким по знаку эксцессом характеризуется островершинное распределение? Плосковершинное?
13. При каком распределении показатели асимметрии и эксцесса совпадают и равны нулю?
=
=0
= С
=
С
объемами n грi.
,
где n=