Асимметрия и эксцесс распределения
ТЕМА 3. Первичные описательные статистики
Цель:формирование представлений об основных числовых характеристиках статистического распределения; усвоение методов расчета статистических показателей.
Литература: [1], с. 58-89; [2], с. 10-14; [4], с.40-47; [5], с.20-23.
Меры центральной тенденции
Среднее |
= + С |
=0 |
= С |
= С |
Рис. 3.1. Среднее и его основные свойства
Пусть совокупность разбита на группы со средними объемами n грi. |
, где n= |
Рис. 3.2. Нахождение общей средней по групповым средним
Мода |
Значение признака mo, которое имеет наибольшую частоту встречаемости |
Медиана |
Значение признака me, которое делит вариационный ряд пополам |
Рис. 3.3. Понятия моды и медианы
Меры положения
Квантили распределения |
Процентили |
Квартили |
Медиана |
99 значений признака (Р1,…, Р99), которые делят вариационный ряд на 100 частей, равных по численности |
3 значения признака (Р25, Р50, Р75), которые делят все значения на 4 равные по количеству части |
Рис. 3.4. Квантили распределения
Меры изменчивости
Дисперсия |
D(Х+С) =D(Х) |
D(С) = 0 |
D(СХ) =С2 D(Х) |
Рис. 3.5. Дисперсия и ее основные свойства
Пусть совокупность разбита на группы со средними , дисперсиями Dгрi и объемами n грi. |
Внутригрупповая дисперсия |
Межгрупповая дисперсия |
Рис. 3.6. Нахождение общей дисперсии
Размах |
Разность максимального и минимального значений признака |
Исключающий |
Включающий |
Разность между естественными верхней и нижней границами интервала, включающего минимальное и максимальное значения признака |
Рис. 3.7. Типы размаха
Среднее отклонение |
md = |
Стандартное отклонение |
Рис. 3.8. Понятия среднего и стандартного отклонений
Асимметрия и эксцесс распределения
Показатель асимметрии Аs= |
Показывает степень отклонения графика распределения частот от симметричного вида относительно среднего значения |
Показатель эксцесса Еk= |
Показывает степень плосковершинности или остроконечности графика распределения измеренного признака |
Рис. 3.9. Показатели асимметрии и эксцесса
Рис. 3.10. Соотношение моды, медианы и среднего
при разной асимметрии
АЛГОРИТМ 3 нахождения медианы для выборочных данных:
1) упорядочить все значения признака по возрастанию;
2) если объем выборки равен нечетному числу n=2к+1, то медиана является центральным значением признака, т.е. me=хк+1;
3) если объем выборки равен четному числу n=2к, то медианой является среднеарифметическое двух центральных значений, т.е. me=(хк+хк+1)/2;
4) если по данным выборки составлено частотное распределение, значение медианы, определяемое п.п. 2) или 3), определяется подсчетом частот для выяснения хк и хк+1.
ПРИМЕР 1.Получена выборка объемом n = 14. Признак имеет следующие значения 1, 1, 2, 2, 3, 3, 3, 5, 5, 5, 5, 6, 6, 8. Найти среднее, моду и медиану для данного вариационного ряда.
Решение.
Составим частотное распределение:
Х | ||||||
n |
Тогда среднее = .
Для нахождения моды выясним, какое значение имеет наибольшую частоту встречаемости. Это n=4 у х=5. Поэтому мода mo=5.
Объем выборки n = 14, число четное, тогда медиана будет равна me=(х7+х8)/2. Чтобы найти х7 и х8 будем складывать частоты до тех пор, пока не получим 7 и 8: 2+2+3… В результате х7=3, х8=5. Тогда me=(3+5)/2=4.
ПРИМЕР 2.Для предыдущего примера 1 найти дисперсию среднеквадратичное отклонение.
Решение. Первый способ. По определению . Тогда = 4,07.
Найдем = 2,02.
Второй способ. По теореме D= - 2.
Найдем = . Тогда
19,5 – 2 4,07.
ЗАДАНИЯ для самоконтроля
1. Выберите из ниже перечисленных понятий те, которые являются мерами центральной тенденции: мода, квартиль, среднее, размах, отклонение, медиана.
2. Какая мера центральной тенденции является подходящей для номинативных данных?
3. В каком случае мода, медиана и среднее совпадают?
4. С каким действием над вариационным рядом связано нахождение квантилей?
5. Каким процентилям соответствуют медиана? Квартили?
6. Чем отличается исключающий размах от включающего? В каком случае важно это различие?
7. Почему на практике чаще используют стандартное отклонение, чем дисперсию?
8. Назовите способы вычисления дисперсии.
9. Какие из ниже перечисленных мер не изменятся и почему, если одно из крайних значений вариационного ряда увеличить в 2 раза: мода, среднее, медиана, квартиль, размах, стандартное отклонение. А если уменьшить на 2?
10. Как определяется коэффициент вариации, и что он характеризует?
11. Как по соотношению среднего и медианы можно судить о виде асимметрии?
12. Каким по знаку эксцессом характеризуется островершинное распределение? Плосковершинное?
13. При каком распределении показатели асимметрии и эксцесса совпадают и равны нулю?