Взвешенная средняя арифметическая
Обычно, чтобы рассчитать среднюю арифметическую, складывают все значения признака и полученную сумму делят на число вариантов. В этом случае каждое значение, входя в сумму, увеличивает ее на полную свою величину. Но не всегда это возможно. Иногда значения признака должны входить в сумму с неодинаковой поправкой. Эта поправка, выраженная определенным множителем, называется математическим весом значения.
Средняя, рассчитанная для значений признака с неодинаковыми весами, называется взвешенной средней. Взвешенная средняя арифметическая рассчитывается по следующей формуле:
, (6.4)
где:
Xi – значение признака, варианта;
p – математический вес усредняемого значения.
Чтобы рассчитать взвешенную среднюю арифметическую, необходимо каждое значение признака помножить на его вес, все эти произведения сложить и полученную сумму разделить на сумму весов.
Пример
Имеются результаты двух исследований длины хоботка пчел: в одном случае получена средняя длина хоботка 6,6 мм, в другом – 6,0 мм. Требуется получить общую среднюю, причем известно, что в первом исследовании были измерены хоботки у 100 пчел, во втором – у 20.
В данном случае значениями признака являются средние μ1 = 6,6 и μ2 = 6,0 мм; их весами – численности групп n1 = 100 и n2 = 20. Взвешенная средняя арифметическая рассчитывается следующим образом:
.
Пример
В 100 кг кормовой смеси содержатся следующие количества отдельных кормов:
сена 50 кг, с содержанием белка 3%
молотой овсяной соломы 10 кг, с содержанием белка 1%
жмыха подсолнечного 20 кг, с содержанием белка 33%
отрубей пшеничных грубых 20 кг, с содержанием белка 11%
Требуется определить содержание белка в данной смеси.
Для решения этой задачи необходимо рассчитать взвешенную среднюю арифметическую. Значениями признака будет содержание белка в отдельных кормах: 3; 1; 33 и 11%, а их математическими весами — физические веса кормов, входящих в смесь: 50; 10; 20 и 20 кг. Содержание в смеси переваримого белка:
,
т. е. в каждом килограмме смеси содержится 104 г переваримого белка.
Таким же способом рассчитываются среднее выхода продукта по нескольким партиям сырья.
Пример
Проведены три независимых наблюдения числа сокращений пульсирующей вакуоли у амебы в определенной среде. В первом наблюдении зарегистрировано 24 сокращения в 1 час, во втором – 16 и в третьем – 23, причем первое наблюдение длилось 2, второе – 6 и третье –1 час. Для определения среднего числа сокращений в час необходимо найти взвешенную среднюю арифметическую. Значениями признака будут наблюдавшиеся количества сокращений в час (24, 16 и 23), их весами – продолжительность отдельных наблюдений (2, 6 и 1 час). Следовательно,
.
Простая средняя в данном случае: даст завышенную характеристику.
Средняя квадратическая
Средняя квадратическая вычисляется по формуле:
, (6.5)
Она равна корню квадратному из суммы квадратов данных, деленной на их число.
Например, если имеется пять вариантов: 1, 4, 5, 5, 5, то средняя квадратическая:
.
Употребляется средняя квадратическая при расчете средних радиусов окружностей.
Пример
Измерения диаметров колоний, полученных от посева микробов определенного вида, дали следующие результаты (в мм): 15; 20; 10; 25; 30.
Для сравнения этого посева с другими требуется определить средний диаметр колоний. Применив формулу средней квадратической, имеем
.
Средняя арифметическая диаметров:
дает неправильную характеристику группы.
Это можно проверить по правилу единства суммарного действия.
Общая площадь всех пяти колоний была:
3,14× (7,52+102+52+12,52+152) = 1766,25 мм2.
Если взять пять кругов с одинаковым диаметром, равным средней арифметической μ = 20, то общая площадь составит 5×З,14×102 = 1570 мм2, что гораздо меньше общей фактической площади.
Если же взять пять кругов с одинаковым диаметром, равным средней квадратической S = 21,22 мм2, то общая площадь будет 5×З,14× 10,612 = 1767,4 мм2, т. е. практически той же суммарной площади, которую имели пять измеренных колоний.
Мода
Модой, или модусом, называется такая варианта или класс распределения вариант, который в исследуемой группе особей встречается наиболее часто. В качестве примера рассмотрим распределение, представленное в таблице 6.2.
Таблица 6.2 – Пример распределения
Классы | 100 – 119 | 120 – 139 | 140 – 159 | 160 – 179 | 180 – 199 | 200 – 219 | 220 – 239 | 240 – 259 | 260 – 279 | 280 – 299 | 300 – 319 |
Частоты |
В этом распределении наиболее многочисленным является пятый класс (180 – 199) с частотой 250. Это модальный класс.
В качестве первого приближения можно принять за моду средину модального класса, т. е. 190.
Более точное значение моды можно получить по формуле:
, (6.6)
где:
М0 – мода;
Wα – начало модального класса;
k – величина классового промежутка;
f1 – частота класса, предшествующего модальному;
f2 – частота модального класса;
f3 – частота класса, следующего за модальным.
Для приведенного распределения Wα = l80, k = 20, f1 = 160,
f2 = 250, f3 = 240 (таблица 6.3).
Следовательно, мода этого распределения
Обычно, если классы взяты не слишком мелкие, имеется всего один модальный класс.
В некоторых распределениях встречаются два или три модальных класса. Иногда это может быть следствием того, что в изучаемую группу попал разнородный материал, относящийся к разным категориям (более крупной и менее крупной) по изучаемому признаку.
Медиана
Медианой называют такое значение признака, которое разделяет всю группу на две равные части: одна часть имеет значения признака меньшее, чем медиана, а другая – большее.
Например, если имеется группа из 9 значений признака; 1, 2, 3, 4, 5, 6, 7, 8, 9, то медианой этой группы будет 5.
Для многочисленных групп медиану можно рассчитать по формуле:
, (6.7)
где:
Ме – медиана;
Wα – начало того класса, в котором находится медиана;
k – величина классового промежутка; n – общее число данных в группе;
– сумма частот классов (начиная с меньшего), предшествующих классу, в котором находится медиана;
f – частота класса, в котором находится медиана.
Нахождение медианы можно показать для распределения, представленного в таблице 6.3.
Таблица 6.3 – Пример нахождения медианы
Номера классов | ||||||||||||
Начала классов | 100–120 | 120–140 | 140–160 | 160–180 | 180–200 | 200–220 | 220–240 | 240–260 | 260–280 | 280–300 | 300–320 | |
Частоты | n=1000 | |||||||||||
Накопленные частоты |
Судя по ряду накопленных частот, медиана находится в шестом классе, так как в первых пяти классах имеется 492 варианта, а меньше медианы должна быть половина всей группы, т. е. 500 вариантов. Недостающие до 500 восемь вариантов находятся в шестом классе.
Для данного распределения Wα = 200, k =20, = 492, f = 240, а медиана равна:
.
Медиана, обладая в полной мере всеми общими свойствами средних величин, дает начало целой серии показателей разнообразия, которые носят общее название квантилей. Квантиль – это такое значение признака, которое отсекает в распределении определенную часть вариантов больше себя и определенную часть вариантов меньше себя. К таким показателям относятся кроме медианы (средней величины) показатели, разнообразия: квартили, децили и перцентили.
Три квартиля разделяют группу на четыре равночисленные части. Второй квартиль равен медиане, а расстояние между третьим и первым квартилями является одним из показателей степени разнообразия значений признака в группе.
Девять децилей разделяют группу на десять равночисленных частей. Пятый дециль равен медиане, а расстояние между девятым и первым децилями служит одним из показателей разнообразия.
Девяносто девять перцентилей делят группу на сто равночисленных частей. Пятидесятый перцентиль равен, медиане; девяносто девятый и первый перцентиль используются иногда в качестве максимума и минимума группы; расстояние между девяносто девятым, и первым перцентилями служит показателем размаха признака и разнообразия вариантов в этой группе.
Средняя геометрическая
Чтобы получить среднюю геометрическую для группы с n данными, нужно все варианты перемножить и из полученного произведения извлечь корень n-й степени:
, (6.8)
где:
G – средняя геометрическая;
n – число значений;
ΠXn – произведение вариантов.
Например, средняя геометрическая из 12 и 3 будет равна:
.
Если число значений больше двух, то извлечение корня n-й степени затруднительно, поэтому обычно значение средней геометрической находят путем логарифмирования величин, входящих в основную формулу:
. (6.9)
Например, для вариантов 1; 4; 5; 5; 5 среднюю геометрическую можно получить следующим образом:
;
;
G = 3,465.
Для проверки правильности вычисления средней геометрической можно использовать принцип единства суммарного действия. Произведение всех пяти значений ( ) равно произведению пяти выровненных значений, равных средней геометрической:
.
Это значит, что средняя в данном случае рассчитана правильно.
Применяется средняя геометрическая во всех случаях, когда необходимо узнать или планировать средние приросты за определенный период. При расчетах среднего попериодного прироста возможны два способа применения средней геометрической.
Первый способ применяется, когда имеются сведения о приростах за каждый период, выраженных в процентах или долях от начала каждого периода. В таких случаях расчет среднего прироста ведется по формуле:
, (6.10)
где:
х – средний попериодный прирост за ряд периодов равной продолжительности;
а – фактический прирост за тот или иной период, выраженный в долях;
n – число периодов;
Π(1+а) – произведение величин (1+а).
Из этой формулы следует, что для нахождения среднего прироста по первому способу нужно долю фактического прироста за каждый период прибавить к единице, полученные величины (1+а) перемножить, из их произведения извлечь корень n-й степени и вычесть единицу.
Если периодов много (n > 2), то извлечение корня надо проводить логарифмированием:
. (6.11)
По этой формуле находят логарифмы средней геометрической из величин (1+a), затем находится сама величина G(1+a) и вычитанием из нее единицы получается искомая средняя доля прироста.
Пример
Поголовье бобров в заповеднике увеличилось за первый год на 5%, за второй – на 20%, за третий – на 50% и за четвертый – на 50%, считая каждый раз от начала истекшего года. Требуется определить среднегодовой прирост за эти 4 года.
Необходимые расчеты приведены в таблице 6.4.
Таблица 6.4 – Расчет среднегодового прироста
Годы | Фактический прирост за каждый год | l + a | lg(l + a) | |
% | доля | |||
0,05 | 1,05 | 0,021 | ||
0,20 | 1,20 | 0,079 | ||
0,50 | 1,50 | 0,176 | ||
0,50 | 1,50 | 0,176 |
Второй способ расчета средних приростов применяется в тех случаях, когда имеются данные об абсолютных количествах объектов на начало и конец общего большого периода и требуется рассчитать средний прирост за более мелкие периоды.
В таких случаях средний прирост рассчитывается по формуле:
. (6.12)
При логарифмировании получаем:
, (6.13)
где:
х – средний прирост за более мелкие периоды: среднегодовой за пятилетку, среднемесячный за год, среднесуточный за месяц и т. д.;
Аn – количество объектов на конец общего периода, или, что то же самое, на конец последнего n-го мелкого периода;
А1 – количество объектов на начало исследуемого общего периода, или, что то же самое, на начало первого мелкого периода.
Пример
На пасеке на начало пятилетки было 100 ульев, а к концу стало 140. Определить среднегодовой процент увеличения пасеки за эту пятилетку. Применяя указанную формулу, получим:
;
x + 1 = 1,0697, x = 0,0697 или 6,97%
Пример
Запланировано за пять лет увеличить производство пенициллина на 60%. Требуется распределить это задание равномерно по годам. В данном случае не даны абсолютные количества в начале и в конце общего периода, но дан общий процент прироста за весь период – 60%, что дает возможность легко получить требуемое отношение . Объем продукции должен увеличиться на 60%. Это значит, что на каждые 100 единиц, бывших в начале общего периода, должно быть 160 единиц в конце:
An = 160, A1 = 100,
Для выполнения такого задания среднегодовой прирост производства пенициллина можно запланировать следующим образом:
;
х +1 = 1,0985, х = 0,0985, или 9,85 %.
Оказалось, что для увеличения производства за пятилетку на 60% достаточно обеспечить среднегодовой прирост на 9,85%, а не на , как это могло показаться без учета того, что средний прирост образуется по принципу средней геометрической, а не средней арифметической.
Средняя гармоническая
Средняя гармоническая рассчитывается по формуле
. (6.14)
Для пяти вариантов: 1, 4, 5, 5 средняя гармоническая:
.
Применяется средняя гармоническая при усреднении меняющихся скоростей.
Пример
Почтовые голуби одной станции к месту кормежки летят со скоростью 50 км/час, а в обратном направлении – со скоростью 40 км/час. Если ничего больше неизвестно и требуется выяснить среднюю скорость полета для обоих направлений (расстояния, очевидно, равны), то сделать это можно, рассчитав простую среднюю гармоническую для двух значений 50 и 40:
.
Пример
Рысак на тренировках пробегал одну за другой три дистанции, различные по состоянию дороги. Скорость на первой дистанции составляла 13 км/час, на второй – 25 км/час и на третьей – 10 км/час. Длина дистанций не сообщается: известно, что первая дистанция была в 2 раза, а вторая в 4 раза длиннее третьей. По этим данным можно определить показанную рысаком среднюю скорость по всем трем дистанциям, рассчитав не простую, а взвешенную среднюю гармоническую из значений 13, 20, 10 соответственно с весами 2, 4, 1 по формуле:
. (6.15)
Взвешивание скоростей производится обычно по расстояниям. Поскольку в данном примере расстояния неизвестны, то весами могут служить отношения первой и второй дистанции к третьей. Такая замена математических весов не повлияет на точность результата, так как для правильного расчета взвешенной средней гармонической имеют значение не абсолютные величины расстояний, а их отношения
.
Вопросы для самоконтроля
1 Каковы основные свойства средних величин?
2 Какие средние величины используются в биологии?
3 По какой схеме между минимальным и максимальным значениями признака расположены средние значения?
4 По какому признаку (суммарному результату) следует выбирать для расчетов ту или иную среднюю?
5 Каковы математические свойства средней арифметической?
6 Какими двумя способами можно рассчитывать среднюю из относительных величин?
7 Что означает ранжирование признаков объекта?
8 В каких случаях применяется взвешенная средняя?
9 В каких случаях целесообразно пользоваться средней геометрической? Формула средней геометрической и ее преобразование с помощью логарифмов.
10 Приведите пример в биологии для применения средней квадратической.
11 Необходимо ли знать фактические длины для вычисления средней скорости на нескольких разных дистанциях или достаточно знать их соотношение?
12 Что характеризует мода распределения?
13 Может ли квантиль совпадать с медианой?
14 Дать определения квантиля, квартиля, дециля и перцентиля.
15 Могут ли совпасть значения средней арифметической, медианой и модой?
ТЕМА 7 Разнообразие значений признака
7.1 Стандартное (среднеквадратическое) отклонение
7.2 Проверка выпадов (артефактов)
7.3 Средняя и сигма суммарной группы
7.4 Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
Всякая группа состоит из особей или объектов, отличающихся друг от друга по каждому из признаков. Различия эти иногда очень велики, иногда они почти незаметны, но они всегда имеются в группе, так как невозможно найти даже двух абсолютно одинаковых особей. Это второе основное свойство всякой группы – состоять из неодинаковых объектов по любому признаку – точнее всего определяется термином разнообразие признака в группе.
Часто этому групповому свойству даются другие названия: изменчивость, рассеяние, колеблемость, вариабильность, разброс.