Расчетно-графическая часть

Москва, 2011


Оглавление

1. Исходные данные. 3

2. Вариационные ряды распределения. 3

2.1. Задание. 3

2.2. Расчетно-графическая часть. 3

2.2.1. Вариант «Настриг шерсти». 5

2.2.2. Вариант «Длина волоса шерсти». 8

3. Средние величины, показатели вариации и распределения. 11

3.1. Задание. 11

3.2. Расчетное задание. 11

3.2.1. Вариант «Настриг шерсти». 14

3.2.2. Вариант «Длина волоса шерсти». 16

4. Корреляционный анализ. 19

4.1. Задание. 19

4.2. Расчетное задание. 19

4.2.1. Расчетно-графическая часть. 22

 


 

Исходные данные

Из исходных данных был выбран вариант №8 Таблицы 1, вариант №9 Таблицы 2.

Про ранжированные массивы исходных данных приведены в Таблице 1 настоящей работы.

Таблица 1. Исходные данные

№ п/п Настриг шерсти, кг (y) Длина волоса шерсти, см (x)
12,4
4,1
4,2 13,8
4,2 14,4
4,2 14,5
4,3 14,9
4,3 15,4
4,4 16,8
4,5 16,8
4,5 16,9
4,7 17,3
4,8 17,4
4,8 17,4
4,8
4,8 19,5
4,9
4,9 20,6
4,9 20,8
4,9 21,2
21,3
5,1 21,3
5,1 22,3
5,2 22,5
5,2 22,7
5,4 24,2

 

Вариационные ряды распределения

Задание

Постройте интервальные ряды распределения настрига и длины волоса шерсти, отобразите их графически в виде гистограмм, полигонов и кумулят.

Расчетно-графическая часть

Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой латинского алфавита f. Общая сумма частот вариационного ряда равна объему данной совокупности, т. е.

где k – число групп, n – общее число наблюдений, или объем совокупности.

Частоты (веса) выражают не только абсолютными, но и относительными числами – в долях единицы или в процентах от общей численности вариант, составляющих данную совокупность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частностей равна единице

или ,

если частоты выражены в процентах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необходимой в тех случаях, когда приходится сопоставлять друг с другом вариационные ряды, сильно отличающиеся по их объемам.

В зависимости от того, как варьирует признак – дискретно или непрерывно, в широком или узком диапазоне, – статистическая совокупность распределяется в безынтервальный или интервальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариационного ряда, во втором – подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам (от – до), на которые разбивается общая вариация признака в пределах от минимальной до максимальной варианты данной совокупности. Эти промежутки, или классовые интервалы, могут быть равными и не равными по ширине. Отсюда различают равно- и неравноинтервальные вариационные ряды. В неравноинтервальных рядах характер распределения частот меняется по мере изменения ширины классовых интервалов. Неравноинтервальную группировку в биологии применяют сравнительно редко. Как правило, биометрические данные распределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисление сводных числовых характеристик вариационного ряда, сопоставление рядов распределения друг с другом.

Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка (когда устанавливают очень широкие классовые интервалы) искажает типичные черты варьирования и ведет к снижению точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования.

Для получения хорошо обозримого вариационного ряда иобеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от минимальной до максимальной варианты) на такое число групп или классов, которое удовлетворяло бы обоим требованиям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построении вариационного ряда:

,

где h – величина интервала; Xмax и Xmin – максимальное и минимальное значения в совокупности; k – число групп.

При построении интервального ряда распределения необходимо выбирать оптимальное число групп (интервалов признака) и установливать длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной. Если приходится иметь дело с интервальным рядом распределения с неравными интервалами, то для сопоставимости нужно частоты или частости привести к единице интервала, полученное значение называется плотностью ρ, то есть .

Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:

где n – численность совокупности.

Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, – это интервалы значений варьирующего признака, а высоты столбиков – частоты, соответствующие масштабу по оси ординат. Диаграмма такого типа называется гистограммой.

Если имеется дискретный ряд распределения или используются середины интервалов, то графическое изображение такого ряда называется полигоном, которое получается соединением прямыми точек с координатами Xi и fi.

Если по оси абсцисс откладывать значения классов, а по оси ординат – накопленные частоты с последующим соединением точек прямыми линиями, получается график, называемый кумулятой. Накопленные частоты находят последовательным суммированием, или кумуляцией частот в направлении от первого класса до конца вариационного ряда.

2.2.1. Вариант «Настриг шерсти»

По формуле Стерждесса определим число групп:

k = 1 + 3,322 lg(25) = 5,644 ≈ 6,

где n – численность совокупности.

Рассчитаем длину (размах) интервала по формуле:

.

Построим интервальный ряд с 6 группами и интервалом 0,24 кг шерсти (Таблица 2). Для построения графиков в таблице рассчитаем середину интервалов и накопленную частоту.

Таблица 2. Интервальный ряд распределения настрига шерсти

Номер интервала Группа овец по величине веса настрига, Yi Число овец Середина интервала Накопленная частота
нижняя граница верхняя граница fi Yi fi
4,24 4,12
4,24 4,48 4,36
4,48 4,72 4,6
4,72 4,96 4,84
4,96 5,2 5,08
5,2 5,44 5,32
Итого: х х

 

Построим гистограмму распределения настрига шерсти (Рис. 1):

Рисунок 1. Диаграмма распределения настрига шерсти

Данные гистограммы показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже – крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения.

Полигон и кумулята распределения настрига шерсти имеют вид (Рис. 2 и 3).

Рисунок 2. Полигон распределения настрига шерсти

 

Рисунок 3. Кумулята распределения настрига шерсти

 

2.2.2. Вариант «Длина волоса шерсти»

По формуле Стерждесса определим число групп:

k = 1 + 3,322 lg(25) = 5,644 ≈ 6

где n – численность совокупности.

Рассчитаем длину (размах) интервала по формуле:

.

Построим интервальный ряд с 6 группами и интервалом 1,97 см шерсти (Таблица 3). Для построения графиков в таблице рассчитаем середину интервалов и накопленную частоту.

Таблица 3. Интервальный ряд распределения длина волоса шерсти

Номер интервала Группа овец по величине волоса, Xi Число овец Середина интервала Накопленная частота
нижняя граница верхняя граница fi Хi fi
12,4 14,37 13,385
14,37 16,34 15,355
16,34 18,31 17,325
18,31 20,28 19,295
20,28 22,25 21,265
22,25 24,22 23,235
Итого х х

 

Построим гистограмму распределения настрига шерсти (Рис. 4):

Рисунок 4. Гистограмма распределения настрига шерсти

Данные гистограммы показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже – крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения.

Полигон и кумулята распределения настрига шерсти имеют вид (Рис. 5 и 6).

 

Рисунок 5. Полигон распределения длины волоса шерсти

 

Рисунок 6. Кумулята распределения длины волоса шерсти