Построение непрерывного (интервального) вариационного ряда и его графическое изображение

При построении интервальных рядов распределения, прежде всего, устанавливают число групп (интервалов), на которые разбиваются все единицы изучаемой совокупности (см. тему сводка и группировка).

Величина интервала должна определяться в соответствии с точностью данных наблюдения.

Пример 2. Имеются данные о содержании дубильных веществ в 50 образцах черного байхового чая:

6,5 7,5 7,4 6,8 8,4
8,1 7,8 8,3 7,9 7,6
7,1 8,4 6,8 7,8 7,2
8,1 7,8 8,5
7,2 7,6 7,4 7,4 7,5
7,6 7,7 8,7 8,4 6,8
7,3 7,6 7,8 8,6 7,2
7,9 7,8 8,6 7,8
7,6 6,5 8,9 8,5 8,2
7,5 7,8 8,8 8,9

1. Постройте ряд распределения, разбив все данные на 6 групп с равными интервалами.

2. По данным ряда распределения вычислите среднее содержание дубильных веществ, среднее квадратическое отклонение и коэффициент вариации.

3. Укажите модальный интервал ряда распределения и моду.

4. Данные о содержании дубильных веществ в чае представьте на графике и сделать выводы.

Решение: Исходя, из заданного количества групп находим длину интервала.

Длина интервала (L) определяется по формуле:

L = R / n,

где R = X max – X min – размах вариации, при этом

X max – максимальное значение группировочного признака,

X min – минимальное значение группировочного признака.

L =(8,9-6,5)/6=0,4

Ряд распределения содержания дубильных веществ будет иметь следующий вид:

Содежание дубильных 6,5-6,9 6,9-7,3 7,3-7,7 7,7-8,1 8,1-8,5 8,5-8,9 Всего
веществ в %
Количество образцов
( ¦i ) - частоты

Среднее содержание дубильных веществ, среднее квадратическое отклонение и коэффициент вариации определяются соответственно по формулам:

, где

`х – средняя арифметическая взвешенная;

х1, х2, …, хn – среднее содержание дубильных веществ в каждом из интервалов;

f1, f2, …, fn – частоты, веса варьирующего признака.

`х =(6×6,7+7×7,1+12×7,5+13×7,9+6×8,3+6×8,7)/(6+7+12+13+6+6)=7,9(%)

Средняя квадратическая:

- Простая средняя квадратическая s=

- Взвешенная средняя квадратическая s=

s – средняя квадратическая;

хi – значение (варианты) некоторой совокупности, где i принимает значение от 1 до 6;

fi - частота (вес) варьирующего признака (i = );

`х – средняя арифметическая (простая взвешенная);

s=(6×(6,7-7,9)2+7×(7,1-7,9)2+12×(7,5-7,9)2+13×(7,9-7,9)2+6×(8,3-7,9)2+6×(8,7-7,9)2)/ (6+7+12+13+6+6)=0,59(%)

Коэффициент вариации: V=(s/`х )×100%=(0,59/7,9)×100%=7,5(%)

Модальным интервалом будет интервал (7,7 – 8,1) как наиболее часто встречающийся в общем количестве образцов.

Для графического изображения интервальных вариационных рядов используется гистограмма. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (или частостям) интервала.

Гистограмма ряда распределения содержания дубильных веществ в нашем частном случае будет иметь следующий вид:

количество

образцов (¦i)

 

 


 

Гистограмма может быть преобразована в полигон распределения, если середина верхних сторон прямоугольников соединить отрезками прямых. Две крайние точки прямоугольников замыкаются на оси абсцисс, на середине интервалов, в которых частоты (частности) равны нулю.

Мода определяется по гистограмме распределения. Для этого правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисс точки пересечения этих прямых и будет модой распределения.

Коэффициент вариации V=7,5(%) показывает, что средняя величина является характерной характеристикой исследуемого ряда. Модальная величина, полученная графически, отличается от средней арифметической взвешенной величины.