Графическое изображение вариационных рядов

 

Для наглядности статистические ряды представляют графиками, наиболее распространёнными являются полигон и гистограмма. Полигон применяется для изображения как дискретных, так и интервальных статистических рядов, гистограмма – для изображения только интервальных рядов. Покажем построение этих графиков на примере.

Для построения гистограммы частот на оси абсцисс откладываем частичные интервалы значений случайной величины , на каждом из которых строим прямоугольник, высота которого равна соответствующей частоте интервала . Если на гистограмме частот соединить середины верхних сторон элементарных прямоугольников, то полученная замкнутая ломаная образует полигон распределения частот (рис. 1). По гистограмме приближённо определим моду (см. подраздел 5.1).

Замечание: в теории вероятностей гистограмме и полигону относительных частот соответствует график функции плотности распределения. По виду полигона делают первоначальное предположение о законе распределения исследуемой случайной величины.

 

 

Рисунок 1. – Графическое изображение вариационного ряда.

 

4. Эмпирическая функция распределения

Пусть известен статистический ряд количественного признака X. Введем обозначения: – число наблюдений, при которых наблюдалось значение признака меньше (накопленная частота); n – объем выборки; – относительная частота события (относительная накопленная частота).

Эмпирической функцией распределения называют функцию , равную относительной накопленной частоте события :

.

В отличии эмпирической функции распределения выборки, интегральную функцию распределения генеральной совокупности называют теоретической функцией распределения. Теоретическая функция распределения определяет вероятность события : , эмпирическая – относительную частоту этого события. Вследствие закона больших чисел (теорема Бернулли) относительная частота события , т.е. стремится по вероятности к вероятности этого события, т.е. к . обладает всеми свойствами , а именно:

1) ;

2) – неубывающая функция;

3) =0 при , – наименьшая варианта;

4) =1 при , – наибольшая варианта.

Эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности. В столбец «Накопленная частота» таблицы 2 запишем значения, полученные по формуле:

 

 

Таблица 2.

Интервалы Середина интервала Частота Накопленная частота Относительная накопленная частота
[6,75; 7,18) 6,97 0,03
[7,18; 7,61) 7,40 0,09
[7,61; 8,04) 7,83 0,11
[8,04; 8,47) 8,26 0,25
[8,47; 8,9) 8,69 0,39
[8,9; 9,33) 9,12 0,63
[9,33; 9,76) 9,55 0,77
[9,76; 10,19) 9,98 0,89
[10,19; 10,62) 10,41 0,98
[10,62; 11,05) 10,84 1,00

 

Рисунок 2. – График эмпирической функции распределения.

 

Для построения графика эмпирической функции распределения (кумуляты) на оси абсцисс откладывают интервалы, на оси ординат – относительные накопленные частоты, соответствующие правым границам интервала. на левой границе первого интервала равна нулю. Кумулята представляет собой ломанную линию (рис. 2). По кумуляте приближённо определим значение медианы (см. подраздел 5.1).