Статистическое распределение выборки
Пусть из генеральной совокупности извлечена выборка, причем
наблюдалось
раз,
—
раз,
—
раз и
— объем выборки. Наблюдаемые значения
называют вариантами, а последовательность вариант, записанных в возрастающем порядке, — вариационным рядом. Числа наблюдений называют частотами, а их отношения к объему выборки
— относительными частотами.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.
Заметим, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — соответствие между наблюдаемыми вариантами и их частотами, или относительными частотами.
Пример. Задано распределение частот выборки объема n = 20:

Написать распределение относительных частот.
Решение: Найдем относительные частоты, для чего разделим частоты на объем выборки:
,
,
.
Напишем распределение относительных частот:

Контроль: 0,15 + 0,50 + 0,35=1.
Эмпирическая функция распределения
Пусть известно статистическое распределение частот количественного признака X. Введем обозначения:
— число наблюдений, при которых наблюдалось значение признака, меньшее х; n — общее число наблюдений (объем выборки). Ясно, что относительная частота события X<х равна
. Если х изменяется, то, вообще говоря, изменяется и относительная частота, т.е. относительная частота
есть функция от х. Так как, эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.
Эмпирической функцией распределения (функцией распределения выборки) называют функцию
, определяющую для каждого значения х относительную частоту события X<х.
Итак, по определению, 
где
— число вариант, меньших х; n — объем выборки.
В отличие от эмпирической функции распределения выборки функцию распределения
генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция
определяет вероятность события X<х, а эмпирическая функция
определяет относительную частоту этого же события.
обладает всеми свойствами
. Действительно, из определения функции
вытекают следующие ее свойства:
1. значения эмпирической функции принадлежат отрезку [0, 1];
2.
— неубывающая функция;
3. если
— наименьшая варианта, то
при
; если
— наибольшая варианта, то
при
.
Полигон и гистограмма
Для наглядности строят различные графики статистического распределения и, в частности, полигон и гистограмму.
Полигоном частот называют ломаную, отрезки которой соединяют точки
,
, …,
. Для построения полигона частот на оси абсцисс откладывают варианты
, а на оси ординат – соответствующие им частоты
. Точки
соединяют отрезками прямых и получают полигон частот.
Пример. Построить полигон частот по данному распределению выборки:

Решение:


Рис.14
В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала
- сумму частот вариант, попавших в i-й интервал.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению
(плотность частоты).