Методические рекомендации по выполнению заданий.

Пример 1. В результате эксперимента получена выборка для дискретного признака X объёма n = 50:

Требуется: 1) составить вариационный ряд; 2) составить таблицу относительных частот; 3) построить полигон.

Решение: 1) выбираем различные варианты из выборки и записываем в возрастающем порядке ( )

12 13 14 15 16 17 18 19 20;

2) для каждой варианты определяем частоты n_i и вычисляем относительные частоты. Результаты записываем в таблицу:


n_i

( );

3) полигон: по горизонтальной прямой откладываем значения вариант, а по вертикальной – значения относительных частот. Полигон не является графиком в смысле функциональной зависимости, а лишь графическое изображение таблицы относительных частот. Поэтому наименьшее значение варианты y наносим в точке пересечения осей.

Рис. 1. Полигон

Замечание. В теории вероятностей дискретная случайная величина Х задаётся законом распределения, записанным в виде таблицы:

Таблица 2

х_i	x₁	x₂	…	x_n
p_i	p₁	p₂	…	p_n

где х_i – значения, принимаемые дискретной случайной величиной, p_i – соответствующие им вероятности, причём

Этот закон геометрически изображается в виде ломаной линии на плоскости, соединяющей точки (х_i; p_i) и называемой многоугольником распределения.

В основе понятия вероятности лежит статистический подход – частота событий.

Частотой события А называется число , где n(A) – число появления события А в произведённых n независимых опытах. Эмпирически установлено, что для большого числа опытов частота обладает свойствами устойчивости, т.е. начинает колебаться около некоторого постоянного Р(А) и амплитуда этих колебаний уменьшается с увеличением n, т.е.

Таким образом, при достаточно большом объёме выборки, относительная частота в таблице начинает стремиться к Р_i, т.е. эмпирический закон распределения дискретного признака будет приближаться к истинному (теоретическому) закону распределения (табл. 2), и, соответственно, полигон приближенно будет принимать форму многоугольника.

Непрерывный вариационный ряд: в этом случае для изучения непрерывного признака X по выборке составляют интервальный вариационный ряд. Для этого весь диапазон изменения признака X разбивают на k частичных интервалов равной длины и вычисляют относительную частоту попадания варианты в i- интервал: где n_i – число членов выборки, попавших в i-интервал [ ].

Таблица 3

[ ]	[c₁;c₂)	[c₂;c₃)	…	[c_n;c_n+1]
			…

где =1, называется интервальной таблицей относительных частот.

Замечание. Если при построении интервалов какая-либо из вариантов попадает точно на границу соседних интервалов, то её относят к следующему (правому) интервалу. Для последующей обработки сгруппированных данных по формулам за значение интервала принимаем его середину (обозначим ), т.е. центральное значение.

Интервальная таблица относительных частот изображается в виде гистограммы относительных частот – ступенчатой фигурой, состоящей из прямоугольников, основаниями которых служат частичные интервалы длиной, равной , а площадь каждого i-го интервала S_i равна соответствующей частоте , т.е. S_i= .

Тогда высота i-го прямоугольника Н_i равна: (i=1,2,…n).

При построении интервальных таблиц актуальными становятся вопросы о выборе числа интервалов и их длине. Они решаются конкретно для каждой задачи, исходя из целей исследования, объёма выборки и степени варьирования признака в выборке. Но приближенное число интервалов k и соответственно длину интервалов можно оценить исходя только из объёма n выборки. Делается это по формуле Стерджеса:

k=1+3,32lg n

или с использованием готовой таблицы.

Таблица 4

Объем выборки (n)	Число интервалов (k)
25-40	5-6
40-60	6-8
60-100	7-10
100-200	8-12
Более 200	10-15

Длина частичных интервалов определяется по формуле