Методические рекомендации по выполнению заданий.

Пример 1. В результате эксперимента получена выборка для дискретного признака X объёма n = 50:

Требуется: 1) составить вариационный ряд; 2) составить таблицу относительных частот; 3) построить полигон.

Решение: 1) выбираем различные варианты из выборки и записываем в возрастающем порядке ( )

12 13 14 15 16 17 18 19 20;

2) для каждой варианты определяем частоты ni и вычисляем относительные частоты. Результаты записываем в таблицу:

ni

( );

3) полигон: по горизонтальной прямой откладываем значения вариант, а по вертикальной – значения относительных частот. Полигон не является графиком в смысле функциональной зависимости, а лишь графическое изображение таблицы относительных частот. Поэтому наименьшее значение варианты y наносим в точке пересечения осей.

 

Рис. 1. Полигон

Замечание. В теории вероятностей дискретная случайная величина Х задаётся законом распределения, записанным в виде таблицы:

Таблица 2

хi x1 x2 xn
pi p1 p2 pn

где хiзначения, принимаемые дискретной случайной величиной, pi – соответствующие им вероятности, причём

Этот закон геометрически изображается в виде ломаной линии на плоскости, соединяющей точки (хi; pi) и называемой многоугольником распределения.

В основе понятия вероятности лежит статистический подход – частота событий.

Частотой события А называется число , где n(A) – число появления события А в произведённых n независимых опытах. Эмпирически установлено, что для большого числа опытов частота обладает свойствами устойчивости, т.е. начинает колебаться около некоторого постоянного Р(А) и амплитуда этих колебаний уменьшается с увеличением n, т.е.

.

Таким образом, при достаточно большом объёме выборки, относительная частота в таблице начинает стремиться к Рi, т.е. эмпирический закон распределения дискретного признака будет приближаться к истинному (теоретическому) закону распределения (табл. 2), и, соответственно, полигон приближенно будет принимать форму многоугольника.

Непрерывный вариационный ряд: в этом случае для изучения непрерывного признака X по выборке составляют интервальный вариационный ряд. Для этого весь диапазон изменения признака X разбивают на k частичных интервалов равной длины и вычисляют относительную частоту попадания варианты в i- интервал: где ni – число членов выборки, попавших в i-интервал [ ].

Таблица 3

[ ] [c1;c2) [c2;c3) [cn;cn+1]

 

где =1, называется интервальной таблицей относительных частот.

Замечание. Если при построении интервалов какая-либо из вариантов попадает точно на границу соседних интервалов, то её относят к следующему (правому) интервалу. Для последующей обработки сгруппированных данных по формулам за значение интервала принимаем его середину (обозначим ), т.е. центральное значение.

Интервальная таблица относительных частот изображается в виде гистограммы относительных частот – ступенчатой фигурой, состоящей из прямоугольников, основаниями которых служат частичные интервалы длиной, равной , а площадь каждого i-го интервала Si равна соответствующей частоте , т.е. Si= .

Тогда высота i-го прямоугольника Нi равна: (i=1,2,…n).

При построении интервальных таблиц актуальными становятся вопросы о выборе числа интервалов и их длине. Они решаются конкретно для каждой задачи, исходя из целей исследования, объёма выборки и степени варьирования признака в выборке. Но приближенное число интервалов k и соответственно длину интервалов можно оценить исходя только из объёма n выборки. Делается это по формуле Стерджеса:

k=1+3,32lg n

или с использованием готовой таблицы.

Таблица 4

Объем выборки (n) Число интервалов (k)
25-40 5-6
40-60 6-8
60-100 7-10
100-200 8-12
Более 200 10-15

 

Длина частичных интервалов определяется по формуле

.