Последовательность обработки данных.

1. Запись данных.

Полученные данные записываются в произвольном порядке. Рекомендуется составить таблицу, записывая по 10 чисел в каждую строчку.

2. Определение размаха.

Размах выборки вычисляется по формуле:

R = Xmax - Xmin , где: Xmax - наибольшее значение; Xmin - наименьшее значение.

Таблица 2-1. Определение числа интервалов
Объём выборки n 10-20 20-40 40-60 60-100 100-200 более200
Число интервалов k 5-6 6-8 7-10 8-12 10-15

3. Установление числа интервалов.

Вся выборка разбивается на интервалы одинаковой длины. Число интервалов k определяется из таблицы 2-1:

4.Вычисление границ интервалов. Каждый интервал имеет нижнюю и верхнюю границы. Они обозначаются, как правило, Нi и Вi, где i - номер интервала. Верхняя граница предыдущего интервала, кроме последнего, равна или меньше нижней границы последующего интервала.

- Вычисляется высота (ширина) h интервала по формуле: h = R / k

- Вычисляются нижние границы интервалов. Их обозначают:

Хн1 - нижняя граница первого интервала,

Хн2 - нижняя граница второго интервала,

Хн3 - нижняя граница третьего интервала и т.д.

Для вычисления нижних границ применяются следующие формулы:

Хн1 » Хmin- h/ 2, Хн2 = Хн1+h, Хн3 = Хн2+h … Хнi = Хнi-1+h где: i = 1,2,3...

- Вычисляются верхние границы интервалов. Их обозначают:

Хв1 – верхняя граница первого интервала,,

Хв2 - верхняя граница второго интервала,,

Хв3 - верхняя граница третьего интервала …

Для вычисления верхних границ применяются следующие формулы:

Хв1 = Хн2 - l , где l - точность измерения.(число знаков после запятой обрабатываемых числовых данных). Это может быть: l = 0,1; l =0,01; l = 0,001; …

Хв2 = Хн3 - l, Хв3 = Хн4 - l и т.д.

В некоторых случаях число интервалов может получиться на один больше чем выбранное число k, а именно k+1интервал. Это зависит от ширины интервала, значение которой надо округлять по избытку. В таком случае число интервалов рекомендуется брать фактическое, а не расчетное.

Таблица 2-2. Статистическая (вариационная) таблица
Номер интервала, i Границы интервалов, x1 -xi Срединное значение интервалов Распределение данных Частота, ni Накопительная частота, mi Частость, fi Накопительная частость, Fi
             
             
...              
k              
Сумма       S1 =   S2=  

5. Составление таблицы. Вычерчивается таблица по образцу таблицы 2-2. Полученные выше результаты вносятся в таблицу. В дальнейшем таблица заполняется по мере готовности результатов обработки.

6. Вычисление частоты (встречаемость) значений выборки в каждом интервале.

Уславливается число данных, попавших в каждый интервал. Для упрощения такой работы, в столбике 4 делаются отметины (черточка, точка или другой знак) против интервала, куда попадает очередное значение. После окончания перебора всех данных, эти знаки пересчитываются, а в столбике 5 записывается их число. Для контроля суммируется столбик 5 – сумма должна быть равной объему выборки n.

n1 - число данных в первом интервале; n2 - число данных во втором интервале; …

ni - число данных в i-м интервале.

7. Вычисление накопительная частота m.

Определяется путем суммирования частот всех предыдущих интервалов: m1=n1, m2=m1+n2, m3=m2+n3, ... , mi=mi-1+ni.

8. Вычисление частостей f.

Определяется как число, равное отношению числа данных (частоты, записанной в столбике 5) в рассматриваемом интервале к объему всей выборки (число всех данных). А именно: f1= n1/n, f2=n2/n,... , fi = ni/n . Для контроля суммируется столбик 7 – сумма должна быть равной 1.

9. Вычисление накопительных частностей F.

Определяется путем суммирования частостей всех предыдущих интервалов: F1=f1, F2= F1+ f2 , F3= F2+ f3 и т.д. Значение последней суммы равно 1.

Для повышения наглядности эмпирических распределений используется их графическое представление.

10. Построение гистограммы.

Система прямоугольников, примыкающих друг к другу: ширина их равна ширине интервалов, которая откладывается по одной оси координат. Высота - равна значениям, откладываемым по другой оси.

В прямоугольной системе координат по оси абсцисс (ось ОХ) откладываются интервалы, взятые из таблицы (столбик 2). Значение нижней границы первого интервала можно брать в любом месте оси ОХ. На рисунке это место указано стрелкой. От нее и до начала отсчета масштаб может не устанавливаться. Поэтому эту границу отмечают достаточно близко к точке пресечения осей координат. По оси ординат (ось ОУ) откладываются значения одного из столбиков таблицы (столбики 5-8). Проводятся линии параллельные осям так, чтобы получилась система прямоугольников, т.е. гистограмма

11. Построение полигона.

Это ломаная линия, соединяющая соответствующие точки в системе координат. По оси ОХ откладываются срединные значения интервалов (столбик 3 таблицы 2). По оси ОУ откладываются значения одного из столбиков таблицы (столбики 5-8).Проводятся соответствующие прямые линии до взаимного пресечения в соответствующих точках. Полученные точки соединяются отрезками.