ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ
Лабораторная работа № 1
При проведении экспериментов фиксировались значения случайной величины X, характеризующей время технического обслуживания подвижного состава (в минутах).
Задание: произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величины Х.
1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке возрастания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.
Таблица 1 – Расчетная таблица
Номер п/п | Выборка, мин. | Вариацион-ный ряд, , мин. | ||||
78,1 | 60,5 | -9,1 | 82,81 | -753,571 | 6857,4961 | |
63,1 | 60,8 | -8,8 | 77,44 | -681,472 | 5996,9536 | |
72,7 | 61,9 | -7,7 | 59,29 | -456,533 | 3515,3041 | |
74,1 | 61,9 | -7,7 | 59,29 | -456,533 | 3515,3041 | |
70,5 | -7,6 | 57,76 | -438,976 | 3336,2176 | ||
63,3 | 62,3 | -7,3 | 53,29 | -389,017 | 2839,8241 | |
65,3 | 63,1 | -6,5 | 42,25 | -274,625 | 1785,0625 | |
70,4 | 63,1 | -6,5 | 42,25 | -274,625 | 1785,0625 | |
63,9 | 63,3 | -6,3 | 39,69 | -250,047 | 1575,2961 | |
71,3 | 63,4 | -6,2 | 38,44 | -238,328 | 1477,6336 | |
70,9 | 63,8 | -5,8 | 33,64 | -195,112 | 1131,6496 | |
75,9 | 63,8 | -5,8 | 33,64 | -195,112 | 1131,6496 | |
75,9 | 63,9 | -5,7 | 32,49 | -185,193 | 1055,6001 | |
66,2 | 64,6 | -5 | -125 | |||
61,9 | 65,3 | -4,3 | 18,49 | -79,507 | 341,8801 | |
63,8 | 65,4 | -4,2 | 17,64 | -74,088 | 311,1696 | |
78,4 | 65,6 | -4 | -64 | |||
76,6 | 65,8 | -3,8 | 14,44 | -54,872 | 208,5136 | |
65,6 | 66,1 | -3,5 | 12,25 | -42,875 | 150,0625 | |
66,1 | -3,5 | 12,25 | -42,875 | 150,0625 | ||
68,5 | 66,2 | -3,4 | 11,56 | -39,304 | 133,6336 | |
65,4 | 66,8 | -2,8 | 7,84 | -21,952 | 61,4656 | |
74,7 | -1,6 | 2,56 | -4,096 | 6,5536 | ||
63,4 | 68,5 | -1,1 | 1,21 | -1,331 | 1,4641 | |
61,9 | 69,4 | -0,2 | 0,04 | -0,008 | 0,0016 | |
76,2 | 70,1 | 0,5 | 0,25 | 0,125 | 0,0625 | |
77,6 | 70,4 | 0,8 | 0,64 | 0,512 | 0,4096 | |
72,7 | 70,5 | 0,9 | 0,81 | 0,729 | 0,6561 | |
66,8 | 70,9 | 1,3 | 1,69 | 2,197 | 2,8561 | |
62,3 | 71,2 | 1,6 | 2,56 | 4,096 | 6,5536 | |
63,1 | 71,3 | 1,7 | 2,89 | 4,913 | 8,3521 | |
70,1 | 2,4 | 5,76 | 13,824 | 33,1776 | ||
75,5 | 72,6 | |||||
66,1 | 72,7 | 3,1 | 9,61 | 29,791 | 92,3521 | |
69,4 | 72,7 | 3,1 | 9,61 | 29,791 | 92,3521 | |
71,2 | 74,1 | 4,5 | 20,25 | 91,125 | 410,0625 | |
65,8 | 74,7 | 5,1 | 26,01 | 132,651 | 676,5201 | |
75,5 | 5,9 | 34,81 | 205,379 | 1211,7361 | ||
60,5 | 75,9 | 6,3 | 39,69 | 250,047 | 1575,2961 | |
77,3 | 75,9 | 6,3 | 39,69 | 250,047 | 1575,2961 | |
78,1 | 76,2 | 6,6 | 43,56 | 287,496 | 1897,4736 | |
60,8 | 76,6 | |||||
78,9 | 77,3 | 7,7 | 59,29 | 456,533 | 3515,3041 | |
64,6 | 77,6 | |||||
77,7 | 8,1 | 65,61 | 531,441 | 4304,6721 | ||
63,8 | 78,1 | 8,5 | 72,25 | 614,125 | 5220,0625 | |
72,6 | 78,1 | 8,5 | 72,25 | 614,125 | 5220,0625 | |
66,1 | 78,4 | 8,8 | 77,44 | 681,472 | 5996,9536 | |
77,7 | 78,9 | 9,3 | 86,49 | 804,357 | 7480,5201 | |
9,4 | 88,36 | 830,584 | 7807,4896 | |||
Итого | 1673,08 | 1378,308 | 91955,08 |
2) Найдем размах выборки = 79-60,5 = 18,5.
3) Длина интервала = = = 2.786.
4) границы интервалов: = 60.5, =60.5+2.786 = 63.286, = 63.286+2.786 = 66.072,
= 66.072+2.786 = 68.858, = 68.858+2.786 = 71.644, = 71.644+2.786 = 74.43,
= 74.43+2.786 = 77.216, = 77.216+2.786 = 80.002 .
5) Построим интервальный статистический ряд:
Таблица 2 – Интервальный статистический ряд
Границы интервалов , мин. | Частоты | Частости | Накопленные частости |
[60.5; 63.286) | 8/50 | 8/50 | |
[63.286; 66.072) | 10/50 | 18/50 | |
[66.072; 68.858) | 6/50 | 24/50 | |
[68.858;71.644) | 7/50 | 31/50 | |
[71.644; 74.43) | 5/50 | 36/50 | |
[74.43; 77.216) | 6/50 | 42/50 | |
[77.216; 80.002) | 8/50 | ||
Итого |
6) Вычислим числовые характеристики.
В качестве оценки математического ожидания используется среднее арифметическое наблюденных значений. Эта статистика называется выборочным средним.
.
Для оценивания по выборочным данным моды распределения, используется то значение сгруппированного статистического ряда , которому соответствует наибольшее значение частоты. По интервальному статистическому ряду определяется модальный интервал, в который попало наибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала.
.
Для определения выборочного значения медианы используется вариационный ряд. В качестве оценки медианы принимают средний (т. е. -й) член этого ряда, если значение n – нечётно и среднее арифметическое между двумя средними (т. е. между -м и -м) членами этого ряда, если n – чётно. В нашем случае объем выборки = 50 - четное, т.е. в качестве оценки медианы примем
= .
В качестве оценки дисперсии используется статистика = .
Оценка среднего квадратического отклонения = .
Оценка коэффициента вариации .
Оценка коэффициента асимметрии
.
Оценка коэффициента эксцесса
.
7) Для приближённого построения эмпирической функции распределения воспользуемся соотношением:
8) Построим гистограмму частот и эмпирическую функцию распределения.
Рисунок 1 – Гистограмма частот
Рисунок 2 – Функция распределения
Вывод. В результате исследования выборки значений непрерывной случайной величины, характеризующей время технического обслуживания подвижного состава, получили следующие результаты, минут: минимальное тех. обслуживания – 60.5, максимальное – 79, среднее значение времени тех. обслуживания – 69.6, наиболее вероятное время технического обслуживания подвижного состава – 64.679, средневероятное – 69.75, среднеквадратическое отклонение времени тех. обслуживания от среднего значения составило 5.843. Оценка коэффициента вариации составила 8.4%, что указывает на малую колеблемость признака относительно среднего значения, оценка коэффициента асимметрии составила 0.141, оценка коэффициента эксцесса составила -1.39.