ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ

Лабораторная работа № 1

При проведении экспериментов фиксировались значения случайной величины X, характеризующей время простоя оборудования в ожидании ремонта (в тоннах).

Задание: произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величины Х.

1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке возрастания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.

 

Номер п/п Выборка, т. Вариационный ряд х, т.
4003,22 3543,68 -1416,723 2007104,059 -2843510483 4028466702566,43
4628,01 4003,22 -957,183 916199,2955 -8 0390,3 839421149054,542
4293,44 4046,73 -913,673 834798,3509 -762732713,7 696888286713,779
5035,7 4051,41 -908,993 826268,274 -751072077,2 682719260699,915
5780,28 4216,72 -743,683 553064,4045 -411304595,5 305880235512,772
4752,14 4293,44 -666,963 444839,6434 -296691583,1 197882308312,66
6115,63 4399,2 -561,203 314948,8072 -176750215,5 99192751162,372
4788,77 4628,01 -332,393 110485,1064 -36724475,99 12206958747,047
5140,42 4677,98 -282,423 79762,75093 -22526835,41 6362096435,762
5856,44 4687,59 -272,813 74426,93297 -20304634,86 5539368351,172
5243,49 4736,68 -223,723 50051,98073 -11197779,28 2505200774,896
5007,53 4752,14 -208,263 43373,47717 -9033090,476 1881258521,73
5321,63 4788,77 -171,633 29457,88669 -5055945,466 867767088,182
5296,32 4790,17 -170,233 28979,27429 -4933228,8 839798338,317
4046,73 4795,27 -165,133 27268,90769 -4502996,533 743593326,551
4051,41 4864,33 -96,073 9230,021329 -886755,8391 85193293,734
4795,27 4878,13 -82,273 6768,846529 -556893,3105 45817283,333
4736,68 4909,11 -51,293 2630,971849 -134950,4391 6922012,87
4687,59 4934,46 -25,943 673,039249 -17460,65724 452981,831
4399,2 4939,53 -20,873 435,682129 -9093,993079 189818,918
5428,04 5007,53 47,127 2220,954129 104666,9052 4932637,243
5079,74 5035,7 75,297 5669,638209 426906,7482 32144797,421
4934,46 5079,74 119,337 14241,31957 1699516,353 202815183,066
5207,58 5135,47 175,067 30648,45449 5365532,982 939327762,564
5556,51 5140,42 180,017 32406,12029 5833652,556 1050156632,185
3543,68 5194,84 234,437 54960,70697 12884823,26 3020679310,532
4878,13 5207,58 247,177 61096,46933 3732778564,469
5590,46 5222,85 262,447 68878,42781 18076936,74 4744237817,44
5194,84 5243,49 283,087 80138,24957 22686096,66 6422139043,983
4216,72 5296,32 335,917 112840,2309 37904951,84 12732917707,083
4790,17 5321,63 361,227 130484,9455 47134685,42 17026321009,706
5584,01 5339,34 378,937 143593,25 54412795,36 20619021436,66
4909,11 5343,27 382,867 146587,1397 56123378,41 21487789522,202
4677,98 5428,04 467,637 218684,3638 102264899,8 47822850957,052
5343,27 5556,51 596,107 355343,5554 211822780,8 126269042399,137
4864,33 5584,01 623,607 388885,6904 242511838,8 151232080235,995
5135,47 5590,46 630,057 396971,8232 157586628453,635
5222,85 5780,28 819,877 672198,2951 551119921,6 451850547974,333
5339,34 5856,44 896,037 802882,3054 719412252,3 644619996274,638
4939,53 6115,63 1155,227 1334549,422 1781022158503,39
Итого 198416,12 198416,12 11414049,07 -2338206521 10333953877219,5

 

   

2) Найдем размах выборки = 6115,63- 3543,68 = 2571,95.

3) Длина интервала = = = 406,835.

4)Границы интервалов: =3543,68, =3543,68+406,835=3950,515, =3950,515+406,835=4357,35,

=4357,35+406,835=4764,185, =4764,185+406,835=5171,02, =5171,02+406,835=5577,855, =5577,855+406,835=5984,69, =5984,69+406,835=6391,525 .

5) Построим интервальный статистический ряд:

Таблица 2 – Интервальный статистический ряд

Границы интервалов , т. Частоты Частости Накопленные частости
[3543,68; 3950,515) 1/40 1/40
[3950,515; 4357,35) 5/40 6/40
[4357,35; 4764,185) 6/40 12/40
[4764,185; 5171,02) 13/40 25/40
[5171,02; 5577,855) 10/40 35/40
[5577,855; 5984,69) 4/40 39/40
[5984,69; 6391,525) 1/40
Итого  

 

6) Вычислим числовые характеристики.

В качестве оценки математического ожидания используется среднее арифметическое наблюденных значений. Эта статистика называется выборочным средним.

.

Для оценивания по выборочным данным моды распределения, используется то значение сгруппированного статистического ряда , которому соответствует наибольшее значение частоты. По интервальному статистическому ряду определяется модальный интервал, в который попало наибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала.

.

Для определения выборочного значения медианы используется вариационный ряд. В качестве оценки медианы принимают средний (т. е. -й) член этого ряда, если значение n – нечётно и среднее арифметическое между двумя средними (т. е. между -м и -м) членами этого ряда, если n – чётно. В нашем случае объем выборки = 40 - четное, т.е. в качестве оценки медианы примем

= .

В качестве оценки дисперсии используется статистика = .

Оценка среднего квадратического отклонения = .

Оценка коэффициента вариации .

Оценка коэффициента асимметрии

.

Оценка коэффициента эксцесса

.

7) Для приближённого построения эмпирической функции распределения воспользуемся соотношением:

 

8) Построим гистограмму частот и эмпирическую функцию распределения.

Рисунок 1 – Гистограмма частот

 

 

Рисунок 2 – Функция распределения

Вывод. В результате исследования выборки значений непрерывной случайной величины, характеризующей время простоя оборудования в ожидании ремонта, получили следующие результаты, тонн: минимальная масса простоя – 3543,68, максимальная – 6115,63, среднее значение массы простоя оборудования – 4960,403, наиболее вероятная масса простоя оборудования – 4967,6, средневероятна – 4973,53, среднеквадратическое отклонение массы простоя оборудования от среднего значения составило 540,988. Оценка коэффициента вариации составила 10,9%, что указывает на большую колеблемость признака относительно среднего значения, оценка коэффициента асимметрии составила – 0,379, оценка коэффициента эксцесса составила 0,094.