Summary Statistics for Col_1

Лабораторная работа № 1

ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ

Цель работы: ознакомиться с основными понятиями математической статистики и методикой проведения первичного исследования статистических данных.

Задание: При проведении экспериментов фиксировались значения случайной величины X, характеризующей стоимость строительно-монтажных работ на участке, у.е.. Произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величины Х.

Пример выполнения лабораторной работы №1.

1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке неубывания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.

 

Таблица 1.1 – Расчетная таблица

Номер п/п Выборка, у.е. Вариацион- ный ряд, у.е.,    
-42,160 1777,466 -74937,950 3159383,959
-38,160 1456,186 -55568,042 2120476,502
-38,160 1456,186 -55568,042 2120476,502
-30,160 909,626 -27434,308 827418,732
-27,160 737,666 -20034,998 544150,537
-25,160 633,026 -15926,924 400721,410
-23,160 536,386 -12422,690 287709,512
-23,160 536,386 -12422,690 287709,512
-22,160 491,066 -10882,014 241145,424
-22,160 491,066 -10882,014 241145,424
-21,160 447,746 -9474,297 200476,122
-18,160 329,786 -5988,906 108758,542
-14,160 200,506 -2839,159 40202,496
-13,160 173,186 -2279,122 29993,252
-11,160 124,546 -1389,929 15511,606
-9,160 83,906 -768,575 7040,150
-9,160 83,906 -768,575 7040,150
-8,160 66,586 -543,338 4433,642
-7,160 51,266 -367,062 2628,162
-6,160 37,946 -233,745 1439,869
-6,160 37,946 -233,745 1439,869
-4,160 17,306 -71,991 299,484
-4,160 17,306 -71,991 299,484
-1,160 1,346 -1,561 1,811
0,840 0,706 0,593 0,498
0,840 0,706 0,593 0,498
0,840 0,706 0,593 0,498
4,840 23,426 113,380 548,759
6,840 46,786 320,014 2188,892
6,840 46,786 320,014 2188,892
6,840 46,786 320,014 2188,892
6,840 46,786 320,014 2188,892
8,840 78,146 690,807 6106,735
9,840 96,826 952,764 9375,197
11,840 140,186 1659,798 19652,002
12,840 164,866 2116,874 27180,666
12,840 164,866 2116,874 27180,666
13,840 191,546 2650,991 36689,717
13,840 191,546 2650,991 36689,717
15,840 250,906 3974,345 62953,620
18,840 354,946 6687,175 125986,379
22,840 521,666 11914,842 272134,998
23,840 568,346 13549,359 323016,721
24,840 617,026 15326,916 380720,591
25,840 667,706 17253,513 445830,768
26,840 720,386 19335,150 518955,413
27,840 775,066 21577,826 600726,684
30,840 951,106 29332,097 904601,862
32,840 1078,466 35416,810 1163088,050
55,840 3118,106 174115,017 9722582,533
Итого 21562,720 41605,690 25342680,292

2) Найдем размах выборки = = 183-85 = 98 у.е.

3) Вычислим длину интервала = = 14.

4) Границы интервалов:

= 85, = 85+14 = 99,

= 99+14 = 113, = 113+14 = 127,

= 127+14= 141, = 141+14 = 155, = 155+14= 169, =169 +14 =183 .

5) Построим интервальный статистический ряд:

 

Таблица 1.2 – Интервальный статистический ряд

Границы интервалов , у.е. Частоты Частости
[85, 99] 4/50
(99 , 113] 9/50
(113,127 ] 11/50
(127, 141] 16/50
(141, 155] 7/50
(155, 169] 2/50
(169, 183] 1/50
итого

 

6) Вычислим числовые характеристики.

В качестве оценки математического ожидания используется среднее арифметическое наблюденных значений. Эта статистика называется выборочным средним.

 

.

 

По интервальному статистическому ряду определяется модальный интервал, в который попало наибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала.

.

Для определения выборочного значения медианы используется вариационный ряд. В нашем случае объем выборки = 50 – четное число, т.е. в качестве оценки медианы примем

= .

В качестве оценки дисперсии используется статистика = .

Оценка среднего квадратического отклонения

= .

 

Оценка коэффициента вариации .

Оценка коэффициента асимметрии .

Оценка коэффициента эксцесса

.

7) Построим гистограмму частот.

Рисунок 1.3 – Гистограмма частот

8) Построим интервальные оценки для неизвестных истинных значений и .

Объем выборки составил n = 50. Требуется с доверительной вероятностью определить интервальные оценки:

а) для средней стоимости строительно-монтажных работ на участке;

б) для дисперсии стоимости строительно-монтажных работ на участке;

в) для среднего квадратического отклонения стоимости строительно-монтажных работ на участке.

а) Средняя стоимость строительно-монтажных работ на участке характеризуется генеральной средней a. Требуется найти интервальную оценку параметра a с доверительной вероятностью .

Применяем формулу

,

 

где , , , , значение определяем по таблицам распределения Стьюдента для и . . Подставим найденные значения в формулу:

 

у.е.

 

Таким образом, с вероятностью можно гарантировать, что средняя стоимость строительно-монтажных работ на участке находится в пределах: .

 

б) определим интервальную оценку для дисперсии стоимости строительно-монтажных работ на участке.

Интервальная оценка дисперсии

 

.

 

По таблице процентных точек -распределения (см. приложение Г) найдем

;

 

.

 

Следовательно, .

Значит с доверительной вероятностью можно утверждать, что истинное значение дисперсии будет находиться в интервале

в) С доверительной вероятностью можно утверждать, что истинное значение среднего квадратического отклонения s будет находиться в интервале

 

 

7) Произведем первичную обработку полученной выборки с помощью ЭВМ:

Summary Statistics for Col_1

Count
Average 127,16
Median 128,0
Mode 134,0
Variance 440,056
Standard deviation 20,9775
Coeff. of variation 16,4969%
Minimum 85,0
Maximum 183,0
Range 98,0
Stnd. skewness 0,276588
Stnd. kurtosis -0,251092

Рисунок 1.4 – Компьютерный расчет