Summary Statistics for Col_1
Лабораторная работа № 1
ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ
Цель работы: ознакомиться с основными понятиями математической статистики и методикой проведения первичного исследования статистических данных.
Задание: При проведении экспериментов фиксировались значения случайной величины X, характеризующей стоимость строительно-монтажных работ на участке, у.е.. Произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величины Х.
Пример выполнения лабораторной работы №1.
1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке неубывания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.
Таблица 1.1 – Расчетная таблица
| Номер п/п | Выборка, у.е. | Вариацион- ный ряд, у.е.,
|
|
|
|
|
| -42,160 | 1777,466 | -74937,950 | 3159383,959 | |||
| -38,160 | 1456,186 | -55568,042 | 2120476,502 | |||
| -38,160 | 1456,186 | -55568,042 | 2120476,502 | |||
| -30,160 | 909,626 | -27434,308 | 827418,732 | |||
| -27,160 | 737,666 | -20034,998 | 544150,537 | |||
| -25,160 | 633,026 | -15926,924 | 400721,410 | |||
| -23,160 | 536,386 | -12422,690 | 287709,512 | |||
| -23,160 | 536,386 | -12422,690 | 287709,512 | |||
| -22,160 | 491,066 | -10882,014 | 241145,424 | |||
| -22,160 | 491,066 | -10882,014 | 241145,424 | |||
| -21,160 | 447,746 | -9474,297 | 200476,122 | |||
| -18,160 | 329,786 | -5988,906 | 108758,542 | |||
| -14,160 | 200,506 | -2839,159 | 40202,496 | |||
| -13,160 | 173,186 | -2279,122 | 29993,252 | |||
| -11,160 | 124,546 | -1389,929 | 15511,606 | |||
| -9,160 | 83,906 | -768,575 | 7040,150 | |||
| -9,160 | 83,906 | -768,575 | 7040,150 | |||
| -8,160 | 66,586 | -543,338 | 4433,642 | |||
| -7,160 | 51,266 | -367,062 | 2628,162 | |||
| -6,160 | 37,946 | -233,745 | 1439,869 | |||
| -6,160 | 37,946 | -233,745 | 1439,869 | |||
| -4,160 | 17,306 | -71,991 | 299,484 | |||
| -4,160 | 17,306 | -71,991 | 299,484 | |||
| -1,160 | 1,346 | -1,561 | 1,811 | |||
| 0,840 | 0,706 | 0,593 | 0,498 | |||
| 0,840 | 0,706 | 0,593 | 0,498 | |||
| 0,840 | 0,706 | 0,593 | 0,498 | |||
| 4,840 | 23,426 | 113,380 | 548,759 | |||
| 6,840 | 46,786 | 320,014 | 2188,892 | |||
| 6,840 | 46,786 | 320,014 | 2188,892 | |||
| 6,840 | 46,786 | 320,014 | 2188,892 | |||
| 6,840 | 46,786 | 320,014 | 2188,892 | |||
| 8,840 | 78,146 | 690,807 | 6106,735 | |||
| 9,840 | 96,826 | 952,764 | 9375,197 | |||
| 11,840 | 140,186 | 1659,798 | 19652,002 | |||
| 12,840 | 164,866 | 2116,874 | 27180,666 | |||
| 12,840 | 164,866 | 2116,874 | 27180,666 | |||
| 13,840 | 191,546 | 2650,991 | 36689,717 | |||
| 13,840 | 191,546 | 2650,991 | 36689,717 | |||
| 15,840 | 250,906 | 3974,345 | 62953,620 | |||
| 18,840 | 354,946 | 6687,175 | 125986,379 | |||
| 22,840 | 521,666 | 11914,842 | 272134,998 | |||
| 23,840 | 568,346 | 13549,359 | 323016,721 | |||
| 24,840 | 617,026 | 15326,916 | 380720,591 | |||
| 25,840 | 667,706 | 17253,513 | 445830,768 | |||
| 26,840 | 720,386 | 19335,150 | 518955,413 | |||
| 27,840 | 775,066 | 21577,826 | 600726,684 | |||
| 30,840 | 951,106 | 29332,097 | 904601,862 | |||
| 32,840 | 1078,466 | 35416,810 | 1163088,050 | |||
| 55,840 | 3118,106 | 174115,017 | 9722582,533 | |||
| Итого | 21562,720 | 41605,690 | 25342680,292 |
2) Найдем размах выборки
= = 183-85 = 98 у.е.
3) Вычислим длину интервала
=
= 14.
4) Границы интервалов:
= 85,
= 85+14 = 99,
= 99+14 = 113,
= 113+14 = 127,
= 127+14= 141,
= 141+14 = 155,
= 155+14= 169,
=169 +14 =183
.
5) Построим интервальный статистический ряд:
Таблица 1.2 – Интервальный статистический ряд
Границы интервалов
, у.е.
| Частоты
| Частости
|
| [85, 99] | 4/50 | |
| (99 , 113] | 9/50 | |
| (113,127 ] | 11/50 | |
| (127, 141] | 16/50 | |
| (141, 155] | 7/50 | |
| (155, 169] | 2/50 | |
| (169, 183] | 1/50 | |
| итого |
6) Вычислим числовые характеристики.
В качестве оценки математического ожидания используется среднее арифметическое
наблюденных значений. Эта статистика называется выборочным средним.
.
По интервальному статистическому ряду определяется модальный интервал, в который попало наибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала.
.
Для определения выборочного значения медианы используется вариационный ряд. В нашем случае объем выборки
= 50 – четное число, т.е. в качестве оценки медианы примем
=
.
В качестве оценки дисперсии используется статистика
=
.
Оценка среднего квадратического отклонения
=
.
Оценка коэффициента вариации
.
Оценка коэффициента асимметрии
.
Оценка коэффициента эксцесса
.
7) Построим гистограмму частот.

Рисунок 1.3 – Гистограмма частот
8) Построим интервальные оценки для неизвестных истинных значений
и
.
Объем выборки составил n = 50. Требуется с доверительной вероятностью
определить интервальные оценки:
а) для средней стоимости строительно-монтажных работ на участке;
б) для дисперсии стоимости строительно-монтажных работ на участке;
в) для среднего квадратического отклонения стоимости строительно-монтажных работ на участке.
а) Средняя стоимость строительно-монтажных работ на участке характеризуется генеральной средней a. Требуется найти интервальную оценку
параметра a с доверительной вероятностью
.
Применяем формулу
,
где
,
,
,
, значение
определяем по таблицам распределения Стьюдента для
и
.
. Подставим найденные значения в формулу:

у.е.
Таким образом, с вероятностью
можно гарантировать, что средняя стоимость строительно-монтажных работ на участке находится в пределах:
.
б) определим интервальную оценку для дисперсии стоимости строительно-монтажных работ на участке.
Интервальная оценка дисперсии
.
По таблице процентных точек
-распределения (см. приложение Г) найдем
;
.
Следовательно,
.
Значит с доверительной вероятностью
можно утверждать, что истинное значение дисперсии будет находиться в интервале

в) С доверительной вероятностью
можно утверждать, что истинное значение среднего квадратического отклонения s будет находиться в интервале

7) Произведем первичную обработку полученной выборки с помощью ЭВМ:
Summary Statistics for Col_1
| Count | |
| Average | 127,16 |
| Median | 128,0 |
| Mode | 134,0 |
| Variance | 440,056 |
| Standard deviation | 20,9775 |
| Coeff. of variation | 16,4969% |
| Minimum | 85,0 |
| Maximum | 183,0 |
| Range | 98,0 |
| Stnd. skewness | 0,276588 |
| Stnd. kurtosis | -0,251092 |

Рисунок 1.4 – Компьютерный расчет
, у.е.