Методы обработки результатов наблюдений

Одним из основных способов изучения окружающего нас мира, средством познания было и остается наблюдение. Под наблюдением принято принимать целенаправленное восприятие свойств процессов и явлений. Опираясь на результаты наблюдения, человек строит физическую модель новых процессов и явлений, выдвигает научные гипотезы, делает открытия, создает теорию, принимает решения. Наблюдения сопровождается приемом, определенным преобразованием и регистрацией человеком информации о свойствах наблюдаемого объекта. Регистрация результатов наблюдения может производится как в памяти ( мозге) человека- наблюдателя, так и на специальных носителях информации ( бумаге, магнитной ленте, полотне художника, фотопленке и т.д.). Характер наблюдения существенным образом зависит от профессиональной направленности наблюдателя.

В то же время от наблюдения до принятия решения получаемая человеком информация претерпевает, как правило, существенные преобразования. Наиболее характерными этапами таких преобразований в большинстве сфер человеческой деятельности являются измерения и обработка результатов измерений.

Измерение состоит в сравнении наблюдаемой величины (свойства объекта) с эталоном и получении в результате этого ее численного значения. Если результаты наблюдений представлены в виде цифр и графиков, то имело место измерение. Иногда, кроме измерения, различают подсчет. Подсчет можно квалифицировать как завершающий этап наблюдения – регистрацию величин дискретного типа (число деталей, обрабатываемых за смену, и т.п.).

Допустим, что в результате n измерений случайной величины Х получена последовательность значений х12,…, хn, которая называется простым статистическим рядом или выборкой. Обычно выборка оформляется в виде таблицы, в первой колонке которой стоит номер опыта i, а во второй значение случайной величины.

Первичная обработка выборки состоит в группировке найденных значений по достаточно малым интервалам, вычислении средних относительных частот для каждого интервала и графическом представлении результатов в виде гистограммы или эмпирической функции распределения. Число интервалов k можно определить по формуле:

k = 1+3,2 lgn.

Полученное значение округляют до ближайшего целого числа. Число интервалов не должно превышать 10-20. Ширина интервалов х выбирается одинаковой и равной:

х = (хmax- xmin) /k.

Все значения случайной величины, попавшие в некоторый интервал, относятся к его середине.

Пример 1:Ежесуточный выпуск кузнечным цехом поковок m(т/сут) регистрировался в течении n=36 сут. Необходимо построить статический ряд, гистограмму и эмпирическую функцию распределения случайной величины m. Данные в таблице:

I
M 1,8 32,7 3,6 1,9 25,1 25,4 5,3 6,6 24,7
I
M 6,9 7,7 25,2 8,8 23,0 9,7 11,3 20,7 21,2
I
M 21,8 12,7 21,5 13,3 21,8 13,0 14,5 15,8 14,1
I
M 15,2 17,2 16,3 17,9 13,5 16,6 15,1 17,0 15,0

 

Решение:k= 1+3,2 lgn= 1=3,2lg367 – число интервалов, на которые разбивается диапазон наблюдений.

Находим ширину интервала от 0 до 35 т/сут.

m=(mmax- mmin)/k= 35-0/7= 5 т/сут.

Результаты наблюдений можно свести в представленный ниже статистический ряд:

Параметр Значения параметра по номеру интервала
Интервал m,т/сут 0…5 5…10 10…15 15…20 20…25 25…30 30…35
Среднее ,т/сут 2,5 7,5 12,5 17,5 22,5 27,5 32,5
Число наблюдений ni 7,5 8,5
Частота ni/n 0,0833 0,1666 0,2084 0,2362 0,1944 0,0833 0,0278

 

Построение гистограммы: по оси абсцисс откладываем интервалы, и на каждом из них, как на основании, строится прямоугольник, площадь которого равна частоте данного интервала (с тем, чтобы площадь всей гистограммы была равна 1). В нашем случае все интервалы имеют одинаковую ширину и поэтому высоты прямоугольников равны соответствующим частотам (рис. 1).

 

 

Рис.1. Гистограмма ежесуточного выпуска поковок

Для построения эмпирической функции распределения достаточно несколько точек, в качестве которых удобно взять границы интервалов:

F(0)=0

F(5)= F(0)+n1/n= 0+0,0833= 0,0833

F(10)= F(5)+n2/n= 0,0833+0,1666= 0,2499

F(15)= F(10)+n3/n=0,2499+0,2084=0,4583

F(20)= F(15)+n4/n= 0,4583+0,2362=0,6945

F(25)= F(20)+n5/n= 0,6945+0,1944= 0,8889

F(30)= F(25)+n6/n= 0,8889+0,0833= 0,9722

F(35)= F(30)+n7/n= 0,9722+0,0278= 1.

График эмпирической функции распределения приведен на рис.2.

Рис. 2. Эмпирическая функция распределения ежесуточного выпуска поковок; штриховой линией показана кривая для нормального закона распределения

Важнейшими характеристиками эмпирического распределения являются среднее арифметическое значение (выборочное среднее) и среднее квадратичное отклонение (выборочная дисперсия)

; s2 .

При увеличении числа наблюдений n среднее арифметическое значение будет приближаться к математическому ожиданию, а среднее квадратичное отклонение – к дисперсии, т.е. при n справедливы соотношения: M и s2D .

Пример 2. Найти математическое ожидание, дисперсию и среднеквадратичное отклонение случайной величины, рассмотренной в примере 1.

Решение:

M =1/36(1,8+32,7+…+15,0) = 15,4 т/сут;

D = 1/35(1/8-15,4)2+(32,7-15,4)2+…+(15,0-15,4)2= 53,2(т/сут)2;

s = т/сут.

 

Пример 3 .Записать в виде вариационного и статистического рядов

выборку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4.

Решение. Объем выборки n = 15. Упорядочив элементы выборки по

величине, получим вариационный ряд

2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10 .

Статистический ряд записывается в виде таблицы

xi
ni

 

Пример 4.Определить выборочные среднее, дисперсию, моду и ме-

диану для выборки: 5, 6, 8, 2, 3, 1, 4, 1 .

Решение. Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4,

5, 6, 8. Выборочное среднее находим по формуле (13.1).

= 1/8 (1+1+2+3+4+5+6+8) = 3,75.

Для расчета выборочной дисперсии воспользуемся формулой (13.3).

D ~ =8/7 ( 1/8 (1+1+4+9+16+25+36+64) - 3,752 ) = 6,21 .

Все элементы входят в выборку по одному разу, кроме 1, следовательно,

выборочная мода d X~= 1. Так как n = 8, то медиана hX~= 0,57 (3+4) =3,5.

Ответ: ; s2=6,21; dx=1; hx=3,5.