Глава 1. Представление результатов экспериментов

Планирование и обработка результатов экспериментов (дисц.4634).

Лекции

Содержание.

Глава 1. Представление результатов экспериментов.

Численные значения могут быть в принципе целочисленными (дискретными, например, число предметов в штуках) и могут быть статистическими, округленными до целых значений или до какого-либо знака после запятой.

Если мы говорим о такой статистической величине, как, например, о длине, которая равна 5 м, то подразумеваем, что величина длины составляет от 4,5 до 5,4. Если мы говорим, что длина равна 5,0 м, то это значит, что ее значение составляет от 4,95 до 5,04 м, если же мы пишем, что длина равна 5,00 м, то это значит, что она составляет от 4,995 до 5,004.

Бессмысленно и безграмотно написать х=5,15 с погрешностью 10%, так как значение 5,15 уже означает, что значение х лежит в пределах от 5,145 до 5,154 или 5,15±0,05 или 0,05/5,15=0,0097≈0,01=1% 5,15±1%.

Если погрешность 10%, или 5,2±0,5, то это значит, что значение х лежит в пределах от 4,7 до 5,7 (или 0,5/5,15=10%).

Бессмысленно и безграмотно написать σ=22,15 с погрешностью 10%, так как значение 22,15 уже означает, что истинное значение σ находится в пределах от 22,15+0,01 до 22,15-0,01 (σ=0,045%) либо, если проводилось округление до 0,05, от 22,15+0,05 до 22,15-0,05 (σ=0,23%). Не совсем правильно написать 20 с погрешностью 10%, это означает, что истинное значение σ лежит в пределах от 20-2 до 20+2, т.е. среднее значение 22,15 выходит за эти пределы.

Правильно написать σ=22 с погрешностью 10%, это будет означать, что σ находится в пределах от 22-2,2 до 22+2,2. Запись в виде σ=22 подразумевает, что истинное значение находится в пределах от 22-1 до 22+1, что указывает на погрешность 5%, несколько лучше фактической погрешности 10%.

Таким образом, допустимо приводить значение без указания погрешности, но так, чтобы подразумеваемая погрешность была такого же порядка, что и фактическая погрешность, но недопустимо приводить значение величины таким образом, чтобы подразумеваемая погрешность отличалась от фактической на несколько порядков (0,045-0,23% вместо фактической 10%.).

 

В результате экспериментов при определении одного и того же параметра, если отсутствует постоянное влияние внешних факторов, измеряемая величина принимает некоторые случайные значения в определенном диапазоне.

Случайной величиной называется величина, которая принимает определенное значение в допустимых пределах, но само это значение предсказать нельзя. Если исходные факторы одинаковы, то случайная величина может быть различной. Случайная величина может быть непрерывной и дискретной.

Частота появления события (Х) равна частному от деления числа опытов m, когда получается случайная величина Х, на общее число опытов n: m/n. Если n велико, то эта частота стабильна и называется вероятностью события р .

Вероятность того, что наступит хотя бы одно из нескольких несовместимых событий А оавна сумме вероятностей этих событий:

р(А123+...+Аn)=р(А1)+р(А2)+ р(А3)+...+р(Аn)

Вероятность появления всех событий одновременно является произведением вероятностей этих событий:

р(А123*...*Аn)=р(А1)*р(А2)*p(А3)*...*р(Аn)

----------------------------------------------------------------------------------------------

Пример 1. Вероятность безотказной работы прибора зависит от трех узлов, соединенных последовательно. Каждый из них может выйти из строя независимо. Вероятность безотказной работы первого 0,8, второго 0,9 и третьего 0,8. Найти надежность (безотказность) работы прибора в целом. Получаем

р=0,8*0,9*0,8=0,576

---------------------------------------------------------------------------------------------

Сумма вероятностей всех возможных значений случайной величины равна 1 (Sрi=1), т.е. случайная величина в результате опыта примет одно из своих значений и это есть достоверное событие.

Эта суммарная вероятность распределена определенным образом между отдельными значениями. Дискретную случайную величину можно задать вероятностным рядом, указав вероятность рi каждого значения хi.

Соотношение между возможными значениями случайной величины и соответствующими им вероятностями называется законом распределения.

Распределение непрерывной случайной величины характеризуется функцией распределения F(X).

В теории статистических исследований найдено, что нормальная функция распределения равна:

x

F(x)={1/[sx (2p)1/2 ]} ò[exp(-(x-mx )2/2sx2 ] dx

-¥

где mx – среднее арифметическое результатов измерения х

mx = Σx/N,

N- количество экспериментов, -¥ <x<+¥, σ2 – среднеквадратичная погрешность, равная

σ2= Σ(mx – х)2)/(N-1)

Это распределение наиболее часто встречается на практике.

Нормальное распределение нормированной случайной величины называется стандартным.

х

Fo(x)={1/[ (2p)1/2 ]} ò[exp(-(x )2/2 ] dx

-¥

Для такой величины Р(х1 <x<x2 )=Fo(x2)- Fo(x1)

Функция Fo(x)-(1/2) называется функцией Лапласа и именно значения этой функции чаще всего приводятся в справочниках в пределах от 0 до 4. При этом Ф(х) изменяется от 0 до 1.

Чтобы от естественных значений х перейти к нормализованным, чтобы было возможно использовать табличные значения Ф(хо), требуется провести нормализацию:

хо =(x-mx)/ sx

где хо – нормализованное значение х.

Заметим, что разница Fo(x2)- Fo(x1) = Ф(х01) - Ф(х02)

---------------------------------------------------------------------------------------

Вероятность р события случайной величины х<Xm:

р(Хm<х)=F(x).

Функция F(x) неубывающая. Вероятность

р(х1<Х<х2) = F(x2)-F(x1)

F(-¥)=0; F(+¥)=1.

Плотность распределения случайной величины

f(x)=dF(x)/dx

Эта величина неотрицательная.

Закон распределения случайной величины (вместо полного распределения) можно охарактеризовать с помощью моментов случайных величин. Начальный момент k-го порядка:

mk= Sxik pi

Для непрерывной случайной величины

¥

m=ò xF(x)dx

Начальный момент первого порядка называется математическим ожиданием (средним арифметическим значением) случайной величины.

Для дискретных случайных величин m1=Sxi pi

Таким образом, первый момент (не центральный) - это математическое ожидание (среднее арифметическое).

Первый центральный момент всегда равен нулю.

Второй центральный момент называется дисперсией (D). Дисперсия случайной величины называется математическим ожиданием квадрата отклонения случайной величины от ее математического ожидания:

n

D(x)=M[(x-mx )2] = S((xi-mx )2pi

i=1

где pi=ni/N (N-общее число испытаний, ni - число испытаний, случающихся с частотой рi) или ,для непрерывной функции распределения,

¥

D(x) = ò ((x-mx )2f(x)dx

-¥

Дисперсию обозначают также Dx. Эта величина равна Dx=sх2 . sх называют также “стандартом”.

Третий центральный момент, деленный на sх3 называется коэффициентом асимметрии:

g = m3/ sх3

Этот коэффициент выражается через центральные моменты, причем:

m3 =m3-3m1m2 +2m13

Четвертый центральный момент связан с коэффициентом эксцесса (крутости)

t=(m4/s 4)-3

причем, -2< t < +¥. При t>0 - функция распределения более крутая, чем нормальная, при t< 0 - плосковершинная. При t= - 2 она двухвершинная.

Если у случайной величины Х существуют 1-й и 2-й моменты, то можно рассчитать нормированную случайную величину

хо =(Х-mx)/s

Для нормированной случайной величины М(хо)=0; D(xo )=1.

Существуют зависимости между функциями распределения, соответствующими нормированной хо и ненормированной Х случайной величиной

f(x)=(1/sx )f1(xo )=(1/sx)f1 [(X-mx )/sx]

f1(xo)= sxf(x)= sxf(mx +sxxo)

F(x)=F1(xo)= F1 [(x-mx )/ sx]

Ошибки вычислений (измерений)

Dх =S/n1/2 ; Ds =S/(2N)1/2 ;; Dg =(6/N)1/2 ; Dt =2Dg

Здесь S-выборочная дисперсия.

Доказательство,что распределение нормальное:

g£2Dg и t£2Dt =4Da

или

|g1 | £3(D(g1))1/2 и t £=5(D(t))1/2

где

D(g1 )=6(n-1)/[(n+2)(n+3)];

D(t)=24n(n-2)(n-3)/[(n+1)2 (n+3)(n+5)]

Точность вычислений

e=(D(хср)/хср ).100%

Графики функций распределения с ненулевыми коэффициентами асимметрии g1 и эксцесса t показаны на рис. 1. Если g1 >0 ,то вершина кривой сдвинута влево. Если g1<0 , то вправо. Если t>0, то кривая ненормально узкая. Если t<0, то кривая двугорбая.

Если меры косости и крутости не превышают свои основные ошибки более чем в 3-4 раза, то это является основанием для заключения о нормальном законе распределения.

Результаты экспериментов, перед их представлением, опубликованием, требуют анализа для оценки погрешности.

Для получения достаточно надежных экспериментальных данных требуется, чтобы эти результаты были получены многократно, например N раз. В этом случае за результат принимают среднее арифметическое значение Хср=ΣХ/N Однако это значение будет верным только в том случае, если получаемые экспериментальные значения будут случайными и их распределение будет подчиняться закону Гаусса – в частности распределение Х по значениям будет симметрично.(См. рис.1).

 

 

Рис.1. Нормальное (и симметричное) распределение случайной величины.

Рис.2. Асимметричное распределение случайной величины.

 

Если же кривая распределения не симметрична (См. рис.2), то можно попытаться выбрать такую функцию Ф(Х), чтобы получить симметричный вид распределения, тогда среднее арифметическое значение уже этой функции Ф(Х) можно будет рассматривать как представительное. Одним из вариантов получения симметричного распределения является логарифмическое распределение Ф(lgХ).

Представляемое экспериментальное значение имеет определенную погрешность. Стандартное значение дисперсии σ =Σ(Х-Хср)2/(N-1 ) представляет собой значение, характеризующее интервал, в котором искомое значение Х с вероятностью 72% находится в диапазоне от Х+σ до Х-σ. Однако достаточно надежным считаются значение, вероятность правильности которого составляет, например, 95%, от Х- ε до Х+ε. Значение ε связано с σ соотношением включающем критерий Стьюдента t:

ε=σt/(N)0,5.

Значение t найдем из Таблицы 1, где приведены значения t при разном количестве экспериментов N c разной степенью вероятности.

 

 

Таблица 1. Критерий Стьюдента t: Значения t при данном числе испытаний N и заданной величине доверительной вероятности (уровне значимости) Р.

 

N-1 Р= 0,90 P= =0,95 P= =0,98 Р= 0,99 N-1 Р= 0,90 P= =0,95 P= =0,98 Р= =0,99
6,31 12,704 31,821 63,7 1,80 2,201 2,718 3,11
2,92 4,303 6,965 9,93 1,78 2,179 2,681 3,06
2,35 3,182 4,541 5,84 1,77 2,160 2,650 3,01
2,13 2,778 3,747 4,60 1,76 2,145 2,624 2,98
2,02 2,571 3,365 4,03 1,75 2,131 2,602 2,95
1,94 2,447 3,143 3,71 1,75 2,120 2,583 2,92
1,90 2,365 2,998 3,50 1,74 2,110 2,567 2,90
1,86 2,306 2,896 3,36 1,73 2,086 2,528 2,85
1,83 2,262 2,821 3,25 1,71 2,060 2,485 2,79
1,81 2,288 2,764 3,17 1,70 2,042 2,457 2,75

 

Таким образом, для повышения точности значения Х (т.е. снижения ε) требуется увеличение количества экспериментов N.

Зачастую нет необходимости указывать параметры погрешности σ или ε, можно просто привести цифровое значение, например предел прочности при растяжении f = 22 кг/мм2. Если именно так приведено это значение, то это значит, что f лежит в пределах от 21,5 до 22,4 или σ лежит в пределах от 22-0,5 до 22+0,5 или ε ≈ 0,5. Эта величина составляет 0,5/22*100%= 2,3%, что очень неплохая точность. Обычно прочностные показатели определяются с погрешностью до +-15%. Если же вы хотите показать, что f определено с более высокой погрешностью, то представляемое число следует округлить до 20, или 2.101, что указывает на то, что действительная величина лежит в пределах от 15 до 25 или от 20-5 до 20+5, или ε=5 или ε=5/20≈25%.

 

Пример 2.

Решение задач о погрешностях.

Найти вероятность того, что абсолютное отклонение Dх= êx-mх êне превзойдет заданного числа e

Р(Dх£e)=З(mx-e £ mx+e)

Для нормированной случайной функции

P(-e£ xo £ e)=Ф(e)-Ф(-e)=2Ф(e)

Для случайной величины, имеющей нормальное распределение с параметрами mx и sх

Р(Dх£e)=Р(Dхо£e/sх)=2Ф(e/sх)

Обозначив k=e/sх получим функцию Лапласа Ф:

Р(Dх£ksх)= 2Ф(k)

P(Dх£sх)=2Ф(1)=0,6826

P(Dх£2sх)=2Ф(2)=0,9544

P(Dх£3sх)=2Ф(3)=0,9973

Последняя величина указывает на практически невозможное событие.

Пример 3. Толщину керамической плитки h можно считать случайной величиной, распределенной по нормальному закону с sх =0,3 мм. Какова вероятность брака, при котором Dh³0,5 мм ?

Вероятность противного события: Р(Dh£0,5)=2Ф(0,5/0,3)=0,905

Отсюда Р(Dh³0,5)=1-0,905=0,095.

 

Определение параметров функции распределения.

Берем выборку (n значений) из генеральной совокупности (т.е. все

допустимые значения случайной величины. Весь диапазон изменения случайной величины делим на k интервалов. Рекомендуемое значение k:

k=1+3,2lg(n)

Длина интервала h=(Xмакс -Xмин)/k. Подсчитаем число элементов

выборки,попадающих в отдельный интервал n. Относительная частота попадания случайной величины в i-й интервал Рi =ni/n. Все точки, попавшие в i-й интервал относят к середине интервала

Xi* =(Xi-1 +Xi )/2

Строят диаграмму-график, по оси абсцисс откладывают значения

Xi * и по оси ординат значения ni. Полученные точки соединяют между собой, таким образом получают экспериментальную кривую распределения - “полигон”. Это дифференциальная кривая распределения. Интегральную кривую распределения получают, откладывая по оси ординат суммы ni всех точек, находящихся слева (со стороны более низких значений X).

Оценка математического ожидания и дисперсии. Для нормального

распределения получают среднее арифметическое значение Xcp =S Xi /n и выборочную дисперсию S2=S(Xi -Xcp)2 /n. Величина S “смещена”.

Для получения несмещенной оценки ее умножают на n/(n-1). Тогда получаем:

S2 =S(Xi -Xcp)2/(n-1). Удобная для программирования формула:

S2=│( SXi 2 -(SXi )2 )/n│

 

Ошибки измерений.

Ошибки бывают грубые, систематические и случайные. Случайные

ошибки - остающиеся после устранения грубых и систематических, они вызываются большим количеством таких факторов, эффекты действия которых столь незначительны, что их нельзя выделить в отдельности.

Если результатов испытаний много, то значения X частичной совокупности из n значений, полученных путем независимых испытаний, распределяется нормально со средним значением Xср и дисперсией s2. Нормированное отклонение (Xср -Xi )/sn-1/2 ) распределяется нормально со средним значением равным нулю и дисперсией, равной единице. Однако при исследованиях дисперсия s2 почти всегда остается

неизвестной и мы не можем произвести нормирование. Отклонение среднего значения частичной (выборочной) совокупности от среднего значения нормальной общейокупности, нормированное с помощью S2 (несмещенная оценка выборочной дисперсии) обозначается t:

t=((Xcp - mx )/S) n1/2

Функция распределения t имеет сложный вид, в нее входит число степеней свободы n. Интегрируя f(t) от - ¥ до t найдем вероятность Sn(t) случайных значений to меньших, чем заданное t:

Sn(t)=Р[tо <t]

Распределение S(t) - распределение Стьюдента или t-распределение.Это распределение используется для ответа на вопрос, является ли значимым наблюдаемое значение (для оценки средних значений).

 

       
Результаты испытаний на электрическую прочность  
      (U-Ucp)^2
5,1 26,01
0,1 0,01
-1,9 3,61
3,1 9,61
2,1 4,41
2,1 4,41
4,1 16,81
1,1 1,21
0,1 0,01
-0,9 0,81
summa   66,9
srednee 22,9    
σ^2= =66,9/ (10-1) 7,433333  
σ=   2,726414  
       
ε= 2,262*S/N^0,5  
     
  1,950224    
       
U= 22,9+-1,95  
U≈ 23 ± 2 ±