Проверка гипотезы адекватности модели

Лекция №7

 

При оценке результатов эксперимента очень важным этапом является проверка адекватности модели эксперимента. Чтобы понять, что это означает, напомним кратко существо рассматриваемой задачи.

Речь идет о поиске совокупности факторов (параметров некоторой системы), при которой качество системы в каком-либо заранее определенном смысле максимально.

Для этого система представляется как «черный ящик». Над ней ставится эксперимент, состоящий из нескольких опытов, проводимых по заранее установленному плану. На основе поставленного эксперимента оцениваются параметры модели системы, после чего они используются для поиска экстремума функции (поверхности) отклика. Этот экстремум как правило ищется методом «крутого восхождения» (Бокса-Уилсона).

Модель системы при этом имеет вид:

.

Под адекватностью модели понимается близость ее к функции, которая точно описывает поведение системы.

Очевидно, если модель далека от того, чтобы с достаточной точностью аппроксимировать систему, найденному при ее помощи экстремуму нет доверия.

В связи с этим обоснование (или проверка) адекватности модели превращается в важнейшую задачу планирования эксперимента.

Для проверки адекватности модели используются статистические методы.

Рассмотрим процесс проверки адекватности модели более подробно.

Коэффициенты модели эксперимента определяются по следующим соотношениям:

.

Из последнего соотношения видно, что коэффициенты определяются как средние значения по опытам эксперимента.

Весьма часто под опытом понимается несколько опытов, проведенных в одинаковых условиях. В этом случае значение параметра оптимизации у определяется как среднее значение по нескольким параллельным опытам. При этом возможно оценить и дисперсию параметра оптимизации в каждом из параллельных опытов.

Допустим, что опыт с номером i включает M параллельных опытов. Тогда среднее значение параметра оптимизации в этом опыте определяется как

.

При этом учтем, что прежде, чем провести вычисления по данному выражению, необходимо провести отбраковку «грубых» измерений. Таким образом, здесь M это количество параллельных опытов за вычетом тех, в которых произошла «грубая» ошибка измерения.

Кроме среднего значения параметра оптимизации в i-м опыте должна быть оценена и его дисперсия

.

 

 

Первое, что должно быть выполнено при проверке адекватности модели, это оценена однородность дисперсий.

Для проверки однородности дисперсий используется критерий Фишера. Выбираются две дисперсии – минимальная и максимальная, после чего вычисляется отношение максимальной к минимальной. Полученная величина сравнивается с критическим значением из таблицы распределения Фишера. Например, в опыте с номером i дисперсия равна , а в опыте с номером j - . Допустим, что > . Тогда их отношение . Значение Fэксп необходимо сравнить с табличным.

Таблица 1.

f2 f1
161,45 230,16 241,88 245,95 248,02 250,10 251,77 253,04
18,51 19,30 19,40 19,43 19,45 19,46 19,48 19,49
10,13 9,01 8,79 8,70 8,66 8,62 8,58 8,55
7,71 6,26 5,96 5,86 5,80 5,75 5,70 5,66
6,61 5,05 4,74 4,62 4,56 4,50 4,44 4,41
4,96 3,33 2,98 2,85 2,77 2,70 2,64 2,59
4,54 2,90 2,54 2,40 2,33 2,25 2,18 2,12
4,35 2,71 2,35 2,20 2,12 2,04 1,97 1,91
4,17 2,53 2,16 2,01 1,93 1,84 1,76 1,70
4,03 2,40 2,03 1,87 1,78 1,69 1,60 1,52
3,94 2,31 1,93 1,77 1,68 1,57 1,48 1,39

При сравнении должно выполняться условие: Fэксп<Fтабл.

В приведенной ниже таблице значения вычислены для уровня доверительной вероятности 0,95. При использовании табличной функции FРАСПОБР (электронная таблица Excel) в качестве параметра подставляется величина 1-Рд (в данном случае 0,05). Значения первой строки и первого столбца – это степени свободы, т.е. количество параллельных опытов (за вычетом тех, в которых произошла грубая ошибка измерения), по которым определено значение соответствующей дисперсии: в первой строке (f1) – для наименьшей дисперсии, в первом столбце (f2) – для наибольшей.

Если экспериментальное значение критерия Фишера меньше табличного, то дисперсии однородны, в противном случае это не так.

Если сравниваемое количество дисперсий больше двух и значение одной из них значительно превышает значения остальных, то для оценки однородности дисперсий используют критерий Кохрена. Важно при этом учесть, что критерий Кохрена применим только в случае, когда количество параллельных опытов одинаково для всех дисперсий.

Значение критерия Кохрена определяется как отношение суммы всех дисперсий, за исключением наибольшей, к наибольшей дисперсии:

.

Дисперсии однородны, если экспериментальное значение критерия Кохрена не превышает табличного.

Таблица 2.

f 1-Pд 0,01 0,02 0,05 0,10 0,20
4052,18 1012,52 161,45 39,86 9,47
99,00 49,00 19,00 9,00 4,00
29,46 18,11 9,28 5,39 2,94
15,98 10,90 6,39 4,11 2,48
10,97 7,95 5,05 3,45 2,23
4,85 3,97 2,98 2,32 1,73
3,52 3,02 2,40 1,97 1,56
2,94 2,58 2,12 1,79 1,47
2,39 2,15 1,84 1,61 1,36
1,95 1,80 1,60 1,44 1,27
1,60 1,51 1,39 1,29 1,18

 

В приведенной таблице в первой строке – значение 1-Рд, в первом столбце – число степеней свободы (количество параллельных опытов).

Далее, в случае однородности дисперсий вычисляется дисперсия воспроизводимости (параметра оптимизации), которая представляет собой усредненную дисперсию опытов:

 

.

 

Следующим шагом рассчитывается дисперсия адекватности:

.

В приведенном выражении f – число степеней свободы. Под числом степеней свободы здесь понимается разность между числом различных опытов, результаты которых используются при подсчете коэффициентов модели за вычетом числа определяемых коэффициентов. Например, для ПФЭ 23 и линейной модели от трех факторов, в которой определяется четыре коэффициента (b0, b1, b2, b3) число степеней свободы равно 8-4=4.

Значения - это наибольшие отклонения параметра оптимизации от его среднего значения для каждой серии параллельных опытов.

Завершающим шагом является проверка гипотезы об адекватности модели. Она оценивается по критерию Фишера, для чего вычисляется отношение

.

Полученная величина F сравнивается с табличным значением (таблица 1 данной лекции). Если экспериментальное значение F не превышает табличного, то с установленной доверительной вероятностью можно считать, что модель адекватна.

Собственно на этом заканчивается оценка адекватности модели. Если модель адекватна, то можно переходить к крутому восхождению, если нет – необходимо уточнить модель, для чего сместить центр эксперимента и (или) изменить диапазон варьирования факторов.