Основы построения статистических моделей элементов ХТС
При разработке статистических моделей модулей ХТС не ставится задача детального описания закономерностей процессов, происходящих в объекте, т.к. его математическое описание строится в виде регрессионных зависимостей выходных параметров объекта от входных и представляет собой линейные или нелинейные полиномиальные уравнения. Коэффициенты полиномиальных уравнений находят путем обработки экспериментальных данных, полученных на производстве или на уточненной физико-химической модели объекта с использованием метода наименьших квадратов. Таким образом, подход к технологическому объекту как к "черному ящику", т.е. без учета процессов, проходящих внутри самого объекта, позволяет создать модель с минимальными затратами на сбор и обработку информации.
Суть метода наименьших квадратов заключается в том, что через ряд экспериментальных точек проводят такую зависимость (Y=f(X1,X2,Xm)), сумма квадратов отклонений которой от экспериментальных значений при соответствующих значениях X1, X2 и Xm – минимальна (см. Рис.4.14).
Рис.4.14. Иллюстрация метода наименьших квадратов
Вид зависимости Y=f(X1,X2,Xm) может быть различный. Однако обычно зависимость Y=f(X1,X2,Xm) представляет собой полином:
[4.24]
где ai – коэффициенты полинома;
Xi – изменяемые факторы;
m – количество факторов.
Коэффициенты полинома ai, при которых сумма квадратов разностей экспериментальных (YiЭ) и расчетных (YiР) значений будет минимальна (уравнение 4.25), могут быть рассчитаны с использованием различных математических методов (решение системы линейных уравнений, минимизации и т.п.).
[4.25]
Следует отметить, что метод наименьших квадратов достаточно широко используется при обработке экспериментальных данных, т.к. позволяет не только определять параметры полиномиальных зависимостей, описывающих работу объекта, и не имеющих физического смысла, но и уточнять параметры физико-химических моделей.
Например, при расчете коэффициента теплопередачи (уравнение 4.21) используются коэффициенты теплоотдачи (aХ и aГ), зависящие от параметров движения потока горячего и холодного теплоносителей, которые можно рассчитать по критериальным зависимостям, которые являются разновидностями физико-химических моделей:
[4.26]
где параметры A, B, C и D находятся в результате обработки экспериментальных данных методом наименьших квадратов.
В качестве другого примера можно привести уравнение зависимости константы скорости химической реакции паровой конверсии монооксида углерода для железохромовых катализаторов в интервале температур 400-500ОС, лежащей в основе физико-химической модели реактора:
[4.27]
где значения коэффициентов: "34000", "4,57" и "10,2" также были найдены путем обработки данных эксперимента по изучению кинетики паровой конверсии монооксида углерода методом наименьших квадратов.
Еще одним примером может быть полиномиальное уравнение зависимости изобарной теплоемкости от температуры (уравнение 4.13), использующееся в физико-химической модели. Коэффициенты этого уравнения были также получены обработкой экспериментальных данных методом наименьших квадратов.
Кроме указанных, можно привести еще множество аналогичных примеров, где понятия статистическая модель и физико-химическая модель достаточно тесно переплелись между собой. Однако следует отметить, что грань между физико-химическими и статистическими моделями весьма тонка, т.к. по сути, различия зависят только от глубины рассмотрения процессов, происходящих в реальном объекте и полноты их математического описания.
Особенность физико-химических моделей заключается в том, что при их использовании процесс рассматривается на двух уровнях: нижнем – уровне изменения параметров процессов и свойств потоков, и, верхнем – уровне, описывающем особенности процессов.
Например, уравнение Аррениуса достаточно широко используется как зависимость константы скорости различных химических реакций от температуры:
[4.28]
где коэффициенты k0 и EАКТ (имеющие физический смысл) могут быть определены, например для процесса паровой конверсии метана, обработкой экспериментальных данных методом наименьших квадратов. Для другого процесса коэффициенты и EАКТ будут иметь другие значения, но вид самого уравнения останется прежним. Более того, экспериментально и теоретически доказано, что, например, при снижении активности катализатора величина энергии активации (EАКТ) останется неизменной, а изменится только параметр k0. Таким образом, зная общий вид физико-химической зависимости и значения двух констант, появляется возможность описания достаточно сложной зависимости константы скорости от температуры в широком интервале изменения параметров процесса.
В случае использования статистических моделей объект рассматривается как единое целое без детализации происходящих в нем процессов, т.е. в виде "черного ящика", для которого определяются функции преобразования входных параметров в выходные. Данные функции преобразования могут иметь различный вид даже для одинаковых технологических объектов, т.к. не имеют какого либо физического смысла. Например, статистическая модель созданная для аппарата паровоздушной конверсии метана в производстве аммиака на ОАО "Минеральные удобрения" (г.Пермь) не может использоваться для аналогичной установки паровоздушной конверсии метана в производстве аммиака ОАО "Азот" (г.Березники). Более того, если установка, для которой была составлена статистическая модель, перейдет в режим работы, параметры которого не использовались при составлении модели, то ее статистическая модель должна быть построена заново, т.к. применение статистической модели ограничено пределами варьирования входных и выходных параметров в пределах данных, использовавшихся при составлении модели (см.Рис.4.15), т.е. в пределах, для которых была доказана ее адекватность реальному объекту.
Рис.4.15. Иллюстрация пределов применимости статистической модели
На Рис.4.5. видно, что зависимость выходного параметра (Y) от входного (Xm) удовлетворительно описывает экспериментальные точки лишь в пределах варьирования входного параметра от Xmin до Xmax, и выходного параметра от Ymin до Ymax. За пределами варьирования параметров зависимость может проходить произвольно. Таким образом, в отличие от физико-химической модели, статистическая модель не может быть экстраполирована за пределы варьирования параметров. Для расширения параметров варьирования необходимо собрать дополнительные данные и заново составить модель.
Обычно к статистическим моделям относят модели, полученные обработкой данных активного (факторного) или пассивного эксперимента на реальном объекте или с помощью адекватной модели. В случае активного факторного эксперимента, если наблюдаются линейные зависимости между выходными и входными переменными, то используются планы первого порядка: полный факторный эксперимент (ПФЭ) и дробный факторный эксперимент (ДФЭ). В случае, если зависимости между выходными и входными переменными активного факторного эксперимента имеют явно нелинейный характер, то для получения математического описания объекта используют композиционные планы второго порядка, например, ортогональный центральный композиционный план (ОЦКП). При обработке данных пассивного эксперимента получают регрессионное уравнение, сложность которого определяется в зависимости от сложности объекта, количества исходных данных и требуемой точности.
ПФЭ по сравнению с пассивными статистическими методами получения математического описания модели имеет преимущество в том, что позволяет при минимальном количестве опытов получить максимум информации об объекте. Однако ПФЭ в основном применяется для получения статистической модели объекта на основе его физико-химической модели или в случае, если на установке имеется возможность планировать изменение технологических режимов без ущерба для производства. Еще одним условием использования ПФЭ является существенность и взаимная независимость исходных параметров.
В общем виде, уравнение регрессии объекта может быть представлено с помощью полинома:
[4.29]
где ai – коэффициенты полинома;
Xi – изменяемые факторы;
m – количество факторов.
В ПФЭ все факторы варьируются на двух уровнях: верхнем (обозначается: +1) и нижнем (обозначается: -1). При проведении экспериментов реализуются всевозможные комбинации факторов на выбранных уровнях. Для учета взаимного влияния двух факторов используют их парные произведения. В этом случае, количество серий опытов может быть подсчитан по формуле:
N=2m [4.30]
Пример матрицы планирования двухфакторного эксперимента представлен в Таблице 4.2.
Таблица 4.2
Матрица планирования двухфакторного эксперимента
№ серии экспериментов | Факторы | Х1.Х2 | |
Х1 | Х2 | ||
+1 | +1 | +1 | |
+1 | -1 | -1 | |
-1 | +1 | -1 | |
-1 | -1 | +1 |
При обработке результатов ПФЭ определяются коэффициенты регрессионного уравнения, дисперсия адекватности, дисперсия среднего, критерий Фишера, по которому определяется адекватность регрессионного уравнения и т.д. По окончании обработки данных делается вывод об адекватности модели. В случае, если модель неадекватна, то, например, изменяют исходные данные, изменяют вид регрессионного уравнения, и проводят обработку заново.
Однако методы обработки данных активного эксперимента не всегда применимы для создания моделей модулей ХТС на основании производственных данных, т.к. в условиях реальной промышленной установки достаточно сложно соблюсти требуемые интервалы варьирования параметров, заданные в плане. Именно поэтому, наибольшее распространение для создания статистических моделей модулей ХТС получили методы обработки производственных данных методом пассивного эксперимента.
Для получения статистической модели на основе обработки данных пассивного эксперимента, сбор данных производят с действующей установки и представляют их в виде, представленном на Таблице 4.3.
Таблица 4.3 - Форма представления исходных данных
№ п/п (1…N) | Факторы (1…К) | Отклик Y | |||
Х1 | Х2 | … | ХК | ||
X11 | X21 | … | XK1 | Y1 | |
X12 | X22 | … | XK2 | Y2 | |
X13 | X23 | … | XK3 | Y3 | |
… | … | … | … | … | … |
N | X1N | X2N | … | XKN | YN |
Выше было указано, что статистическая модель "работает" лишь в пределах варьирования параметров, поэтому сбор исходных данных необходимо производить для всех установившихся режимов работы установки в максимально широких пределах их варьирования. Обычно, план изменения параметров разрабатывают с помощью методов, принятых в ПФЭ, т.к. данные методы позволяют получить максимальную информацию об объекте с минимальным количеством изменений параметров.
При сборе данных следует учитывать принцип: чем больше собрано данных – тем лучше. Особое внимание следует обратить на режим работы установки, т.к. составить статистическую модель элемента технологической установки возможно лишь для стационарных режимов ее работы. Однако, реально, после изменения каких-либо параметров, стационарный режим работы установки достигается только через определенное время. Более того, если установка не имеет АСУ, то процесс достижения ей стационарного режима работы может тормозиться за счет переходных процессов. Именно поэтому, перед началом сбора данных нужно максимально снизить влияние системы управления обследуемого элемента установки на изменение режимов его работы, например, переводом элемента установки на ручное управление. Если перевод на ручное управление невозможен, то в этом случае необходимо по окончании изменения параметров технологического режима определить время стабилизации режима работы установки, и начинать сбор данных только по истечении этого времени.
В связи с тем, что основным режимом работы любой технологической установки является динамический режим, т.е. установка постоянно находится в процессе перехода из одного состояния в другое (вопрос лишь заключается в скорости данного перехода), при сборе текущих технологических параметров необходимо по величинам расхода, температуры, состава и т.д. определить примерное время перехода установки к стационарному (псевдостационарному) режиму после изменения какого-либо параметра ее работы, и, начинать сбор данных только по истечении этого времени.
В соответствии с Табл.4.3, факторами называются входные переменные (ХKN), а откликом – выходной параметр (YN). Например, откликом может быть концентрация вещества на выходе из реактора, а факторами – температура, давление, исходные концентрации реагентов, время пребывания и т.п. При наличии нескольких выходных параметров составляют несколько исходных таблиц и составляют несколько регрессионных уравнений.
Уравнение, описывающее функцию отклика (Y) обычно представляется в виде ряда Тейлора для многомерной функции. Это уравнение называется уравнением регрессии:
[4.31]
где YP – расчетное значение функции отклика
ХК – значения параметров, при которых рассчитывается функция отклика
В связи с высокой сложностью регрессионного уравнения, обработку экспериментальных данных начинают с использованием более простого уравнения, включающего только линейные члены. Далее, при неудовлетворительном результате, переходят к более сложным уравнениям, включающим квадратичные, перекрестные, кубические и более сложные члены. Однако при выборе вида уравнения следует учесть, что с увеличением сложности регрессионного уравнения снижается вероятность того, что в результате расчетов удастся получить гладкую зависимость даже в пределах варьирования параметров, поэтому обычно ограничиваются небольшим числом членов уравнения 4.30. Это связано с тем, что адекватная зависимость, имеющая множество локальных минимумов и максимумов в пределах варьирования параметров не пригодна для целей оптимизации и анализа (см.Рис.4.16), т.к. данная зависимость противоречит физической природе реального объекта (в природе, за редким исключением, все свойства объектов имеют плавные зависимости).
Рис.4.16. Иллюстрация недопустимого вида статистической модели
В случае если количество параметров, реально влияющих на работу объекта велико, то необходимо рассмотреть физико-химическую сущность объекта и провести его инженерный анализ. По результатам анализа объекта, в зависимости от лежащих в основе объекта физико-химических зависимостей, и от характера данного влияния, необходимо провести комбинирование (объединение) влияющих параметров в минимальное количество факторов и перестроить таблицу факторов.
Например, уравнение регрессии, включающее линейные, перекрестные и квадратичные члены для двух факторов запишется:
[4.32]
Данное уравнение регрессии будет линейно относительно коэффициентов регрессии (bJ) в случае, если уравнение упростить, т.е произвести замену факторов:
[4.33]
Более того, если ввести фактор х0=1, то в общем виде, уравнение регрессии примет вид:
[4.34]
Таким образом, т.к. в уравнение 4.34 факторы входят линейно и независимо, то под значением фактора ХJ могут быть скрыты и более сложные выражения, чем линейные, перекрестные или степенные члены. Таким образом, уравнение может иметь любой реальный вид, а выражение, скрытое за фактором ХJ может быть выбрано не случайно, а на основе теоретических соображений с учетом того, чтобы получаемая зависимость имела наиболее гладкий вид.
Расчет коэффициентов регрессионного уравнения bJ осуществляется методом наименьших квадратов, суть которого описана выше.
После вычисления коэффициентов регрессии переходят к статистическому анализу этого уравнения, который включает следующие этапы:
- оценивается адекватность модели (способность достоверно описывать функцию отклика);
- оценивается значимость факторов, входящих в уравнение регрессии.
Проверка адекватности регрессионного уравнения осуществляется с помощью критерия Фишера (FP) по условию:
[4.35]
где
[4.36]
где - дисперсия среднего;
[4.37]
- дисперсия адекватности.
[4.38]
где N – количество экспериментальных точек;
m – число коэффициентов регрессии в уравнении, включая свободный член
Таким образом, чем больше будет массив данных исходных данных, собранных в Табл.4.3 (величина N), и проще будет вид регрессионного уравнения (величина m), тем будет выше вероятность того, что получаемое уравнение регрессии будет адекватно. Следует отметить, что в соответствии с принципами статистики, недопустимы попытки получения сложного уравнения регрессии по небольшому количеству экспериментальных данных, например, расчет уравнения линии по одной точке или параболы – по двум, т.е. всегда должно соблюдаться условие: N>m.
Оценка значимости факторов, используемых при описании функции отклика осуществляется с помощью критерия Стьюдента (tP) по условию:
[4.39]
где
[4.40]
где bJ – коэффициент регрессии при оцениваемом факторе;
– среднеквадратическое отклонение коэффициента регрессии.
Обычно величина критерия Стьюдента находится в пределах 2-4, поэтому, если среднеквадратическое отклонение коэффициента регрессии будет больше 25-50% величины самого коэффициента регрессии (по модулю), то данный коэффициент считается незначимым и может быть исключен из уравнения регрессии.
После исключения всех незначимых членов, уравнение регрессии приобретает новый вид. Следовательно, на следующем шаге необходимо будет снова оценить коэффициенты регрессии и снова проверить их значимость. Данный цикл операций производится до тех пор, пока не будет получено адекватное регрессионное уравнение, все факторы которого являются значимыми.
Следует отметить, что при моделировании ХТС допускается использовать только адекватные математические модели процессов во всем диапазоне изменения входных параметров вне зависимости от того, является модель физико-химической или статистической.
В качестве примера составления статистической модели, рассмотрим выбор параметров для определения зависимостей, лежащих в основе системы параметрического мониторинга выбросов энергетического котла, работающего на природном газе.
При работе котла на газовом топливе, измеряемыми технологическими параметрами, определяющими режим работы котла, являются:
- давление топливного газа на горелках (РГАЗА)
- давление воздуха на горелках (РВОЗДУХА)
- атмосферное давление (РАТМ)
- температура дымовых газов после водяного экономайзера (ВЭК.) в параллельных дымоходах (tВЭК-1…4)
- степени открытия заслонок нагнетания воздуха дутьевых вентиляторов (%.засл.воздуха1…2)
- температура горячего воздуха после воздухоподогревателей (tГОР.ВОЗДУХА-1…2)
- степень открытия заслонок дымососов (% засл.ДС1…2)
Так как непосредственное использование данных факторов, их квадратов и парных произведений не позволяет получить адекватные зависимости, данные факторы комбинировались с учетом физического смысла, в следующие комплексы:
[4.41]
[4.42]
[4.43]
[4.44]
[4.45]
[4.46]
Комбинирование технологических параметров в комплексы данного вида можно объяснить следующими соображениями:
- горелка котла, по сути, представляет собой сужающее устройство, следовательно, количество подаваемого на сжигание топлива и воздуха будут зависеть от температуры потока, давления перед горелкой и атмосферного давления. Таким образом, в комплексы Х1 и Х2 включены параметры, позволяющие учесть отклонение параметров потоков от нормальных термодинамических условий (по атмосферному давлению и температуре потока, подаваемого в горелку);
- так как образование оксидов азота и недожог топлива зависят от КПД котла, определяющегося в основном температурой дымовых газов, вводят комплекс Х3 –среднюю температуру дымовых газов;
- на образование оксидов азота и недожог топлива также влияет вид факела горящего топлива, зависящий (сложным образом) от гидравлики тракта дымовых газов, на которую оказывает влияние степень открытия заслонок дутьевых вентиляторов и дымососов, объединенных в комплексы Х4, Х5 и Х6 (данный вид комплексов был получен после нескольких неудачных попыток учесть влияние заслонок на содержание в дымовых газах загрязняющих веществ).
Следует отметить, что объединение факторов в указанные комплексы производилось на основе эмпирик, характерных для конкретного энерготехнологического агрегата. Для других котлов, даже однотипных, или для данного котла после капитального ремонта топки, тракта дымовых газов или замены горелок, вид комплексов (особенно Х4, Х5 и Х6) может быть другой. Кроме того, в качестве гипотез, при составлении статистической модели могут быть использованы и другие параметры работы объекта, которые при обработке данных могут быть "отсеяны", как несущественные.
Объединение указанных факторов в комплексы позволило получить адекватные зависимости концентрации NOX в дымовых газах после дымососа:
, ppm [4.47]
концентрации СО в дымовых газах после дымососа:
, ppm [4.48]
коэффициента избытка воздуха после дымососа:
[4.49]
Величины коэффициентов данных зависимостей представлены в Таблице 4.4.
Таблица 4.4 - Значения коэффициентов математических моделей для расчета состава дымовых газов при работе котла на газовом топливе
Расчет | Номер коэффициента в уравнении | ||||
NOX | 1,792726×102 | -3,709418×102 | 1,388268 | 7,190076×10-2 | -1,189317×101 |
CO | 1,310595×103 | -3,560766×102 | 4,162166×102 | -1,807937×10-1 | -1,730371×103 |
a | 6,932277 | -1,269301×10-1 | 7,281846×10-4 | - | - |
Результаты обработки экспериментальных данных, погрешности расчетов и статистические параметры моделей представлены в Таблице 4.5 и на графиках Рис.4.17 и Рис.4.18.
Таблица 4.5 - Основные параметры статистических моделей, полученные в результате обработки экспериментальных данных методом наименьших квадратов.
Расчет | Средняя абс. погрешность | Коэффициент множ. корреляции | Критерий Фишера (расч). |
NOX | 2,0 ppm | 95,94% | 10,89 |
CO | 4,8 ppm | 80,65% | 2,95 |
a | 0,02 | 97,11% | 16,36 |
Табличный критерий Фишера для соответствующих степеней свободы составил 2,45, т.е. полученные статистические зависимости адекватны.