Модель многомерной (векторной) регрессии

Многомерный процесс РDj может представляться моделью многомерной (векторной) авторегрессии (векторная AR-модель) [1, 15, 32, 67]:

, (3.28)

где n-мерные векторы реализации процесса для момента времени ; g – порядок векторной авторегрессии; – квадратная матрица коэффициентов авторегрессии размером n на n; n-мерный центрированный случайный вектор погрешности (“белый шум”):

;

Для учета воздействия внешних факторов на координаты n-мерного вектора в модели (3.28) вводят дополнительно регрессионные составляющие (векторная ARX-модель) [1, 4, 14, 15]:

, (3.29)

где – матрица коэффициентов регрессии размером n на l ; l-мерный вектор значений внешних влияющих факторов в(j-i) момент времени; q – порядок векторной регрессии.

Выражение (3.29) можно записать в блочно-матричном виде и затем упростить его запись:

. (3.30)

Выбор метода оценки блочной матрицы параметров модели (3.30) (метода идентификации) в значительной мере определяется имеющейся априорной информацией о моделируемом процессе работы радиоэлектронной системы и влияющих на него факторов. В настоящее время наиболее широко используются следующие методы оценки параметров модели многомерной регрессии [5, 9, 14, 15]:

- метод байесовских оценок параметров, который применяется, когда априори известно многомерное вероятностное описание и в виде априорного распределения вероятностей , семейства условных распределений ;

- метод максимального правдоподобия, который используется, если отсутствует информация о плотности вероятностей , а априори известна лишь условная плотность ;

- метод наименьших квадратов, который не требует никакой дополнительной априорной информации о процессе, кроме непосредственно выборок реализаций самого процесса и влияющих факторов.

Сущность метода байесовских оценок определяется формулой [9, 14, 15]:

,

где – безусловная плотность распределения вероятностей наблюдений . Таким образом, вычисляют апостериорную многомерную плотность условного распределения вероятностей параметров относительно результатов наблюдения процесса . Далее определяют наиболее вероятные значения параметров , например, по формуле

,

которые и рассматривают как найденные параметры модели. По мере прихода новой информации уточняются априорные плотности вероятности и, следовательно, уточняются параметры модели.

Байесовский подход используют при прогнозировании тридцатиминутной заявленной мощности предприятий [7]. Он позволяет учесть как результат прогнозирования, получаемый с помощью современных математических методов, так и субъективную информацию специалиста, определяющую «степень веры» в полученный результат относительно параметров модели . Большая уверенность в величине ведет к выбору распределения с меньшей дисперсией, иначе – с большей.

В методе максимального правдоподобия неизвестную величину заменяют постоянной величиной, тем самым, считая, что любое значение параметров равновероятное. В результате формулы метода Байеса преобразуются к виду [9, 14, 15]:

.

Таким образом, для отыскания наилучшей оценки параметров модели максимизируется условная плотность вероятностей , что равнозначно минимизации в силу монотонности логарифмической функции критерия качества

.

Оптимальная оценка при этом определяется как решение уравнения

.

Логарифм от апостериорной плотности вероятностей называют функцией правдоподобия, а последнее уравнение называют уравнением правдоподобия.

Основным недостатком методов байесовских оценок и максимального правдоподобия является необходимость получения и использования сложных условных многомерных плотностей вероятности , которые трудно получить и сложно использовать. Эти подходы используют в случае одномерных моделей, типа временных рядов, когда плотности вероятностей преобразуются в одномерные и набор оцениваемых параметров модели преобразуется из матрицы в вектор.

Метод наименьших квадратов не требует априорной информации о плотностях распределения параметров и моделируемого процесса , а определение параметров модели осуществляется на основе минимизации критерия качества

,

где M[…] – знак среднего значения (математического ожидания) по переменной j; – евклидова норма вектора; – разность действительного и прогнозного значения процесса, полученного с помощью модели.

В векторной форме рассмотренный критерий качества записывают как положительно определенную квадратичную форму:

,

где – положительно определенная весовая матрица, зачастую в качестве используют матрицу , где – корреляционная матрица помехи .

Можно показать [1, 9], что минимум критерия обеспечивается, когда параметры определяются выражением

. (3.31)

Если при этом , то оценку параметров называют марковской [9, 15].

Модель векторной регрессии в полной мере реализует концепцию многомерного моделирования электропотребления. В общем случае моделирование многомерных процессов электропотребления осуществляют так [1, 12]: выделяют многомерную детерминированную изменяющуюся составляющую (тренд) РSj и многомерный ряд случайных остатков РDj из общего многомерного процесса Pj. Многомерный ряд случайных остатков РDj моделируют с использованием методов многомерной векторной регрессии [12, 15, 32]. Однако следует отметить особенности, сильно затрудняющие использование векторной регрессии.

Рассмотренный метод (3.31) определения параметров модели (3.29), (3.30) на основе МНК в общем случае подразумевает решение следующих вопросов: оценка порядков регрессионной g и авторегрессионной q частей модели (3.29), используя предысторию изменения процесса; оценка параметров модели и как элементов матриц Аi, Bi или φ. Порядки модели g и q определяются, например, путем последовательных испытаний моделей с возрастающим порядком [1, 15, 64], при этом на каждом испытании определяются соответствующие матрицы коэффициентов Аi и Bi. Оценивание же параметров модели Аi и Bi связано, как правило, с решением плохо обусловленных систем линейных уравнений, что требует специальных процедур идентификации и ведет к значительному усложнению расчетов [1, 15], применение классических процедур идентификации [26] при этом затруднено. Последнее обстоятельство зачастую связано с мультиколлинеарностью исходных данных, используемых при построении модели векторной регрессии.

При идентификации авторегрессионной составляющей модели необходимо выполнение условия стационарности описываемого многомерного процесса , что не всегда возможно достичь. Использование конечных разностей (как в ARIMA-модели) для многомерного процесса также затруднено и не исследовано.

Кроме того, при вычислении матриц коэффициентов Аi и Bi необходимо использование блочных матриц достаточно больших размеров, что в свою очередь также сказывается на времени идентификации и ведет к увеличению ошибок округления, а следовательно, и ошибки идентификации [1, 80].