Ковариационная матрица двумерной непрерывной случайной величины,коэффициенткорреляции,пределызначений,доказательство;независимость и некоррелированность:понятие и признаки. 4 страница
34.Оценивание коэффициентов аппроксимирующих полиномов при известной ковариационной матрице погрешностей измерений и известной модели, (рассмотреть случаи равноточных и неравноточных, однократных и многократных измерений), расширение класса аппроксимирующих полиномов.Будем рассматривать следующую ситуацию.Объективно существует функция y = f(x), ограниченная и дифференцируемая не менее q + 1 раз на интервале . Природа и происхождение этой функции могут быть различными:- этой функцией связаны между собой естественные параметры и(или) явления в природе, в обществе, в экономике и т.п.,- этой функцией описывается преобразование физических величин, происходящее в технических устройствах, таких как регуляторы, датчики, измерительные преобразователи, устройства телекоммуникаций и т.п.,- этой функцией описываются взаимосвязи параметров технических объектов, в том числе, технологических процессов в различных режимах (штатный режим работы, испытания, нештатные режимы),- этой функцией, по мнению исследователя, описываются объекты, явления, процессы, которые он моделирует на компьютере.По теореме Вейерштрасса, ограниченные и q +1 раз дифференцируемые в интервале функции могут быть сколь угодно точно аппроксимированы в этом интервале степенным (и даже обобщенным) полиномом. Понятно, что в реальном исследовании сколь угодно высокая точность достигнута быть не может, хотя стремление к максимально достижимой точности у каждого исследователя имеется. Пусть это естественное стремление выражается следующим образом.Желательно аппроксимировать реальную функцию y = f(x)полиномом степени q так, чтобы максимальное расхождение между реальной функцией и этим полиномом не превосходило пренебрежимо малой, с точки зрения исследователя, величины d> 0 : .Поскольку, по теореме Вейерштрасса, такой полином существует при любом сколь угодно малом значении d,будем считать коэффициенты “истинными” и для их обозначения введем вектор этих коэффициентов . Степень полинома q будем считать известной. В этом случае говорят: “модель объекта известна с точностью до параметров”. Объектом для нас является полином, аппроксимирующий функцию y = f(x).Теперь задачей исследователя является организация такого эксперимента, в результате которого он смог бы определить значения этих коэффициентов. Необходимыми условиями выполнения такого эксперимента являются- воспроизведение с необходимой точностью значений аргумента , , в заданном диапазоне , или, по крайней мере, фиксация фактически реализующихся этих значений с помощью измерений с заданной или хотя бы с известной точностью,
- измерение с необходимой или хотя бы с известной точностью значений функции при всех заданных (зафиксированных) значениях аргумента.Пример графического представления результатов подобного эксперимента приведен на рис. 31. Непрерывной кривой изображен график исследуемой функции y = f(x), точки на этой кривой - суть значения . Для обозначения всей совокупности этих значений введем вектор : . Точки вне этой кривой - результаты измерений, для обозначения которых введем вектор : .
Будем считать, что воспроизведение (измерения) значений аргумента выполняются с настолько высокой точностью, что погрешностью результатов можно пренебречь.Будем также считать, что погрешности измерения значений функции суть компоненты случайного вектора , не содержащие систематических составляющих (математическое ожидание всех компонент равно нулю), вектор распределен в соответствии с нормальным законом: , где - его ковариационная матрица. Диагональными элементами ковариационной матрицы являются дисперсии погрешностей измерений . Результаты измерений образуют в совокупности случайный вектор , который распределен нормально . В случае независимости измерений ковариационная матрица диагональна. Задача состоит в том, чтобы выполнить полиномиальную аппроксимацию исследуемой функции y = f(x), то есть найти оценки коэффициентов полинома, аппроксимирующего эту функцию.Измерения значений функции при каждом значении аргумента могут быть однократными или многократными.Рассмотрим вначале случай однократных измерений, которым можно ограничиться только в том случае, если ковариационная матрица известна априори.2.3.7.2. Измерения однократные.В соответствии с формулировкой задачи (п. 2.3.7.1) в результате эксперимента при фиксированных значениях мы получаем значения , :
Эти значения представлены на рис. 31 точками, лежащими вне кривых
Приведенная система равенств есть система k уравнений, из которой нам необходимо получить оценки q + 1 коэффициентов .
Для того, чтобы эту систему записать в матричном виде, введем матрицу
.
Тогда система уравнений записывается в виде
,
где векторы определены выше в п. 2.3.7.1 и
, .
Будем находить ММП-оценки неизвестных коэффициентов полинома. Для этого запишем k - мерную плотность распределения вектора :
.
Функция правдоподобия в этом случае равна
.
Максимум функции правдоподобия находится там же, где находится минимум квадратичной формы :
,
поэтому для нахождения ММП - оценок искомых коэффициентов будем их отыскивать путем минимизации указанной квадратичной формы. С этой целью продифференцируем ее по вектору и приравняем производную нулю. Напомним предварительно правила дифференцирования по вектору (см., например, [5], стр 73):
.
Пользуясь этими правилами после раскрытия скобок, получим:
,
откуда находим вектор ММП-оценок коэффициентов аппроксимирующего полинома :
.
Обратим внимание на то, что эта оценка линейно зависит от результатов измерений : , где - матрица размера (q+1)´k.
Являясь ММП-оценкой, полученный вектор есть эффективная оценка вектора коэффициентов полинома. Проверим ее несмещенность.
,
поскольку произведение взаимнообратных матриц есть единичная матрица. Несмещенность полученной оценки доказана.
Как показано в п. 2.3.7.1, ковариационная матрица вектора есть . Тогда, поскольку и в соответствии с п. 1.7.4 ковариационная матрица вектора оценок коэффициентов равна
. Производя перемножение ряда взаимнообратных матриц, находящихся в середине правой части, окончательно получим: .
Напомним также, что при линейном преобразовании случайных величин вид плотности распределения не изменяется (п. 1.6.7). Поэтому в связи с обнаруженной нами несмещенностью оценки .
Если измерения независимые, то ковариационная матрица диагональна. Если при этом измерения равноточные, когда при всех i= 1, 2, ..., k , тогда , где Е - единичная матрица, . В этих условиях квадратичная форма, подлежащая минимизации, принимает вид , и
.
Компонентами вектора являются разности ,и минимизируемая квадратичная форма представляет собой сумму квадратов этих разностей: .По этой причине приведенный метод определения коэффициентов аппроксимирующих полиномов называется методом наименьших квадратов (МНК), а получаемые этим методом оценки коэффициентов полиномов называются МНК-оценками.Общий метод оценивания коэффициентов аппроксимирующих полиномов путем минимизации квадратичной формы называется обобщенным методом наименьших квадратов (ОМНК), и оценки, вычисляемые по формуле , - ОМНК-оценками. Конечным итогом и целью оценивания является полином, коэффициентами которого являются найденные оценки: .При значениях аргумента этот полином принимает значения, которые суть компоненты вектора . График этого полинома представлен на рис. 31 пунктирной линией. В точке показана разность между результатом измерений и значением построенного полинома в этой точке. Все эти разности в совокупности для i = 1, 2, . . , kсоставляют вектор .Итак, в результате выполненных операций мы определили, что квадратичная форма принимает минимальное значение при . Обозначим это минимальное значение через . В случае ОМНК . Применительно к МНК , когда , .В обоих вариантах величина случайна, поскольку зависит от выборочных данных. Естественно выяснить плотность распределения величины . Этот вопрос мы рассмотрим отдельно в следующем пункте.2.3.7.3. Плотность распределения величины Начнем с рассмотрения величины ,которая вычисляется в рамках применения МНК, когда для получения оценок коэффициентов достаточно знать лишь о факте равноточности измерений, а значение дисперсии погрешностей измерений может быть неизвестным.
В выражении для - вектор выборочных значений, .Вектор - несмещенная ММП-оценка математического ожидания . В соответствии с МНК и постановкой задачи в п.. 2.3.7.1 компоненты вектора случайных погрешностей распределены нормально с одинаковыми параметрами . Поэтому компоненты вектора , то есть разности можно считать выборочными значениями погрешностей, изъятыми из одной нормальной генеральной совокупности : . Тогда величина есть не что иное, как сумма нормальных случайных величин с нулевым математическим ожиданием и единичной дисперсией. Такая сумма распределена по закону с числом степеней свободы, равным количеству слагаемых k без количества связей между выборочными значениями. В данном случае количество таких связей равно количеству уравнений, из которых получены оценки коэффициентов , то есть q + 1. Число степеней свободы поэтому равно k – q – 1.На этом основании заключаем, что ,Таким образом, при однократных равноточных измерениях несмещенной оценкой дисперсии погрешностей этих измерений может служить величина: .Если k = q + 1 , это выражение теряет смысл. Подобная ситуация возникает в одномерном случае, когда математическое ожидание исследуемой случайной величины неизвестно и выполняется только одно измерение, то есть n = 1. Тогда оценить характеристику разброса, каковой является дисперсия, принципиально невозможно (см. также п. 2.3.4.2. b). В случае применения ОМНК также .
35.Процедура оценивания коэффициентов аппроксимирующих полиномов при известной и неизвестной ковариационной матрице погрешностей и неизвестной степени полинома, (рассмотреть случаи однократных и многократных измерений).2.3.7.5. Измерения многократные,
характеристики погрешностей измерений известны.Полагаем, что известны характеристики погрешностей измерения значений аппроксимируемой функции:- при равноточных измерениях - дисперсия ,- при неравноточных измерениях - ковариационная матрица .
В частном случае ковариационная матрица может быть диагональной, i - ми элементами диагонали являются дисперсии погрешностей измерения значений ппроксимируемой функции. При каждом значении аргумента , i = 1,2,...,k, выполняется n измерений функции. Обозначим результаты этих измерений, через , где j -номер эксперимента, j = 1,2,..., n.Вычисляются средние арифметические значения ,из которых составляется вектор , после чего в зависимости от обстоятельств вычисляются МНК или ОМНК - оценки коэффициентов аппроксимирующего полинома по формулам п. 2.3.7.2, где вместо вектора следует использовать вектор . В силу центральной предельной теоремы плотность распределения среднего арифметического стремится к нормальной довольно быстро при любых плотностях распределения исходных погрешностей, которые не слишком сильно различаются по дисперсии (см. п. 1.6.6.4). Поэтому при многократных измерениях требование к нормальности распределения погрешностей измерений значительно смягчается.Как известно из п. 2.3.4.1, дисперсии средних арифметических . Точно так же из п. 2.3.4.4 следует, что ковариационная матрица вектора средних арифметических . В связи с этими обстоятельствами формулы пп. 2.3.7.2, 2.3.7.3 несколько изменятся.a)В случае применения МНК. ,
, но, как и прежде, .
b)В случае применения ОМНК. , , , ,о, как и прежде, .
2.3.7.6. Измерения многократные, характеристики погрешностей измерений неизвестны.В предыдущем пункте предполагалось, что ковариационная матрица или, по крайней мере, дисперсии погрешностей результатов измерений известны, что на практике бывает достаточно редко, особенно в отношении ковариационной матрицы.Однако, при многократных измерениях предоставляется возможность оценить дисперсии при каждом i: ли ковариационную матрицу в целом.Корректная оценка всех элементов ковариационной матрицы , не только диагональных, но и внедиагональныхвозможна лишь при выполнении специально организованного эксперимента.
Выполняется один цикл измерений в такой последовательности:- воспроизводится значение физической или иной величины, соответствующее первому значению аргумента и выполняется измерение (определение) значения функции, полученный результат - ,- воспроизводится значение физической или иной величины, соответствующее второму значению аргумента и выполняется измерение (определение) значения функции, полученный результат - ,- описанная процедура продолжается до достижения последнего, k - го значения аргумента х, таким образом будет получен первый вектор результатов измерений ,- устанавливается значение физической величины x, превышающее значение , затем вновь устанавливается значение , и процесс повторяется, но в обратном порядке, при уменьшении значений x; таким образом будет получен второй вектор результатов ,- в конечном итоге так будет получено n векторов вида , j = 1, 2, . . . , n.По этому массиву экспериментальных данных вычисляются оценки (см. пп. 2.3.4.3, 2.3.4.4) : , .Оценка ковариационной матрицы построена в соответствии с ее математическим определением, приведенным в п. 1.7.3. Поскольку при реализации ОМНК эту матрицу придется обращать, она не должна быть особенной. Для этого необходимо, чтобы n > k. Но если по техническим, экономическим или иным причинам это условие выполнить невозможно, то придется ограничиться вычислением только оценок дисперсий при каждом значении . По этим значениям строится диагональная матрица , в диагонали которой на i - ом месте стоит оценка дисперсии . В таком случае не учитывается ковариация между измерениями в точках , что приводит к незначительной потере в эффективности оценок коэффициентов, но они остаютсянесмещенными (см. п. 2.3.7.4, замечание 1).После этого для вычисления оценок коэффициентов аппроксимирующего полинома применяется ОМНК с заменой во всех формулах п. 2.3.7.5 матрицы на : , , ,
.Вследствие случайности исходных данных величина также случайна. Из-за участия в формуле для вместо генеральной ковариационной матрицы ее оценки в данном случае распределение “хи - квадрат” неприменимо. Вместо него здесь применяется плотность F - распределения Фишера (иногда она именуется, как плотность распределения Фишера - Снедекора), и обозначается, как , где и - количества степеней свободы. Плотность распределения Фишера имеет случайная величина [5]F = , что записывается в видеF = . Эта плотность распределения широко используется для сопоставления дисперсий генеральных совокупностей при дисперсионном анализе посредством исследования отношения оценок этих дисперсий. Нетрудно увидеть, что величина также, в некотором смысле есть отношение дисперсий. Функция распределения Фишера табулирована, таблицы приводятся в специальных таблицах математической статистики (например, [1,13, 14]). Из последних выражений для величины F следует, что при подготовке эксперимента по аппроксимации зависимостей необходимо обеспечивать выполнение неравенства n > k - q -1 , то есть превышение количества повторных измерений над числом степеней свободы квадратичной формы . Иногда по техническим, экономическим или иным объективным причинам это условие оказывается невыполнимым. В таком вынужденном случае придется формировать диагональную матрицу : , , и применять ее при вычислении оценок коэффициентов.В этой ситуации F - распределению Фишера подчиняется случайная величина F = .Число степеней свободы k - q - 1 и n - 1.В частном случае, когда по результатам проверки по критерию Кочрена (п. 2.5.6.1) гипотезы о равенстве дисперсий будет принято решение о применении МНК, тогда вычисляется средняя оценка дисперсии ,которая подставляется вместо во всех соответствующих формулах п. 2.3.7.5 : , , И в этом случае случайная величина F = .распределена в соответствии с F - распределением Фишера с числом степеней свободы k - q - 1 и n - 1.Все замечания, сделанные выше в п. 2.3.7.4, распространяются на случаи многократных измерений в полном объеме.