БЫСТРОСХОДЯЩИЙСЯ ИТЕРАЦИОННЫЙ СПОСОБ ОБРАЩЕНИЯ МАТРИЦ.
Если матрица мала (в смысле ее нормы или собственных значений), то обратная к
матрица
,
в принципе, может быть найдена сколь угодно точно приближенным суммированием данного матричного ряда. Однако такой непосредственный подход к вычислению имеет два очевидных недостатка: во-первых, реально его можно применить лишь для обращения матриц, близких к единичной, во-вторых, сходимость последовательностей частичных сумм этого ряда будет медленной даже при достаточно малых нормах матриц . Поэтому, пользуясь отмеченным фактом лишь как теоретической основой, построим итерационный процесс, определяющий существенно более быстро сходящуюся последовательность приближений к обратной для
матрице
. Будем далее обозначать эти приближения, получаемые на
-м шаге, через
, а их невязки
– через
.
Лемма 6.3. Если для матрицы найдется такая обратимая матрица
, что модули всех собственных чисел матрицы
меньше единицы, то матрица
обратима и для обратной матрицы справедливо представление
(6.31)
Лемма 6.4. Пусть матрица обратима и
.
Тогда:
1) существует матрица ;
2) справедливо представление по формуле (6.31);
3) имеет место оценка
Для построения итерационного процесса зафиксируем в разложении (6.31) первых слагаемых и будем считать первым приближением к
матрицу
Найдем выражение невязки этого приближения через невязку
предыдущего (в данном случае начального) приближения
:
(6.33)
Благодаря полученной связи между невязками, можно утверждать, что если выполняются условия лемм 6.3 или 6.4 по отношению к матрицам ,
, то для матриц
,
они тем более будут выполнены. Следовательно, к матрицам
,
, можно применить все рассуждения, проведенные выше для
,
. Таким образом, приходим к итерационному процессу
(6.34)
где – номер итерации;
– задаваемая начальная матрица, близкая к
в указанном выше смысле, а
– параметр метода.
Теорема 6.13. Пусть квадратные матрицы и
таковы, что матрица
обратима и
. Тогда существует обратная к
матрица
и к ней сходится последовательность матриц
, определяемая итерационным процессом (6.34). При этом имеет место точное равенство
и справедливы оценки погрешности:
1) ;
2) .
Равенства (6.34) определяют фактически не один, а целое семейство итерационных методов обращения. Фиксированием параметра можно получать конкретные процессы
-го порядка скорости сходимости. Этот порядок может быть сколь угодно большим, однако обычно ограничиваются процессами второго
и третьего
порядков. Приоритет процесса второго порядка связан с его простотой и более ранним появлением: первая публикация об этом методе относится к 1933 г. и принадлежит Г. Шульцу, в связи с чем и все семейство (6.34) естественно называть методом Шульца. Метод третьего порядка целесообразно использовать из тех соображений, что он, как показал М. Альтман, обладает свойством минимальности вычислительных затрат, требующихся для обращения матриц с заданной точностью методами семейства (6.34).
Процесс (6.34) построения приближений к обратной матрице легко видоизменить подобно тому, как это было сделано с методом простых итераций решения СЛАУ, когда для более оперативного учета получаемой на текущей итерации информации перешли от него к методу Зейделя (см. прарграф 6.3). Например, зейделева модификация метода Шульца второго порядка может быть определена равенствами
, (6.40)
где ;
;
и
– соответственно нижняя треугольная и строго верхняя треугольная матрицы. При реализации этой модификации нужно либо расписывать формулы (6.40) поэлементно (чтобы не работать с заведомо нулевыми элементами), либо формировать матрицу
постепенным замещением старых элементов новыми, осуществляя на
-й итерации цикл присвоений
,
где до начала цикла в правой части в двумерном массиве должна содержаться матрица
, а в двумерном массиве
матрица
(заполнение массивов новыми элементами производится по строкам). Процесс (6.40) при том же шаговом объеме вычислений и такой же простоте, что и в методе Шульца второго порядка, может дать определенный выигрыш в скорости сходимости.
Вообще, проблема выбора начального приближения в рассматриваемых здесь процессах, итерационного обращения матриц не позволяет относиться к ним как к самостоятельным универсальным методам, конкурирующим с прямыми методами обращения, основанными, например, на LU-разложении матриц. Имеются некоторые рекомендации по выбору
, обеспечивающие выполнение условия*
, являющегося необходимым и достаточным для сходимости процесса (6.34). Однако при этом, во-первых, требуется знать оценку сверху спектра обращаемой матрицы
либо матрицы
(а именно, если,
– симметричная положительно определенная и
, то можно взять
, где
; если же
произвольная невырожденная матрица и
, то полагают
, где также
; можно, конечно, упростить ситуацию и, воспользовавшись тем, что
, положить
). Во-вторых, при таком задании начальной матрицы нет гарантии, что
будет малой (возможно, даже окажется
), и высокий порядок скорости сходимости обнаружится далеко не сразу.
Все сказанное выше не означает, что подобные методы обращения матриц (и операторов) не имеют своей сферы применения. В частности, ниже будет рассматриваться способ решения систем нелинейных уравнений, базирующиеся на методе Ньютона с приближенным обращением матриц Якоби по методу Шульца, а в также метод Шульца используется как составная часть квадратурно-итерационного метода вычисления резольвент линейных интегральных уравнений.