Арифметическое векторное пространство.
Из школьного курса математики известно, что точки и вектора на плоскости, с заданной системой координат, однозначно определяются с помощью упорядоченных пар чисел (x, y). Именно это обстоятельство лежит в основе определения понятия n - мерного векторного пространства.
О п р е д е л е н и я. Для целого положительного числа n обозначим через R множество всех упорядоченных последовательностей из n вещественных чисел
x= ( x 1 , . . . , x n )
числа x 1, . . . , x n называются компонентами элемента.Элементы множества R называются точками или векторами.
Замечание. Термин вектор используется в линейной алгебре, когда рассматриваются алгебраические операции над элементами пространства. Термин точка чаще используется в математическом анализе, когда элементы пространства рассматриваются с точки зрения расстояния между ними.
Мы будем обозначать вектора буквами, набранными жирным шрифтом. Вектор x можно записать в виде
x =
В этом случае x называют вектор-столбцом.
Два вектора x= ( x 1 , . . . , x n) и y= ( y 1 , . . . , y n ) называются равными, если равны их соответствующие компоненты x 1 = y 1 , . . . , x n = y n .
Если x иy элементы из R и a - вещественное число, то положим
x + y= ( x 1 + y1 , . . . , x 1 + y n ),
ax= (a x 1 , . . . , a x n ),
так, что x + yи axэлементы из R .
Например, если x= (3, -1, 2) и y= (2, 4, 1) вектора из R , то вектор
2x +3y= (6 , -2, 4) + (6 , 12, 3) = (6 + 6 , -2 + 12, 4+3)=(12 , 10, 7)
принадлежит R .
Тем самым определено сложение векторов, а также умножение вектора на число.
Эти две операции подчиняются законам:
1. сложение коммутативно
x + y = y + x
2.сложение ассоциативно
(x + y) + z= x +(y + z)
3. умножение ассоциативно
(ab) x = a(bx)
4. умножение дистрибутивно по отношению к сложению чисел
(a + b)x= ax +bx
5. умножение дистрибутивно по отношению к сложению векторов
a(x + y) = ax +ay .
6. в пространстве существует 0=(0, . . . ,0)-нулевой элемент, удовлетворяющий условию
x + 0 = 0 + x = x.
7. умножение на единицу не изменяет вектор
1×x = x
8. Возможно вычитание, т.е. для любых двух векторов а, b найдется такой вектор x, что
a + x = b.
Множество R , с введенными операциями сложения векторов и умножения вектора на число, называется арифметическим векторным пространством.
Замечание. Пространство R является частным случаем более общего понятия линейного пространства. Приведем общее определение.
Произвольное непустое множество L называется линейным или векторным пространством, если оно удовлетворяет следующим условиям:
а) для любых двух элементов x, yÎL однозначно определен третий элемент, называемый их суммой и обозначаемый x+y;
б) для любого x ÎL и любого числа a определен элемент axÎL, называемый произведением a на x;
в) операции сложения и умножения на число удовлетворяют требованиям 1) - 8).
Арифметическое векторное пространство представляет собой линейное пространство. Другим примером линейного пространства является множество многочленов степени не выше n-1 с обычными операциями сложения многочленов и умножения их на числа.
О п р е д е л е н и е. Непустое подмножество X векторов пространства R называется линейным подпространством этого пространства, если из условия xÎX и yÎX следует, что вектор ax + by принадлежит X при любых a и b.
П р и м е р. Пусть X Ì R - подмножество векторов третья компонента которых равна нулю. Тогда X является подпространством пространства R . Действительно, если x = (x , x , 0) и y = (y , y , 0) вектора из X, то вектор
ax + by = (ax 1+ by 1 , ax 2+ by 2 , a0 + b0) = (ax 1+ by 1 , a x 1 + by 2 , 0)
принадлежит X.
Введем в пространстве R еще одну операцию.
О п р е д е л е н и е. Скалярным произведением векторов x = (x 1 , . . . , xn ) и y = (y 1 , . . . , yn ) пространства R будем называть число ( и обозначать его (x, y) ), вычисляемое по формуле
(x, y) = x 1 y 1 + . . . + x n y n
Непосредственно из определения следует, что имеют место равенства:
1. (x, y) = (y, x);
2. (x + y, z) = (x, z) + (y, z);
3. (a×x, y) = a×(x, y) .
Два вектора a и b называются ортогональными, если (a, b) = 0.
Например, вектора
e1= (1, 0) и e 2 = (0, 1)
ортогональны т. к.
(е1 , е 2 ) =1×0 + 0×1 = 0 e2
e
Рис. 3
Система ненулевых векторов a 1, . . . , am называется ортоганальной, если (ak, a l ) = 0 при k¹ l.
Введенным абстрактным понятиям и операциям можно придать конкретный экономический смысл.
Например, пусть предприятие выпускает n видов продукции. Если за рассматриваемый календарный период предприятие выпустило продукции i в количестве x i , то вектор x= ( x 1 , . . . , x n ) называется вектором выпуска продукции за данный период. Если с i -цена продукта i, то вектор c= ( c 1 , . . . , c n ) называют вектором цен. Скалярное произведение
(c, x) = c 1 x 1 + . . . + c n x n
в этом случае является валовой продукцией за рассматриваемый период. Если в следующий период предприятие планирует производить продукцию i в количестве y i , то вектор y= ( y 1 , . . . , y n ) называется плановым вектором. Разность векторов y - x характеризует планируемый прирост продукции.
Системы векторов в R .
Очевидно, что в пространстве существуют системы векторов из которых с помощью введенных операций сложения и умножения на число можно получить любой вектор пространства (в качестве такой системы можно взять само пространство). Из таких систем наибольший интерес вызывают системы с наименьшим числом векторов, изучением которых мы и займемся в этом параграфе.
О п р е д е л е н и е. Система векторов a 1 , . . . , a m называется линейно зависимой, если существуют такие числа a 1 , . . . , a m не все равные нулю, что выполняется равенство
a 1 a 1+ . . .+ a ma m = 0. (1)
Система векторов называется линейно независимой, если из равенства (1) следует, что все числа a 1 , . . . , am равны нулю.
Из определения непосредственно следует, что если к линейно зависимой системе векторов a 1, . . . , a m присоединить вектора b 1 , . . . , b , то расширенная система останется линейно зависимой. В самом деле, если
a1a 1+ . . .+ a m a m = 0
и не все числа a1, . . . , a равны нулю, то
a1a 1+ . . .+ a m a m +0×b 1 + . . . + 0×b = 0
и не все из чисел a1, . . . , a , 0, . . . , 0 равны нулю.
В вопросах связанных с линейной зависимостью, нулевой вектор 0 занимает особое место, так как любая система, содержащая нулевой вектор, является линейно зависимой. Для доказательства достаточно заметить, что
1×0 + 0 ×a1+ . . . + 0 ×a m = 0
при любых a 1, . . . , a m.
Важную роль в пространстве Rиграют вектора
e1 = (1, 0, 0, . . . , 0, 0)
e2 = (0, 1, 0, . . . , 0, 0)
. . . . . . . . . . . . . . . . . . .
e n - 1= (0, 0, 0, . . . , 1, 0)
e n = (0, 0, 0, . . . , 0, 1),
называемые единичными векторами. Система векторов е1, . . . еn является примером линейно независимой системы. Действительно, если
a 1 е 1 + . . . + a n е n = ( a , . . . , a n) = 0 = (0, . . . , 0),
то a1 = . . . = a n = 0. Другим более общим примером является система ненулевых ортогональных векторов a 1, . . . , a . В самом деле, если
a 1 a 1+ . . .+ a m a m = 0,
то умножая обе части равенства на получим
0 = (a k , 0)= (a k , a1a 1+ . . .+ a m a m) = ak (a k , a k ),
но (а k , а k ) ¹ 0 и, значит, a k= 0 для всех k = 1, 2, . . . m.
Если вектор b можно представить в виде
b = a1a1+ . . .+ a m a m
то говорят, что b выражается линейно через a 1, . . . , a m или b линейно зависит от a 1, . . . , a m.
Т е о р е м а 1.1. Система ненулевых векторов, рассматриваемых в определенном порядке, a 1, . . . , a m линейно зависима тогда и только тогда, когда хотя бы один из векторов системы можно выразить линейно через предыдущие.
Д о к а з а т е л ь с т в о. Пусть система векторов a 1, . . . , a m линейно зависима. Тогда существуют такие числа a1, . . . , a m не все равные нулю, что выполняется равенство
a1a 1+ . . .+ a m a m = 0.
Обозначим через a последний коэффициент, отличный от нуля. Если k=1, то равенство обращается в
a1а 1 = 0 ( a1 ¹ 0),
откуда а 1 = 0 вопреки предположению, что система не содержит нулевых векторов. Следовательно, 1< k £ m, и равенство мы можем переписать в виде
a1а1 + . . . + a k а k = 0 ( a k ¹ 0),
откуда
а k = - a a 1 а 1 - . . . - a a k - 1а k - 1.
Таким образом, первая часть теоремы доказана. Обратное утверждение очевидно. Действительно, если
а k = b 1 а 1 + . . . + b k - 1а k - 1 ,
то
b 1 а 1 + . . . + b k - 1а k - 1 + (-1)а k + 0а k+ 1+ . . . + 0а m = 0
и коэффициент при а k отличен от нуля.
О п р е д е л е н и е. Систему векторов a 1 , . . . , a m будем называть порождающей, если любой вектор b пространства выражается линейно через вектора системы, т.е. представим в виде
b = a 1a 1+ . . .+ a m a m
О п р е д е л е н и е. Линейно независимая порождающая система векторов называется базисом пространства.
Примером базиса пространства Rявляется система единичных векторов е 1 , . . . , е n , называемая единичным базисом. Действительно, произвольный вектор b = (b 1 , . . . , b n ) представим в виде
b = b 1 e 1+ . . .+ b n e n ,
а линейную независимость мы показали выше.
Л е м м а . Если порождающая система векторов а 1 , . . . , а m содержит вектор а k , который можно линейно выразить через остальные, то, выбрасывая а k из системы, мы снова получим порождающую систему векторов.
Д о к а з а т е л ь с т в о. В самом деле, по условию каждый вектор b пространства представляется в виде
b = a 1 a 1 + . . . + a k a k + . . . + a m a m , (2)
а вектор а k в виде
а k = b 1 а 1 + . . . + b k - 1 а k - 1 + b k+1а k+1 + . . . + b m а m . (3)
Подставляя (3) в (2) и приводя подобные, получим
b = (a1 + a k b 1 )a k + . . . + (ak - 1 + a k b k - 1 )a k - 1 +
+ (ak+1+ a k b k+1)a k+1 + . . . + (a m + a k b m )a m .
Последнее представление вектора b означает, что система векторов, отличных от а k , является образующей.
Т е о р е м а 1.2. Из любой порождающей системы можно выбрать базис пространства.
Д о к а з а т е л ь с т в о. Выбрасывая из порождающей системы векторы, вырождающиеся линейно через предыдущие, мы получим некоторую систему векторов, которая согласно лемме все еще будет порождающей. Так как ни один из векторов последней системы не может быть выражен линейно через предыдущие, то в силу теоремы 1.1 эта система линейно независима и, следовательно, является базисом пространства.
Т е о р е м а 1.3. Все базы пространства R состоят из одного и того же числа векторов.
Д о к а з а т е л ь с т в о. Предположим, что существуют две базы
a 1, . . . , a m (4)
b 1 , . . . , b l , (5)
состоящие из разного числа векторов. Пусть, для определенности, l > m. Рассмотрим систему
b 1 , a 1 , . . . , a m . (6)
Так как система (4) является порождающей системой, то и расширенная система (6) обладает этим свойством. Однако система (6) линейно зависима, так как первый ее вектор b 1 может быть линейно выражен через остальные. Применяя к системе (6) теорему 1.1, мы видим, что один из векторов системы, например а k , должен выражаться линейно через предыдущие. Выбрасывая из (6) этот вектор, мы получим новую систему
b , a , . . . , a (7)
где через а , . . . , а обозначены оставшиеся из векторов системы (4). В силу леммы система (7) будет все еще порождающей системой. Рассмотрим систему
b 2 , b 1 , a , . . . ,a . (8)
Эта порождающая система линейно зависима, так как вектор b 2 выражается линейно через остальные ее вектора. Следовательно, по теореме 1.1 один из векторов системы должен выражаться линейно через предыдущие. Этот вектор должен быть одним из а , . . . , а , так как b 1и b 2 линейно независимы. Выбрасывая его из системы получим порождающую систему
b 2 , b 1 , a , . . . , a .
Продолжая рассуждения, через m шагов мы получим порождающую систему
b m , . . . , b 1 .(9)
Это означает, что любой вектор пространства, в частности и вектор b m+1, можно выразить линейно через вектора системы (9), а это противоречит линейной независимости системы (5). Следовательно наше предположение о существовании базисов с различным числом векторов неверно.
С л е д с т в и е 1. Все базисы пространства R состоят из n векторов.
Действительно, согласно предыдущей теореме число векторов любого базиса совпадает с числом векторов единичного базиса е 1 , . . . , е n .
С л е д с т в и е 2. Любая порождающая система пространства R, состоящая из n векторов, является базисом пространства.
Действительно, если порождающая система из n векторов оказалась бы линейно зависимой, то удалив из системы вектора, линейно выражающиеся через остальные, мы получили бы базис пространства, состоящий из менее чем n векторов.
С л е д с т в и е 3. Любая линейно независимая система , состоящая из n векторов, является базисом пространства R .
Действительно, пусть а 1 , . . . , а n такая система. Присоединим к ней произвольный базис b 1 , . . . , b n . Расширенная система a 1 , . . . , a n , b 1, . . . , b n является порождающей. Удалив из системы все вектора, которые линейно выражаются через предыдущие, получим линейно независимую порождающую систему векторов, т. е. базис пространства. Но удалить прийдется n векторов, а именно все вектора b 1 , . . . , b n , т. к. ни один вектор а k не может выражаться линейно через предыдущие. Таким образом система векторов а 1 , . . . , а nявляется базисом пространства.
З а м е ч а н и е. Понятие базиса естественным образом распространяется на подпространства X пространства R . Теорема 1.3, в этом случае, сохраняет свою силу. Число векторов, содержащихся в базисе подпространства X, называется размеренностью подпространства.
Пусть а 1 , . . . , а n - базис пространства. Согласно определению базиса всякий вектор а пространства будет линейно выражаться через вектора базиса. Покажем, что такое выражение возможно только единственным образом. В самом деле, пусть
а =a 1 а 1+ . . . +a n а n
и
а = b 1 а 1 + . . . + b n а n .
Вычитая, мы получим
0 = (a1 - b 1)а 1 + . . . + (a n - b n)а n
Так как базис - линейно независимая система, то a 1 - b 1 = 0, . . . , a n - b n = 0, или a 1 = b 1 , . . . , a n = b n что и требовалось. Числа a 1, . . . , a n называются координатами вектора а относительно базиса а 1 , . . . , а n . Методы нахождения координат будут рассмотрены в главе 3.
ГЛАВА 2
Матрицы
Действия с матрицами.
Произвольная совокупность действительных чисел, расположенная в виде прямоугольной таблицы, содержащей m строк и n столбцов, называется матрицей размерности (m, n). Чтобы записать матрицу, выписывают в надлежащем порядке обозначения ее элементов и получившуюся таблицу заключают в скобки или ограничивают двойными чертами. В дальнейшем матрицы будут обозначаться большими буквами. Таким образом матрицу А размерности (m, n) можно записать в виде
А = , или А = .
где а - элемент, стоящий в строке i и столбце j. Часто вместо такой подробной записи употребляют сокращенную: || a ij || mn .
Заметим, что вектор-строка является матрицей, состоящей из одной строки, а вектор-столбец можно рассматривать, как матрицу, состоящую из одного столбца. Если число строк матрицы равно числу ее столбцов, то матрица называется квадратной, а общее число ее строк и столбцов называется порядком матрицы.
Две матрицы называются равными, если числа строк и столбцов у них соответственно равны и если равны числа, стоящие на соответственных местах этих матриц.
Основными матричными операциями являются умножение матрицы на число, сложение и перемножение двух матриц.
По определению, чтобы умножить матрицу А на число a нужно умножить на a все элементы матрицы А. Например,
7× = ×7 = .
Суммой двух матриц А и В, имеющих соответственно равные числа строк и столбцов, называется матрица, имеющая ту же размерность и элементы, равные суммам соответствующих элементов матриц А и В. Например,
+ = .
Из этих определений непосредственно вытекают соотношения:
1. (ab)А = a(bА) ;
2. A +(B + C) = (A + B) + C;
3. A + B = B + A;
4. (a + b)A = aA + bA;
5. a(A + B) = aA + aB.
Введем обозначение (-1)А = -А. Для краткости вместо А + (-В) обыкновенно пишут А - В.
У м н о ж е н и е м а т р и ц. В отличие от операций сложения и умножения на число операция умножения матрицы на матрицу определяется более сложным образом. Именно пусть заданы матрицы А и В, причем число столбцов первой из них равно числу строк второй. Если А - (m, k)-матрица, В - (k, n)-матрица вида
А = , В = ,
то произведением А на В называется (m, n)-матрица С = ||с ij || m n , элементы которой вычисляются по формуле
cij= ai1 b1j + ai2 b2j + . . . + ain bnj ( i = 1, . . . , m; j = 1, . . . , n).
Например,
= = .
Произведение двух матриц, вообще говоря, зависит от порядка сомножителей. Например,
= ,
= .
Если рассматривать матрицы не квадратные, то может случиться даже, что произведение двух матриц в одном порядке будет иметь смысл, а в обратном - нет.
Вектор можно рассматривать как матрицу, состоящую из одной строки или одного столбца. В результате умножения матрицы на вектор или вектора на матрицу получается вектор. Например,
= = ,
[ 3, 5, 1] × =
= [ 3´1+5´2+1´3, 3´3+5´1+1´4, 3´1+5´2+1´2] == [ 16, 18, 15].
Приведем без доказательства основные свойства умножения матриц.
6. a(АВ) = (aА)В; А(aВ) = (Аa)В; (АВ)a = А(Вa).
7. (А + В)С = АС + ВС.
8. С(А + В) = СА + СВ.
9. А(ВС) = (АВ)С.
Т р а н с п о н р о в а н и е м а т р и ц. Рассмотрим произвольную матрицу
А =
размерности (m, n).
Матрица
А =
размерности (n, m), получающаяся из А заменой строк столбцами, называется транспонированной по отношению к А. В дальнейшем штрихом всегда будет обозначаться переход к транспонированной матрице.
П р и м е р. Пусть
А = .
Тогда
А =
Для любых матриц А и В имеют место следующие правила транспонирования
(aА + bВ) = aА + bВ
(АВ) = В А .
Квадратная матрица А называется симметрической если
А = А,
если же
А = - А,
то матрица называется кососимметрической. Элементы, расположенные симметрично относительно главной диагонали, у симметрической матрицы равны ( аi j = аj i ) , а у кососимметрической противополжны (аi j = - аj j).
П р и м е р. Матрица
А =
является симметрической, матрица
В =
кососимметрической.
Квадратные матрицы.
Выше уже отмечалось, что не любые две матрицы можно сложить или перемножить так как для осуществления таких операций необходимы известные соотношения между числами строк и столбцов. Это неудобство исчезает, если рассматривать только квадратные матрицы некоторого фиксированного порядка n. Любые две такие матрицы можно сложить или перемножить и в результате снова получится квадратная матрица того же порядка.
Особую роль среди квадратных матриц играет матрица Е, все диагональные элементы которой равны 1, а остальные - нулю, называемая единичной матрицей. Таким образом матрица Е имеет вид
Е = .
Непосредственным вычислением можно показать, что для любой квадратной матрицы А имеет место равенство
АЕ = ЕА = А,
выражающее основное свойство матрицы Е. Заметим также, что для любого вектор-столбца а размеренности n ( а - вектор-строка) выполняются равенства
Еа = а,
а Е = а .
Квадратная матрица А называется обратимой, если существует матрица Х, удовлетворяющая условию
АХ = ХА = Е.
Матрица Х, удовлетворяющая этому условию, называется матрицей, обратной к А, или обращением матрицы А. Заметим, что, если обращение матрицы существует, то оно единственно. Действительно, если существует второе обращение Y, то из равенств
X = XE= X(AY) = (XA)Y = EY = Y
следует, что X = Y.
Обращение матрицы А, если оно существует, обозначается А- 1. Таким образом, по определению
АА- 1= А- 1А = Е.
Н а х о ж д е н и е о б р а т н о й м а т р и ц ы. Обозначим через Т (a) матрицу, отличающуюся от единичной только тем, что вместо единицы на i-м месте диагонали, т. е. в строке i и столбце i, стоит число a. Результатом произведения матрицы Тii (a) слева на матрицу А является матрица Тii (a)А, отличающаяся от матрицы А только строкой с номером i . В результирующей матрице элементы строки i будут иметь вид aаij ( j = 1, . . . , n), т. е. элементы строки i матрицы А умножаются на число a. Поэтому умножение матрицы Тii (a) слева на матрицу А будем называть “операцией умножения строки на число”.
П р и м е р. Пусть
А = , Т22(3) = .
Тогда
Т22 (3)А = = .
Обозначим через Тi j (a) (i ¹ j)матрицу отличающуюся от единичной матрицы только одним элементом, стоящим в строке i и столбце j. Вместо нуля, стоящего на этом месте в единичной матрице, в матрице Тi j (a) стоит число a. Матрица Тij (a)А будет отличаться от матрицы А только строкой с номером i . Элементы этой строки будут иметь вид аi k + aаj k ( k = 1, . . . , n ), т. е. к элементам строки i прибавляются элементы строки j, умноженные на число a. Поэтому умножение матрицы Тij (a) слева на матрицу А будем называть “операцией сложения строк”.
П р и м е р. Рассмотрим умножение матрицы А, из предыдущего примера, на матрицу Т23 (2).
Т23 (2)А = = = .
Предположим, что матрицу А можно привести к диагональному виду с помощью некоторой последовательности операций сложения строк и умножения строки на число. Тогда, применяя ту же последовательность операций к единичной матрице, получим обратную матрицу.
Действительно, применение данной последовательности операций к матрице А можно записать в виде произведения
Т (a ) × × × Т (a )А.
Следовательно,
Т (a ) × × × Т (a )А = Е,
используя свойства единичной матрицы, получим
( Т (a ) × × × Т (a )Е )×А = Е.
Последнее равенство означает, что
Т (a ) × × × Т (a )Е = А .
Рассмотрим алгоритм нахождения обратной матрицы на примере.
П р и м е р. Пусть
А = .
Для нахождения обратной матрицы запишем расширенную матрицу, присоединив к матрице А матрицу Е
.
Операции сложения строк и умножения строки на число будем производить над расширенной матрицей, таким образом одни и те же операции будут выполняться над матрицами А и Е. В результате проведенных преобразований первый столбец должен принять вид 1, 0,0. Для этого прибавим ко второй строке первую, а из третей строки вычтем первую, умноженную на два. В результате получим
Во втором столбце на втором месте должна стоять единица. Для этого разделим вторую строку на два (или умножим на 1/2). В результате получим
.
Для обращения в ноль двух оставшихся элементов столбца вычтем из первой строки вторую, умноженную на 2, а к третьей прибавим вторую, умноженную на 3. В результате получим
.
Для того чтобы привести третий столбец к требуемому виду прибавим к первой строке третью, а из второй вычтем третью, умноженную на 2. Окончательно получим
.
Матрицу А мы привели к единичному виду. следовательно обратная матрица равна
А = .
П р о в е р к а.
=
= .
Строки матрицы А можно рассматривать как вектора пространства R и применять к ним понятие линейной независимости.
Максимальное число линейно независимых вектор строк матрицы А называется рангом матрицы А или, подробнее, рангом по строкам.
Квадратную матрицу А размеренности n будем называть невырожденной если ее ранг равен n, т.е. если все строки матрицы линейно независимы.
Т е о р е м а 2.1. Матрица имеет обратную тогда и только тогда, когда она невырожденная.
Д о к а з а т е л ь с т в о. Пусть матрица А имеет обратную. Обозначим через а i-ю строку матрицы А. Тогда условие линейной зависимости
a а + . . . + a а = 0
строк матрицы А может быть переписано в виде
(a , . . . , a )А = 0.
Если матрица А обратима, то, умножая обе части равенства на А , получим (a , . . . , a ) = 0, т. е. a = . . . = a = 0. Следовательно вектор-строки матрицы А линейно независимы.
Обратно, пусть строки матрицы А линейно независимы. Тогда они образуют базис пространства R . Значит с помощью линейных комбинаций можно получить единичные вектора, т. е. существуют числа ai j (i,j=1,…,n) такие, что
a 11 а 1 + . . . + a 1 n а = e 1
a n1 а 1 + . . . + a n n а = e n