Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Курс аналитической геометрии и линейной алгебры

..pdf
Скачиваний:
4
Добавлен:
12.11.2023
Размер:
20.48 Mб
Скачать

§3. Аффинные преобразования

111

Итак, переведем А и А* параллельным переносом р на вектор АА* (если А = Л*, то р — тождественное преобразование). Затем поворо­ том q вокруг точки А* совместим р[В) с В * (возможно, и это преоб­ разование окажется тождественным). Точка q(p(C)) либо совпадает с С*, либо симметрична ей относительно прямой АшВ*. В первом слу­ чае цель уже достигнута, а во втором потребуется осевая симметрия относительно указанной прямой. Теорема доказана.

Следует иметь в виду, что полученное разложение ортогонального преобразования не однозначно. Более того, можно поворот или парал­ лельный перенос разложить в произведение осевых симметрий, про­ изведение параллельного переноса и поворота представить как один поворот и т. д. Мы не будем уточнять, как это сделать, а выясним следующее общее свойство всех таких разложений.

Предложение 5. При любом разложении ортогонального преоб­ разования в произведение любого числа параллельных переносов, пово­ ротов и осевых симметрий четность числа осевых симметрий, вхо­ дящих в разложение, одна и та же.

Для доказательства рассмотрим на плоскости произвольный базис и проследим за изменением его ориентации (направления кратчайше­ го поворота от в! к е2) при осуществляемых преобразованиях. Заме­ тим, что поворот и параллельный перенос не меняют ориентацию ни одного базиса, а осевая симметрия меняет ориентацию любого бази­ са. Поэтому, если данное ортогональное преобразование меняет ори­ ентацию базиса, то в любое его разложение должно входить нечетное число осевых симметрий. Если же ориентация базиса не меняется, то число осевых симметрий, входящих в разложение, может быть только четным.

Определение. Ортогональные преобразования, которые могут быть разложены в произведение параллельного переноса и поворо­ та, называются ортогональными преобразованиями первого рода, а ос­ тальные — ортогональными преобразованиями второго рода.

Ортогональное преобразование в декартовой прямоугольной сис­ теме координат записывается формулами (1) § 2. При верхних зна­ ках коэффициентов у у в этих формулах детерминант, составлен­ ный из коэффициентов, равен +1, а при нижних знаках он равен —1. Отсюда и из формулы (4) следует

Предложение 6. Ортогональное преобразование первого рода за­ писывается в декартовой прямоугольной системе координат формула­ ми (1) §2 с верхними знаками у коэффициентов при у, а ортогональное преобразование второго рода с нижними знаками.

5. Разложение аффинного преобразования. Мы видели, на­ сколько аффинное преобразование может изменить плоскость: ок­ ружность может перейти в эллипс, правильный треугольник — в со­ вершенно произвольный. Казалось бы, никакие углы при этом сохра­ ниться не могут. Однако имеет место следующее.

112

Гл. IV. Преобразования плоскости

Пред л ожение

7. Для каждого аффинного преобразования су­

ществуют две взаимно перпендикулярные прямые, которые переходят во взаимно перпендикулярные прямые.

Для доказательства рассмотрим какую-либо окружность. При дан­ ном аффинном преобразовании она перейдет в эллипс. Каждая ось эллипса — множество середин хорд, параллельных другой оси. При аффинном преобразовании хорда перейдет в хорду, параллельность должна сохраниться, а середина отрезка переходит в середину его об­ раза. Поэтому прообразы осей эллипса — отрезки, обладающие тем же свойством: каждый из них есть множество середин хорд окружности, параллельных другому отрезку. Такие отрезки непременно являют­ ся двумя взаимно перпендикулярными диаметрами окружности. Это то, что нам требовалось: существуют два взаимно перпендикулярных диаметра окружности, которые переходят во взаимно перпендикуляр­ ные отрезки — оси эллипса.

Стоит отметить один особый случай: окружность при аффинном преобразовании может перейти в окружность. В этом случае то же рассуждение проходит с любыми двумя взаимно перпендикулярны­ ми диаметрами окружности-образа. Очевидно, что при этом любые два взаимно перпендикулярных направления остаются перпендику­ лярными.

Определение. Два взаимно перпендикулярных направления называются главными или синугулярными направлениями аффин­ ного преобразования f, если они переходят во взаимно перпендику­ лярные направления.

Тео ре ма 2. Каждое аффинное преобразование раскладывается в произведение ортогонального преобразования и двух сжатий к двум взаимно перпендикулярным прямым.

Доказательство аналогично доказательству теоремы 1. Рассмот­ рим аффинное преобразование f и выберем равнобедренный прямо­ угольный треугольник АВС так, чтобы его катеты АВ и АС были направлены вдоль главных направлений преобразования f. Обозначим через А*, В* и С* образы его вершин. Сделаем такое ортогональное преобразование g, при котором g(.A) = А*, а точки g(В) и g(С) лежат соответственно на лучах А*В* и А*С*. (Этого легко добиться, как и в теореме 1, параллельным переносом, поворотом и осевой симмет­ рией.)

Пусть А = \А*В*|/|A*g(B)|, а/к = |A*C'*|/|>l*g(C,)|. Тогда сжатие р, к прямой А*С* в отношении Л переведет g(В) в p^gJS)) = В* и не сдвинет точек А* и g(C). Аналогично, сжатие р2 к прямой А*В* переведет g(C) в p2(g(C)) = С* и не сдвинет точек прямой А’ В*.

Это означает, что произведение p2pxg переводит точки А, В и С в точки А*, В* и С* так же, как и заданное нам преобразова­ ние f. Согласно предложению 8 § 2 имеем p2pxg = f, как и требовалось.

§3. Аффинные преобразования

113

Упражнения

1.Найдите площадь треугольника, если его стороны лежат на прямых

суравнениями # —у + 1 = О, ж + у —1 = 0 и 2 я + у = 2 в декартовой пря­ моугольной системе координат.

2.Пусть при аффинном преобразовании точки А, В и С перешли в точ­

ки А*, В * и С*. Докажите, что точка пересечения медиан А АВС перейдет

вточку пересечения медиан АА*В*СЖ.

3.Будем говорить, что аффинное преобразование растягивает вектор а

в<* раз, если |а*| = а|а|. Для преобразования, заданного в декартовой пря­ моугольной системе координат формулами

х* = Ах + 7у, у* = + у,

найдите векторы, для которых растяжение: а) максимально; б) минимально.

4.Пусть прямая касается линии второго порядка. Докажите, что при произвольном аффинном преобразовании образ прямой касается образа ли­ нии.

5.Докажите, что вершины ромба, описанного около эллипса, лежат на его осях симметрии.

6.Представьте как произведение двух осевых симметрий:

а} параллельный перенос на вектор а; б) поворот на угол ip вокруг точки О.

7. Представьте сжатие к оси абсцисс декартовой прямоугольной систе­ мы координат как произведение сжатия к другой прямой и параллельного переноса на а(0, а).

8 Д.В. Беклемишев

ГЛАВА V

МАТРИЦЫ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ

§1. Матрицы

1.Определение. Мы будем называть матрицей размеров т х п совокупность тп чисел, расположенных в виде таблицы из т строк

ип столбцов:

а\

«2

..

<

°1

«1

...

а*

п т

„т

..

<

а1

а2

Числа, составляющие матрицу, мы будем называть элементами мат­ рицы. Если число строк в матрице равно числу столбцов, то матрица называется квадратной, а число строк — ее порядком. Остальные мат­ рицы носят название прямоугольных.

Можно дать и такое определение матрицы. Рассмотрим два мно­ жества целых чисел I = {1, 2, ...,т} и J = {1, 2, ...,п}. Через I х J обозначим множество всех пар вида (г, j), где i £ I, a j Е «/• Матрицей называется числовая функция на I х */, т. е. закон, сопоставляющий каждой паре (г, j) некоторое число а*-.

Для читателя, знакомого с программированием, заметим, что мат­ рица — это в точности то же, что и двумерный массив.

Две матрицы называются равными, если они имеют одинаковые размеры, и равны их элементы, стоящие на одинаковых местах.

Рассматривая произвольные матрицы, мы будем обозначать их элементы буквами с двумя индексами. Если оба индекса расположены внизу, то первый из них обозначает номер строки, а второй — номер столбца; если один из индексов расположен сверху, как в написанной выше матрице, то этот индекс обозначает номер строки. Не следует путать верхние индексы с показателями степени.

Матрицу размеров 1 х п, состоящую из одной строки, мы будем называть строкой длины п или просто строкой. Матрицу разме­ ров т х 1 называют столбцом высоты т или просто столбцом. Столб­ цы и строки мы будем обозначать полужирными буквами.

Часто бывает удобно записывать матрицу как столбец из строк

§1. Матрицы

115

или как строку из столбцов. Пусть

®1 <4 4

,

а2 =

1

..♦)

ап —

<

 

а™

 

 

 

 

<

Тогда написанную в начале матрицу можно записать в виде

||

ai а2 ...

ап

||.

 

 

Аналогично, если а 1 — || а\ ... а* ||,

...,

аш

= ||a™ ... а™ ||, то та

же матрица записывается в виде

 

 

 

 

Рассмотрим матрицу А размеров т х п и выберем какие-ни­ будь г номеров строк ti,...,tr и s номеров столбцов при­ чем будем предполагать, что номера выбраны в порядке возраста­ ния: г*1 < г2 < ... < гГ и ji < j 2 < ... < j,. Матрицу А! размеров г х а, составленную из элементов Л, стоящих на пересечении выбранных строк и столбцов, мы назовем подматрицей матрицы Л. Итак,

Если матрица квадратная, то множество тех ее элементов а\, у которых номер строки равен номеру столбца, называется главной диагональю или просто диагональю матрицы.

2. Транспонирование матриц. Рассмотрим матрицу

 

аи

«12

••

Ol„

А =

«21

«22

02»

 

 

 

 

«ml «m2 .. «mn

из т строк и п столбцов. Ей можно сопоставить матрицу В из п строк и га столбцов по следующему правилу. Элементы каждой стро­ ки матрицы Л записываются в том же порядке в столбцы матри­ цы В, причем номер столбца равен номеру строки. Эту матрицу

«И

021

«ml

в = «12

022

«m2

«In «2п • «mn

называют транспонированной по отношению к Л и обозначают Лт . Переход от Л к АТ называют транспонированием.

116

Гл. V. Матрицы и системы линейных уравнений

Видно, что г-я строка В состоит из тех же элементов в том же порядке, что и г-й столбец А . Ясно также, что (АТ)Г = А .

Определение транспонированной матрицы можно записать в виде гпп равенств, связывающих элементы матриц А и В :

Ьц = aji (* = 1. •••> я», j = 1 , п).

3. Некоторые виды матриц. Введем определения некоторых часто употребляемых видов матриц. Все матрицы предполагаются квадратными.

1.Матрица А называется симметричной или симметрической, если АТ = А . Для такой матрицы aij = aji при всех г и j — элемен­ ты, расположенные симметрично относительно главной диагонали, равны.

2.Матрица А называется кососимметричной или антисимметрич­ ной, если АТ = А. Для такой матрицы a*j = aji при всех i и j — элементы, расположенные симметрично относительно главной диаго­ нали, отличаются знаком. Диагональные элементы равны нулю.

3.Матрица А называется верхней треугольной, если ее элементы, расположенные ниже главной диагонали, равны нулю: a,j = 0 при i >

>j. Аналогично определяется нижняя треугольная матрица: = О при i < j.

4.Матрица А называется диагональной, если у нее равны нулю все

недиагональные элементы: = 0 при i ф j.

Другие частные виды матриц будем определять по мере необхо­ димости.

4. Сложение и умножение на число. Пусть А и В — матри­ цы размеров т х п. Мы можем сопоставить им третью матрицу С размеров т х п, элементы которой связаны с элементами и bij матриц А а В равенствами

су = ay + bij

 

j = 1

, n).

(1)

Определение.

Матрица С,

определяемая по А и В форму­

лой (1), называется их суммой и обозначается А + В.

 

Определение. Матрица С, элементы которой

равны произ­

ведениям элементов

матрицы А на число а, называется произве­

дением А на а и обозначается а А. Мы имеем

 

 

су = аау

(г = 1

, т, j = 1 ,

п).

(2)

Из свойств сложения и умножения чисел легко вытекает

 

Предложение

1. Для любых матриц А, В, С и любых чисел а

и 13 выполнены равенства

 

 

 

 

А + В = В + А,

(А + В) + С = А + {В + С),

 

а(А + В) = аА + а В ,

(а + /3)А = а А 4- /ЗА,

 

 

{а0)А =

а(/?А).

 

 

Матрица, все элементы которой равны нулю, называется нулевой матрицей. Если О — нулевая матрица размеров т х п, то для любой

§1. Матрицы

117

матрицы тех же размеров ^ ^ ^

Матрицу (—1)Л называют противоположной матрице А и обознача­ ют —А . Она обладает тем свойством, что

Л + (-Л) = 0 .

Сумма матриц В и —Л называется разностью матриц В и А и обо­ значается В — А.

Мы видим, что сформулированные выше свойства линейных опе­ раций с матрицами совпадают со свойствами линейных операций с

векторами, перечисленными в предложении 1

§ 1 гл. L

Используя линейные операции, мы можем составлять из матриц

одинаковых размеров А \,...уАк и чисел

, а* выражения вида

<*iAy + ... + akAh.

 

Такие выражения называются линейными комбинациями матриц. Ес­ ли какая-то матрица представлена как линейная комбинация других матриц, то говорят, что она по ним разложена.

Пример 1. Пусть р ь ..., р* — столбцы одинаковой высоты п. Тог­ да столбец q той же высоты по ним разложен, если при некоторых коэффициентах а \}...,ак

q = aiPi + .~ + <*fcPfc, или, в более подробной записи,

IIql I

IIр*I

I

;

= OL1

;

+ ... +

 

II яп

II

II р?

II

II Рк

В силу определения линейных операций это матричное равенство рав­ носильно п числовым равенствам

91 = <*ipi + +

qn = aip'l + ... + akPk-

5. Линейная зависимость матриц. Какова бы ни была сис­ тема матриц фиксированных размеров т х п, нулевая матрица тех же размеров раскладывается по этим матрицам в линейную комби­ нацию с нулевыми коэффициентами. Такую линейную комбинацию называют тривиальной. Как и для векторов, введем следующее

Определение. Система матриц A i,...,A k линейно независима, если нулевая матрица раскладывается по ней однозначно, т. е. из

а\А \ + ... + akAk = О (3)

следует = ... = ак = 0. В противном случае, т. е. если существуют к чисел a i , ..., аку одновременно не равных нулю и таких, что выполнено равенство (3), система матриц называется линейно зависимой.

118 Гл. V. Матрицы и системы линейных уравнений

Пример 2. Столбцы

 

1

0

0

 

ei =

0

1

:

(4)

: > е2 =

, ..., ©п —

0

 

 

 

 

 

0

0

1

 

(в столбце с,- на г-м месте стоит 1, а остальные элементы равны нулю) являются линейно независимыми. Действительно, равенст­ во aiei + ... + arnen = о можно записать подробнее так:

1

0

 

0

<*1

 

0

0

1

+ ... + схп

:

а 2

IZ

0

ОГ1 : + «2

:

0

 

:

6

0

 

1

Otn

 

0

Отсюда видно, что

= а 2 = ... = а п = 0.

 

 

 

Это равенство показывает также, что произвольный столбец вы­ соты п может быть разложен по столбцам ei, ...,еЛ. Действительно, в качестве коэффициентов линейной комбинации нужно взять элемен­ ты раскладываемого столбца.

Определение. Квадратная матрица порядка п, состоящая из

столбцов (4):

 

1

0

...

0

 

Е =

0

1

...

0

 

 

 

 

 

 

 

0

0

...

1

называется единичной матрицей порядка п или просто единичной матрицей, если порядок известен.

Строки единичной матрицы отличаются от ее столбцов только формой записи. Итак, мы можем сформулировать

Предложение 2. Столбцы (строки) единичной матрицы линей­ но независимы и обладают тем свойством, что каждый столбец (строка) с тем же числом элементов раскладывается по ним.

Укажем несколько свойств линейно зависимых и линейно незави­ симых систем матриц. Эти свойства были доказаны в § 1 гл. I для векторов, и доказательства совпадали с приводимыми ниже.

Предложение 2. Система из k > 1 матриц линейно зависима тогда и только тогда, когда хотя бы одна из матриц есть линейная комбинация остальных.

В самом деле, пусть система линейно зависима. По определению выполнено равенство вида (3), где хотя бы один коэффициент отличен от нуля. Допустим для определенности, что это пс\. Тогда мы можем представить первую матрицу как линейную комбинацию

*2 л ак л

§1. Матрицы

119

Обратно, если одна из матриц разложена по остальным, то это разло­ жение преобразуется к виду (3), где один из коэффициентов равен 1.

Предложение

4. Если некоторые из матриц Л ь..., А* состав­

ляют сами по себе

линейно зависимую систему, то вся систе­

ма A i, ..., Ak линейно зависима.

Действительно, пусть существует нетривиальная линейная комби­ нация некоторых из матриц системы, равная нулевой матрице. Если мы добавим к ней остальные матрицы с нулевыми коэффициента­ ми, то получится равная нулевой матрице нетривиальная линейная комбинация всех матриц.

В частности, если в систему матриц входит нулевая матрица, то система линейно зависима.

Предложение 5. Любые матрицы, входящие в линейно незави­ симую систему матриц, сами по себе линейно независимы.

В самом деле, в противном случае мы пришли бы к противоречию на основании предыдущего предложения.

Предложение 6. Если матрица В разложена по линейно неза­ висимой системе матриц Ль...,А*, то коэффициенты разложения определены однозначно.

Действительно, пусть мы имеем два разложения

В = ot\Ai -h ... + otkAk и В = f3\Ai + .♦. + /?*А*. Вычитая одно разложение из другого, мы получаем

О — [а 1 - /?i)Ai + ••• + {<*к -

Матрицы Ai,...,A* линейно независимы, значит, а,- —/?,- = 0 для всех г = Итак, коэффициенты обоих разложений совпадают.

Упражнения

 

1

2

3

1.

Дана матрица 4

5

6 .

 

7

8

9

а)

Выпишите подматрицу, расположенную в строках 1 и 3 и столб­

цах 1 и 3.

б) Сколько квадратных подматриц второго порядка имеет данная

матрица?

 

 

в) Сколько всего подматриц она имеет?

3

 

2

2. Даны матрицы А = ^ г

В = 5

6

 

8

9

Можно ли сложить матрицы:

а) А и В; б) А Т и В ; в) А и В т; г) Ат и В Т1

3. Даны матрицы А =

1

1

, В =

2

1

С =

4

1

2

-1

1

1

 

 

 

120

Гл. V. Матрицы и системы линейных уравнений

Вычислите матрицу + ЗБ —С.

 

 

 

4.

С какими коэффициентами раскладывается матрица

по матрицам А и В и С из предыдущей задачи?

5.

Можно ли разложить матрицу

1

3

по матрицам:

7

9

а) А и В из задачи 3,

 

 

 

 

б) А и В и С из задачи 3?

 

 

 

6.

Являются ли линейно независимыми строки

а = || 1 2 3 4 ||, b = || 2 3 4 5 ||, с = ||3 4 5 б||?

7. Убедитесь, что классы матриц, определенные в п. 3, замкнуты отно­ сительно операций сложения и умножения на число.

 

 

§ 2. Умножение матриц

1.

Символ

Прежде чем двигаться дальше, остановимся на

обозначениях. В математике часто приходится рассматривать суммы большого числа слагаемых, имеющих сходный вид и отличающихся

только индексами. Для таких сумм принято следующее обозначение.

 

п

Символ

»после которого стоит некоторое выражение, содержащее

*=i

индекс fc, обозначает сумму таких выражений для всех значений ин­ декса от 1 до п, например,

п

»

+ ••• +<*»/?«•

У ]ак = a i + а2 + ... + а„,

'У'акРк -

к=1

к=1

 

Индекс к называется индексом суммирования. Разумеется, в качестве индекса суммирования может быть употреблена любая другая буква. На указанный символ и следующее за ним выражение можно смот­ реть как на скобку, содержащую п однотипных слагаемых.

Следующие формулы являются другой записью вынесения мно­ жителя за скобку и группировки слагаемых:

k=l

k=1

 

( 1 )

 

 

У (р * + д * )

= ! > +

! > .

(2)

k=l

k=1

fc=1

 

Если имеется выражение, зависящее от двух индексов, принима­ ющих значения 1 , ...,га и 1 мы можем просуммировать снача­