Главная страница

Линейная_алгебра_I. Линейная алгебра часть I


Скачать 237.72 Kb.
НазваниеЛинейная алгебра часть I
Дата21.07.2021
Размер237.72 Kb.
Формат файлаpdf
Имя файлаЛинейная_алгебра_I.pdf
ТипДокументы
#225021

Подборка по базе: ИМ ЧАСТЬ 1.pdf, 6.1. Как писать продающие тексты (Вводная часть).docx, англ часть 2.docx, Линейная балансовая модель.Высшая математика часть1.docx, Линейная алгебра.docx, экономическая часть+.docx, Лекции по ДИСМАТ _ Часть 1-теори множеств.doc, РЕФЕРАТ. ЭТНОПЕДАГОГИКА КАК СОСТАВНАЯ ЧАСТЬ КУЛЬТУРЫ.docx, 2 часть.docx, Уголовное право. Часть 2.doc


Линейная алгебра - часть I
1
Линейное пространство
1.1. Давайте начнем изучение основ линейной алгебры с определения линейного (или вектор- ного) пространства.
1.1.1. Под линейным (векторным) пространством V мы будем понимать некоторое множество элементов, называемых векторами, с введенными на этом множестве операциями сложения векторов и умножения этих векторов на скаляры — в простейшем случае, вещественные или комплексные числа. Операция сложения векторов должна удовлетворять следующим четырем аксиомам:
1. коммутативность сложения: v + w = w + v;
2. ассоциативность сложения: (u + v) + w = u + (v + w);
3. существование нейтрального элемента 0 ∈ V , такого, что u + 0 = 0 + u = u для любого вектора u;
4. существование для любого u ∈ V обратного элемента u
−1
, такого, что u+u
−1
= u
−1
+u = 0.
Операция умножения вектора на скаляр (например, на вещественное число) должна подчи- няться таким четырем аксиомам:
1. умножение любого вектора v на 1 ∈ R должно давать тот же самый вектор v;
2. ассоциативность операции умножения: α(β v) = (α · β) v;
3. дистрибутивность относительно сложения векторов: α(v + w) = α v + α w;
4. дистрибутивность относительно сложения скаляров: (α + β)v = αv + βv.
1.1.2. В качестве простейшего примера линейного пространства можно рассмотреть хорошо нам известное со школы множество векторов (то есть направленных отрезков) на плоскости,
исходящих из начала координат (рис.1,2). Сложение двух векторов v + w осуществляется по правилу параллелограмма (рис.1). Умножению вектора v на вещественное число α отвечает вектор α v, длина которого увеличена в α раз (рис.2). С физической точки зрения подобные векторы мы можем трактовать как силы, приложенные к расположенному в начале координат телу.
Обобщая этот пример, мы можем в качестве векторов выбрать наборы, состоящие из n веще- ственных чисел вида v = (ξ
1
, . . . , ξ
n
), которые мы можем трактовать как направленные отрезки в n-мерном пространстве. Операция сложения таких векторов осуществляется покомпонентно,
а операции умножения на скаляр α отвечает умножение каждой из компонент v i
вектора v на это число:
v + w = (ξ
1
, . . . , ξ
n
) + (η
1
, . . . , η
n
) = (ξ
1
+ η
1
, . . . , ξ
n
+ η
n
),
α · v = (α ξ
1
, . . . , α ξ
n
).
x
y


w +
v

w

v
Рис. 1

v
α
v x
y
Рис. 2
В анализе в качестве векторов можно рассматривать вещественные непрерывные функции.
Такие функции мы можем складывать между собой, а также умножать их на вещественные числа. Следовательно, по отношению к этим двум операциям множество непрерывных на R
функций образует линейное пространство.
Еще один важный пример — это множество всех многочленов P
n
(x) степени не выше n с обыч- ными операциями сложения и умножения на число, также образующее линейное пространство таких многочленов. Заметим сразу, что множество многочленов степени, равной n, линейного пространства не образует (см. упражнение).
1.2. Основным понятием всей линейной алгебры является понятие линейной зависимости (неза- висимости) векторов.
1.2.1. Рассмотрим в линейном пространстве V набор, состоящий из k векторов v
1
, . . . , v k
Определение 1.1. Говорят, что векторы v
1
, . . . , v k
являются линейно зависимыми, если най- дутся числа α
1
, . . . , α
k
, такие, что хотя бы одно из этих чисел отлично от нуля, а сумма
α
1
v
1
+ . . . + α
k v
k
= 0.
В этом случае также говорят, что существует равная нулю линейная комбинация этих векторов с коэффициентами, хотя бы один из которых отличен от нуля.
Определение 1.2. Набор векторов v
1
, . . . , v k
называется линейно независимым, если линейная
комбинация
α
1
v
1
+ . . . + α
k v
k
= 0
тогда и только тогда, когда все коэффициенты α
i
= 0.
1.2.2. Предположим, что векторы v
1
, . . . , v k
линейно зависимы, то есть существуют такие α
j
,
что
α
1
v
1
+ . . . + α
k v
k
= 0,
и при этом существует хотя бы одно i ∈ [k] = {1, . . . , k}, такое, что α
i
6= 0. Перенесем тогда все векторы, отличные от v i
, в правую часть и поделим полученное выражение на α
i
. В результате получим, что v
i
= λ
1
v
1
+ . . . + λ
i−1
v i−1
+ λ
i+1
v i+1
+ . . . + λ
k v
k
,
λ
j
= −α
j

i
Иными словами, это означает, что мы в этом случае обязательно сможем выразить один из векторов через оставшиеся векторы нашего набора векторов.
1.2.3. Рассмотрим теперь в качестве примера векторы на плоскости. В данном случае любые два ненулевых неколлинеарных между собой вектора линейно независимы, а вот уже любые три оказываются линейно зависимыми — один из них мы всегда можем выразить через линейную комбинацию двух других.
Данный пример подводит нас к следующему важному определению.
Определение 1.3. Предположим, что в линейном пространстве V существует n линейно неза- висимых векторов, а любой набор из большего количества векторов оказывается линейно зави- симым. Тогда линейное пространство V называется конечномерным (или n-мерным) линейным пространством, а число n — размерностью этого пространства. В противном случае линейное пространство V называется бесконечномерным.
Характерным примером бесконечномерного линейного пространства является пространство непрерывных на R функций. Такие пространства более подробно изучаются в других курсах,
например, в курсе функционального анализа. Мы в данном курсе будем в основном заниматься конечномерными пространствами.
1.2.4. С понятием размерности тесно связано понятие базиса линейного пространства.
Определение 1.4. Базисом линейного n-мерного пространства V называется любой набор,
состоящий из n линейно независимых векторов.
В простейшем примере векторов на плоскости базис образуют любые два вектора, не лежащих на одной и той же прямой. Для векторов в трехмерном пространстве базисом являются любые три вектора, не лежащие в одной плоскости.
1.2.5. Основной результат, связанный с понятием базиса, можно сформулировать с помощью следующей теоремы.
Теорема 1.5. Пусть векторы v
1
, . . . , v n
образуют базис в n-мерном линейном пространстве
V . Тогда любой вектор v этого пространства можно единственным образом представить в виде линейной комбинации базисных векторов:
v = ξ
1
v
1
+ ξ
2
v
2
+ . . . + ξ
n v
n
Коэффициенты ξ
i в этом выражении называются координатами вектора v в базисе v
1
, . . . , v n
,
а само такое представление вектора v называется разложением этого вектора по базису.

Доказательство. Добавим к набору v
1
, . . . , v n
базисных векторов вектор v. По определению n- мерного пространства, любые (n + 1) векторов в таком пространстве являются линейно зави- симыми, то есть существуют вещественные числа α
i
, такие, что
α
0
v + α
1
v
1
+ . . . + α
n v
n
= 0,
и при этом хотя бы одно из α
i отлично от нуля. Заметим также, что коэффициент α
0
гаранти- рованно отличен от нуля — в противном случае мы из последнего равенства получили бы, что векторы v
1
, . . . , v n
линейно зависимы. Тогда, перенося α
0
v в правую часть и деля полученное равенство на α
0 6= 0, мы получим, что v = −
α
1
α
0
v
1
− . . . −
α
n
α
0
v n
Обозначив через ξ
i
= −α
i

0
, мы получим разложение вектора v по базису v
1
, . . . , v n
Осталось доказать единственность данного разложения. Для этого предположим, что суще- ствует еще одно разложение v по базису вида v = η
1
v
1
+ . . . + η
n v
n
Вычитая из первого разложения второе, мы получим, что
0 = (ξ
1
− η
1
)v
1
+ . . . + (ξ
n
− η
n
)v n
Так как векторы v
1
, . . . , v n
линейно независимы, то из последнего выражения следуют равенства
ξ
i
= η
i
1.3. Последнее, о чем нам обязательно нужно сказать в этом параграфе — это о понятии под- пространства линейного пространства.
1.3.1. Начнем с примера. Рассмотрим в трехмерном пространстве векторов R
3
некоторый базис,
состоящий из тройки векторов v
1
, v
2
, v
3
. Выберем какие-то два из них, например, векторы v
1
и v
2
, и рассмотрим всевозможные линейные комбинации этих векторов, то есть векторы вида
α
1
v
1
+ α
2
v
2
С геометрической точки зрения эти все эти векторы лежат в плоскости, проходящей через начало координат и содержащие два базисных вектора v
1
и v
2
. Если мы отвлечемся от исходного трехмерного пространства R
3
, то мы получим некоторое двумерное линейное пространство —
пространство векторов на этой плоскости. Если же мы вспомним о том, что данная плоскость лежит в трехмерном пространстве, то по отношению к этому пространству наша плоскость, как говорят, является двумерным подпространством исходного трехмерного пространства векторов.
1.3.2. Теперь мы можем дать общее определение подпространства линейного пространства.
Определение 1.6. Подпространством V
0
линейного пространства V называется подмножество исходного множества векторов, которое образует линейное пространство относительно тех же самых операций сложения векторов и умножения векторов на числа, что и в исходном линейном пространстве V . Иными словами, это такое подмножество множества векторов, которое явля- ется замкнутым относительно операций сложения векторов и умножения на числа, введенных в исходном линейном пространстве: для любых v
0
∈ V
0
и w
0
∈ V
0
векторы v
0
+ w
0
и
α v
0
также принадлежат тому же подмножеству V
0
векторов.

1.3.3. Возьмем в n-мерном пространстве произвольный конечный набор векторов v
1
, . . . , v k
и рассмотрим всевозможные их линейные комбинации
α
1
v
1
+ . . . + α
k v
k
Ясно, что все такие линейные комбинации образуют некоторое подпространство исходного ли- нейного пространства. Оно называется подпространством, порожденным набором векторов v
1
, . . . , v k
В случае, если векторы v
1
, . . . , v k
являются линейно независимыми, данное подпространство является k-мерным подпространством, а сами эти векторы образуют в нем базис. При этом часто говорят, что это подпространство представляет собой линейную оболочку, натянутую на векторы v
1
, . . . , v k
2
Существование и единственность решений систем линей- ных алгебраических уравнений
2.1. Покажем теперь, как введенные ранее понятия помогают решать вопросы, связанные с существованием и единственностью решений систем линейных алгебраических уравнений.
2.1.1. Рассмотрим вначале наиболее простой и в то же время наиболее важный с практической точки зрения вид систем линейных алгебраических уравнений, а именно, системы, в которых количество n неизвестных совпадает с количеством уравнений:









a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
a n1
x
1
+ a n2
x
2
+ . . . + a nn x
n
= b n
(1)
Здесь x
1
, . . . , x n
— неизвестные, которые мы должны из системы (1) определить, a ij
— извест- ные коэффициенты этой системы, b
1
, . . . , b n
— известные числа, стоящие в правой части (1)
(свободные члены системы).
Решением системы линейных алгебраических уравнений (1) называется набор чисел c
1
, . . . , c n
,
подстановка которых вместо переменных x i
обращает все n уравнений (1) в тождества. Нам хочется понять, при каких условиях решение такой системы существует, а если существует, то является ли это решение единственным.
2.1.2. Прежде чем разбираться с общим случаем, давайте посмотрим на достаточно простой пример такого рода систем:
(
2x
1
+ 3x
2
= 6 4x
1
+ 9x
2
= 15
(2)
Несложно убедиться, что такая система уравнений имеет решение вида x
1
= 3/2, x
2
= 1, причем это решение является единственным.
Для того, чтобы понять, почему это так, давайте перепишем систему (2) в следующем виде:
x
1
2 4

+ x
2
3 9

=
 6 15

⇐⇒
x
1
a
1
+ x
2
a
2
= b,
a
1
:=
2 4

, a
2
:=
3 9

, b :=
 6 15

. (3)

В такой форме записи мы свободные члены b
1
= 6 и b
2
= 15, стоящие в правой части системы (2),
объединили в один вектор-столбец b. Аналогичным образом мы поступили с коэффициентами,
стоящими при переменных x
1
и x
2
. В результате мы получили три столбца чисел, которые можно трактовать как некоторые элементы двумерного линейного пространства R
2
векторов на плоскости. Осталось понять, чем удобна такая форма записи системы (2).
С точки зрения теории, изложенной в предыдущем параграфе, на запись вида x
1
a
1
+ x
2
a
2
= b мы можем смотреть как на попытку представить вектор b в виде линейной комбинации векто- ров a
1
и a
2
. При этом переменные x
1
и x
2
системы (2) играют роль коэффициентов в разложении вектора b по столбцам a
1
и a
2
коэффициентов системы линейных алгебраических уравнений
(2). Такая точка зрения на предмет позволяет нам переформулировать понятие решения си- стемы линейных алгебраических уравнений. Именно, решить систему (2) — это означает найти коэффициенты x
1
и x
2
в разложении вектора b правых частей по столбцам a
1
и a
2
коэффици- ентов этой системы.
x y
a
1
a
2
b
Рис. 3
На рис.3 представлена геометрическая интерпретация данной задачи. На этом рисунке изобра- жены три вектора — вектор b правых частей, а также векторы a
1
и a
2
коэффициентов системы.
Нам нужно представить вектор b в виде суммы векторов a
1
и a
2
с некоторыми коэффициента- ми x
1
и x
2
. Из рисунка видно, что сделать это достаточно легко — для этого нужно удлинить вектор a
1
в полтора раза. При этом, согласно правилу сложения векторов, вектор b как раз и будет представлять собой сумму векторов a
2
и 1, 5 · a
1
Используя данную выше интерпретацию, легко ответить на вопрос, почему же наша система
(2) имеет единственное решение. Действительно, векторы a
1
и a
2
коэффициентов системы (2)
неколлинеарны. Но мы с вами знаем, что любые два неколлинеарных вектора на плоскости об- разуют в линейном пространстве R
2
базис. По этому базису мы единственным образом можем разложить любой вектор пространства R
2
, в том числе и вектор b правых частей системы ли- нейных уравнений (2). А это и означает, что решение x
1
= 3/2, x
2
= 1 системы (2) единственно.
2.1.3. Аналогичные рассуждения легко переносятся на общий случай системы (1). А именно,
представим эту систему в следующем виде:
x
1




a
11
a
21
a n1




+ x
2




a
12
a
22
a n2




+ . . . + x n




a
1n a
2n a
nn




=




b
1
b
2
b n




⇐⇒
x
1
a
1
+ x
2
a
2
+ . . . + x n
a n
= b.

Как и в частном случае, решения такой системы мы можем трактовать как разложение век- тора b n-мерного линейного пространства R
n по n векторам a
1
, a
2
, . . . , a n
. В случае, если эти векторы линейно независимы, они, как и любые n линейно независимых векторов, образуют в пространстве R
n базис. Но это означает, что мы любой элемент пространства R
n
, в частности,
вектор b, можем разложить по этому базису, причем коэффициенты x
1
, x
2
, . . . , x n
в разложении вектора b по базису определяются единственным образом.
С точки зрения решения системы линейных алгебраических уравнений (1) последнее утвер- ждение можно переформулировать следующим образом. В случае, если векторы a
1
, a
2
, . . . , a n
столбцов коэффициентов этой системы линейно независимы, то решение системы (1) существу- ет и единственно при любом векторе b правых частей.
2.1.4. Давайте теперь разберемся со случаем, когда столбцы a
1
, a
2
, . . . , a n
коэффициентов си- стемы (1) оказываются линейно зависимыми. Начнем, как всегда, с примера.
Именно, рассмотрим следующую систему из двух линейных алгебраических уравнений:
(
2x
1
+ 3x
2
= b
1 4x
1
+ 6x
2
= b
2
⇐⇒
x
1
2 4

+ x
2
3 6

=
b
1
b
2

(4)
У такой системы векторы a
1
и a
2
коэффициентов линейно зависимы. С геометрической точки зрения такая линейная зависимость означает, что эти два вектора лежат на одной прямой, то есть принадлежат некоторому линейному одномерному подпространству исходного двумерного пространства R
2
векторов на плоскости.
a
1
a
2
b x
y
2 4
6 2
4 6
8 10
Рис. 4
Как следствие, у нас в данном примере имеются два частных случая. В первом случае вектор b правых частей этому линейному подпространству не принадлежит (рис. 4). Но тогда этот вектор мы по векторам a
1
и a
2
разложить не сможем. С точки зрения анализа системы (4) это означает, что эта система в данном случае решений не имеет.
Второй частный случай — это случай, когда вектор b правых частей принадлежит одномерному подпространству, натянутому на векторы a
1
и a
2
(рис. 5). В этом случае мы его можем по этим двум векторам разложить. Однако в данном случае такое разложение единственным уже не будет.
Действительно, любой ненулевой вектор, например, вектор a
1
, образует в одномерном подпро- странстве базис. Как следствие, вектор b − x
2
a
2
мы можем однозначно разложить по этому вектору при любом фиксированном значении параметра x
2
. Но этот параметр мы можем вы-
a
1
a
2
b x
y
2 4
6 2
4
Рис. 5
брать бесконечным числом способов. Следовательно, в данном случае мы получаем бесконечное количество решений системы (4).
2.1.5. Обобщим полученные результаты на случай произвольной системы вида (1). Предпо- ложим, что n столбцов коэффициентов данной системы оказались линейно зависимыми. Это означает, что они принадлежат какому-то линейному подпространству размерности меньшей,
чем размерность n исходного пространства векторов. Тогда в случае, когда вектор b правых частей этому подпространству не принадлежит, решений система (1) не имеет. В случае же,
когда вектор b принадлежит подпространству, натянутому на векторы a
1
, a
2
, . . . , a n
, система
(1) имеет бесконечное количество решений.
2.2. Перейдем теперь анализу систем вида









a
11
x
1
+ a
12
x
2
+ . . . + a
1m x
m
= b
1
a
21
x
1
+ a
22
x
2
+ . . . + a
2m x
m
= b
2
a n1
x
1
+ a n2
x
2
+ . . . + a nm x
m
= b n
(5)
в которых количество m переменных не равно числу n уравнений.
2.2.1. Начнем с систем уравнений, в которых количество уравнений n меньше количества m переменных, то есть к так называемым недоопределенным системам. Рассмотрим следующий простейший пример такого рода системы:
(
2x
1
+ 3x
2
+ 4x
3
= 6 4x
1
+ 9x
2
+ 7x
3
= 15
⇐⇒
x
1
2 4

+ x
2
3 9

+ x
3
4 7

=
 6 15

(6)
Из векторного представления этой системы x
1
a
1
+ x
2
a
2
+ x
3
a
3
= b,
a
1
:=
2 4

, a
2
:=
3 9

, a
3
:=
4 7

, b :=
 6 15

мы можем сразу заключить, что у системы (6) имеется бесконечное количество решений. Дей- ствительно, любая пара векторов a
1
, a
2
, a
3
столбцов коэффициентов этой системы является линейно независимой, то есть образует базис линейного пространства R
2
. Перенося, в частно- сти, вектор x
3
a
3
в правую часть этого уравнения, мы при любом фиксированном значении x
3
разложим вектор b − x
2
a
3
по базису, состоящему из двух линейно независимых векторов a
1
и a
2
. Но так как x
3
мы можем выбирать бесконечным количеством способов, то и решений этой системы мы имеем бесконечно много. Аналогичная ситуация у нас будет и в том случае, когда из трех векторов a
1
, a
2
, a
3
хотя бы два будут являться линейно независимыми.
2.2.2. Теперь рассмотрим чуть более экзотический случай, а именно, систему
(
2x
1
+ 3x
2
+ 4x
3
= b
1 4x
1
+ 6x
2
+ 8x
3
= b
2
⇐⇒
x
1
2 4

+ x
2
3 6

+ x
3
4 8

=
b
1
b
2

,
(7)
в которой все три вектора a
1
, a
2
, a
3
принадлежат одному и тому же одномерному линейному подпространству, то есть лежат на одной и той же прямой, проходящей через начало координат.
Если при этом вектор b правых частей не принадлежит данному подпространству, то решений системы (7) не существует. В противном случае у этой системы имеется бесконечное количество решений.
2.2.3. Теперь перейдем к системам, в которых количество n уравнений больше количества m неизвестных — так называемым переопределенным системам.
Начнем, как обычно, с примеров. В качестве первого примера рассмотрим систему уравнений вида





2x
1
+ 3x
2
= b
1 4x
1
+ 9x
2
= b
2 6x
1
+ 27x
3
= b
3
⇐⇒
x
1


2 4
6


+ x
2


3 9
12


=


b
1
b
2
b
3


(8)
Как видно из векторного представления данной системы, мы пытаемся трехмерный вектор b правых частей разложить по двум векторам a
1
и a
2
. В данном примере два этих вектора ли- нейно независимы. Тогда, если вектор b принадлежит подпространству, натянутому на эти два вектора, то у системы существует единственное решение. Действительно, в этом случае векторы a
1
и a
2
образуют в этом подпространстве базис, и мы любой вектор, принадлежащий этому под- пространству, можем по нему разложить. Если же вектор b не принадлежит подпространству,
натянутому на векторы a
1
и a
2
, то решений у системы (8) не существует.
Теперь рассмотрим систему вида





2x
1
+ 3x
2
= b
1 4x
1
+ 6x
2
= b
2 6x
1
+ 9x
3
= b
3
⇐⇒
x
1


2 4
6


+ x
2


3 6
9


=


b
1
b
2
b
3


,
(9)
в которой векторы a
1
и a
2
коэффициентов системы линейно зависимы, то есть лежат на одной и той же прямой. Понятно, что в случае, когда вектор b правых частей на этой прямой не лежит, решений у системы (9) не существует. Если же он лежит на такой прямой, то решения системы (9) существуют, однако их бесконечно много.
2.2.4. Подведем теперь некоторые итоги проведенным выше рассуждениям. Вернемся к общему виду системы (5) и перепишем ее в векторном виде:
x
1




a
11
a
21
a n1




+ x
2




a
12
a
22
a n2




+ . . . + x m




a
1m a
2m a
nm




=




b
1
b
2
b n




⇐⇒
x
1
a
1
+ x
2
a
2
+ . . . + x m
a m
= b.

Заметим, что и векторы a
1
, a
2
, . . . , a m
коэффициентов системы (5), и вектор b правых частей принадлежат линейному пространству R
n n-мерных векторов.
Рассмотрим линейное подпространство, натянутое на векторы a
1
, a
2
, . . . , a m
. Если вектор b этому подпространству не принадлежит, то решения у системы (5) отсутствуют.
Предположим теперь, что b принадлежит рассматриваемому нами линейному подпростран- ству. В этом случае решения у системы (5) точно имеются. Однако эта система будет иметь единственное решение лишь в том случае, когда размерность линейного подпространства, натя- нутого на векторы a
1
, a
2
, . . . , a m
, совпадает с количеством m этих векторов. В этом случае эти векторы образуют базис данного подпространства, и любой вектор b мы можем однозначно по этому базису разложить. В противном случае система будет иметь бесконечное число решений.
3
Решение систем линейных алгебраических уравнений
3.1. Итак, в предыдущем параграфе мы разобрались с вопросами существования и единствен- ности решений систем линейных алгебраических уравнений. Осталось понять, как же нам,
собственно, эти системы решать. Мы начнем с описания самого известного и наиболее важного с практической точки зрения метода решения таких систем — с метода Гаусса.
3.1.1. Как обычно, рассмотрим вначале достаточно простой пример системы линейных алгеб- раических уравнений вида
(
4x
1
+ 5x
2
= 6
x
1
+ 2x
2
= 3
Основная сложность построения решения такого рода систем состоит в том, что у нас в каждом уравнении содержится несколько (в данном случае — две) неизвестных. Достаточно очевидный способ борьбы с этой неприятностью — исключить одну из этих двух переменных, например,
переменную x
1
, из одного из уравнений, например, из второго, и подставить затем полученное для x
1
выражение в первое уравнение:
x
1
= 3 − 2x
2
=⇒
4(3 − 2x
2
) + 5x
2
= 6.
В результате мы получаем единственное уравнение относительно единственной же неизвестной x
2
, которое уже легко решается:
−3x
2
= −6
=⇒
x
2
= 2 =⇒
x
1
= −1.
3.1.2. Метод Гаусса слегка модифицирует описанную идею так, чтобы с ее помощью было удоб- но решать системы более сложного вида. Именно, известно, что мы можем домножать любое из уравнений системы на вещественное число, а также складывать любое из уравнений с лю- бым другим уравнением этой системы — от этих манипуляций решение системы не изменится.
Воспользуемся данными возможностями для исключения переменной x
1
из второго уравнения.
Для этого домножим вначале второе уравнение исходной системы на четверку:
(
4x
1
+ 5x
2
= 6 4x
1
+ 8x
2
= 12

В такой системе при x
1
и в первом, и во втором уравнении стоят одинаковые коэффициенты.
Если мы теперь из второго уравнения вычтем первое, то мы, тем самым, исключим из второго уравнения переменную x
1
:
(
4x
1
+ 5x
2
= 6 3x
2
= 6
Теперь мы легко определим из второго уравнения переменную x
2
, а затем, подставив найденное значение x
2
в первое уравнение, найдем нужное нам значение переменной x
1 3.1.3. Покажем теперь, как работает данный подход на несколько более сложном примере системы трех уравнений вида





2x
1
+ x
2
+ x
3
=
5 4x
1
− 6x
2
= −2
−2x
1
+ 7x
2
+ 2x
3
=
9
Наша задача по-прежнему состоит в том, чтобы исключить все переменные, кроме одной, хотя бы из одного из уравнений системы. Кроме того, нам бы хотелось сделать это так, чтобы и остальные переменные при этом находились затем предельно просто. Собственно, метод Гаусса и позволяет нам эти пожелания реализовать.
На первом шаге метод Гаусса исключает переменную x
1
из всех уравнений, кроме первого.
Будем делать это так же, как и ранее, а именно, домножая эти уравнения на числа и вычитая одно из другого. Именно, для исключения x
1
из второго уравнения домножим первое уравнение на 2 и вычтем получившееся уравнение из второго. В результате получим систему вида





2x
1
+ x
2
+ x
3
=
5
−8x
2
− 2x
3
= −12
−2x
1
+ 7x
2
+ 2x
3
=
9
Теперь исключим x
1
из третьего уравнения. Для этого просто прибавим к третьему уравнению первое:





2x
1
+ x
2
+ x
3
=
5
−8x
2
− 2x
3
= −12 8x
2
+ 3x
3
=
14
На втором шаге метод Гаусса работает с подсистемой, состоящей из второго и последующих уравнений. И состоит этот шаг в исключении переменной x
2
из третьего и последующих урав- нений. В данном примере нам достаточно исключить ее из третьего уравнения, прибавив к третьему уравнению второе. В результате получим систему





2x
1
+ x
2
+ x
3
=
5
−8x
2
− 2x
3
= −12
x
3
=
2
последнее уравнение в которой содержит единственную переменную — переменную x
3
Заметим, что в результате описанного выше процесса (который называется прямым ходом ме- тода Гаусса) мы, как говорят, привели систему к ступенчатому (или треугольному) виду. Все,
что нам теперь осталось — это последовательно, идя снизу вверх, определить значения остав- шихся переменных. Именно, из второго уравнения мы, зная x
3
, легко определим x
2
= 1. Затем
из первого уравнения по известным x
2
и x
3
мы восстановим значение переменной x
1
= 2. Тем самым мы окончательно решим нашу систему уравнений. Этап последовательного определения переменных из треугольной системы называют иногда обратным ходом метода Гаусса.
3.1.4. Теперь подведем итоги вышесказанному. Как мы поняли, при решении системы линейных алгебраических уравнений методом Гаусса у нас имеются два прохода — прямой и обратный.
На первом мы последовательно, шаг за шагом, исключаем переменные с меньшими индекса- ми. Именно, вначале мы из всех уравнений, кроме первого, исключаем переменную x
1
, затем в подсистеме, состоящей из последних (n − 1) уравнений, мы во всех уравнениях, кроме вто- рого, исключаем переменную x
2
и так далее. В результате этого процесса мы в простейшем случае получаем единственное уравнение относительно единственной неизвестной x n
, которое уже легко решается. На втором этапе мы, зная переменные x n
, x n−1
, . . . , x k+1
, находим из k-го уравнения переменную x k
На этом месте стоит заметить, что описанная выше схема метода Гаусса описывает только лишь простейший случай. В этом простейшем случае мы, во-первых, предполагаем, что система состоит из n уравнений с n неизвестными, и что эта система имеет единственное решение. Кроме того, мы считаем, что при прямом проходе метода Гаусса коэффициенты при x i
в i-м уравнении отличны от нуля. В случае, когда последнее предположение не выполняется, мы вынуждены добавлять в метод Гаусса перестановку столбцов системы уравнений. Проблема существования и единственности решения является несколько более серьезной. Однако можно показать, что и с этой проблемой метод Гаусса справляется. Более того, чаще всего именно метод Гаусса и используют на практике для того, чтобы понять, существует ли у данной системы решение, а если существует, то единственно ли оно.
3.2. Перейдем теперь к изучению достаточно полезной на практике модификации метода Гаусса
— так называемом методе LU -разложения. Эта модификация была придумана в 1948 году
Аланом Тьюрингом.
3.2.1. Иногда удобно систему линейных алгебраических уравнений (1) записывать в так назы- ваемом матричном виде
Ax = b.
Здесь b =




b
1
b
2
b n




и x =




x
1
x
2
x n




есть векторы-столбцы правых частей системы (1) и неизвестных этой системы, а
A =





a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
n1
a n2
. . . a nn





есть матрица коэффициентов системы (1). Напомним, что в результате умножения матрицы A
размерами n × n на вектор-столбец x у нас получается вектор-столбец b, а само умножение матрицы на вектор-столбец происходит по следующему правилу: мы поэлементно умножаем i-ю строку матрицы A на столбец x, получая в результате i-ю компоненту вектора-столбца b:
a i1
· x
1
+ a i2
· x
2
+ . . . + a in
· x n
= b i

3.2.2. В результате прямого хода метода Гаусса мы переходим от исходной системы уравнений
(1) к системе с, как говорят, верхнетреугольной матрицей. Именно, мы в результате такого прохода приводим систему (1) к виду













u
11
x
1
+ u
12
x
2
+ . . . + u
1n x
n
= e b
1
u
22
x
2
+ . . . + u
2n x
n
= e b
2
u nn x
n
= e b
n которую в матричном виде мы можем переписать так:
U x = e b,
U =





u
11
u
12
. . . u
1n
0
u
22
. . . u
2n
0 0
. . . u nn





Имея такую систему, мы вначале из последнего уравнения находим неизвестную x n
, затем из предпоследнего — переменную x n−1
и так далее.
3.2.3. Однако оказывается, что в процессе прямого хода метода Гаусса мы получаем несколько больше, чем коэффициенты u ij и b i
матрицы U и вектора b. На самом деле, мы в результате этого хода получаем разложение матрицы A в виде произведения L · U двух матриц — верхне- треугольной матрицы U , а также нижнетреугольной матрицы L вида
U =





l
11 0
0
l
21
l
22 0
l n1
l n2
. . . l nn





Предположим, вначале, что это действительно так, то есть что мы умеем, несколько модифи- цируя метод Гаусса, строить, как говорят, LU -разложение матрицы A коэффициентов системы
(1). Давайте посмотрим, зачем нам это может понадобиться.
Так как матрица A представлена у нас в виде произведения пары матриц L и U , то мы систему уравнений (1), записанную в матричном виде, можем переписать так:
Ax = b
⇐⇒
(L · U )x = b
⇐⇒
L · (U x) = b
⇐⇒
L · y = b,
где y = U x. Так как матрица L нижнетреугольная, то мы из уравнения L · y = b легко по вектору b правых частей сможем восстановить вектор-столбец y. Действительно, данная система уравнений имеет следующий вид:











l
11
y
1
= b
1
l
21
y
1
+ l
22
y
2
= b
2
l
11
y
1
+ l
12
y
2
+ . . . + l nn y
n
= b n
Из первого уравнения мы легко определим y
1
, затем из второго уравнения, зная y
1
, мы вычис- лим y
2
и так далее. Но теперь, зная y, мы из решения системы U ·x = y, используя обратный ход
метода Гаусса, сможем восстановить и вектор x. Иными словами, мы, построив LU -разложение матрицы A, достаточно просто сможем вычислить как вектор y, так и искомый вектор x.
В этом месте возникает законный вопрос — зачем же нам все эти сложности? В случае од- нократного решения системы (1) мы, чаще всего, сможем прекрасно обойтись и классическим методом Гаусса. Предположим, однако, что у нас имеется какая-то динамическая задача, в ко- торой матрица A коэффициентов системы (1) фиксирована, а вектор b правых частей этой системы достаточно часто меняется. Это встречается, например, в задачах, в которых матрица
A описывает какое-то механическое устройство, а вектор b описывает постоянно меняющие- ся внешние воздействия на это устройство. В этом случае нам для целого набора векторов b правых частей приходится решать систему (1), получая, как говорят, реакцию x рассматри- ваемого механического устройства на эти внешние воздействия. И вот в таких задачах метод
LU -разложения оказывается чрезвычайно полезен.
Действительно, если мы раз и навсегда построили на первом шаге LU -разложение матрицы A,
то затем нам останется только лишь многократно (для разных b) решать системы вида
L · y = b,
y = U x.
А такого рода системы мы можем решать с помощью обратного хода метода Гаусса достаточно быстро — количество операций, которое нам на это требуется, пропорционально n
2
. Прямой же ход метода Гаусса, на котором мы и строим LU -разложение матрицы A, достаточно трудоемок
— он требует количество операций, пропорциональное n
3
. Иными словами, для такого рода ди- намических задач метод LU -разложения существенно экономит количество операций, которое нам нужно совершить в процессе построения решения.
3.2.4. Осталось разобраться с тем, как же нам в процессе прямого хода метода Гаусса построить
LU -разложение матрицы A. Давайте, опять-таки, разберем алгоритм построения такого разло- жения на конкретном, достаточно простом примере уже знакомой нам системы уравнений
(
x
1
+ 2x
2
= 3 4x
1
+ 5x
2
= 6
Матрицу
A =
1 2 4 5

этой системы нам нужно представить в виде произведения нижнетреугольной матрицы L и верхнетреугольной матрицы U :
A =
1 2 4 5

= L · U =
l
11 0
l
21
l
22

·
u
11
u
12 0
u
22

=
l
11
u
11
l
11
u
12
l
21
u
11
l
21
u
12
+ l
22
u
22

Заметим, прежде всего, что для определения шести неизвестных коэффициентов матриц U и
L у мы из последнего равенства получаем лишь четыре уравнения:









l
11
u
11
= 1
l
11
u
12
= 2
l
21
u
11
= 4
l
21
u
12
+ l
22
u
22
= 5
Иными словами, мы получаем недоопределенную систему уравнений на неизвестные коэффи- циенты u ij и l ij
. Для того, чтобы от этой неопределенности избавиться, давайте положим все
диагональные элементы l ii матрицы L равными единице. Тогда оставшиеся коэффициенты из системы уравнений









u
11
= 1
u
12
= 2
l
21
u
11
= 4
l
21
u
12
+ u
22
= 5
определятся уже однозначно: u
11
= 1, u
12
= 2, l
21
= 4 и u
22
= −3. Таким образом, мы для заданной матрицы A построили следующее LU -разложение этой матрицы:
A =
1 2 4 5

= L · U =
1 0 4 1

·
1 2
0 −3

Вспомним теперь, как мы решали такую систему методом Гаусса. На первом шаге мы исклю- чали из второго уравнения системы
(
x
1
+ 2x
2
= 3 4x
1
+ 5x
2
= 6
переменную x
2
, домножая первую строку этого уравнения на четверку и вычитая из второго уравнения первое. В результате мы получали систему вида
(
x
1
+ 2x
2
= 3
−3x
2
= −6
коэффициенты которой в точности совпадают с коэффициентами матрицы U . Посмотрим те- перь на коэффициенты матрицы L. Заметим, что четверка, стоящая на месте коэффициента l
21
этой матрицы, в точности совпадает с тем множителем, на который нам нужно было домножить первое уравнение исходной системы для исключения переменной x
2
из второго уравнения этой системы. Данный факт, конечно же, случайным не является. Оказывается, что если мы возьмем нижнетреугольную матрицу с единицами на главной диагонали, и будем на место коэффици- ента l ij записывать множитель, на который нам нужно домножить i-ю строку для того, чтобы исключить переменную x j
в j-й строке в прямом ходе метода Гаусса, мы и получим искомую матрицу L.
3.2.5. Мы не будем давать строгого доказательства описанного выше алгоритма построения матрицы L. Вместо этого мы еще раз продемонстрируем алгоритм LU -разложения на примере чуть более сложной системы линейных алгебраических уравнений вида





2x
1
+ x
2
+ x
3
=
5 4x
1
− 6x
2
= −2
−2x
1
+ 7x
2
+ 2x
3
=
9
Матрица A этой системы имеет вид
A =


2 1
1 4
−6 0
−2 7
2



Нам хотелось бы определить неизвестные коэффициенты l ij в матрице
L =


1 0
0
l
21 1
0
l
31
l
32 1


Для этого проведем прямой ход метода Гаусса для этой системы. На первом шаге нам нужно исключить переменную x
1
из второго и третьего уравнения системы. Для этого нам вначале нужно первое уравнение домножить на 2 и вычесть из второго уравнения первое. Это означает,
что в матрицу L нам нужно записать коэффициент l
21
= 2. Затем нам нужно первое уравнение домножить на (−1) и вычесть его из третьего уравнения. Иными словами, нам в качестве коэффициента l
31
матрицы L нужно взять (−1).
В результате первого шага метода Гаусса мы пришли к системе уравнений вида





2x
1
+ x
2
+ x
3
=
5
−8x
2
− 2x
3
= −12 8x
2
+ 3x
3
=
14
В этой системе нам из третьего уравнения нужно исключить x
2
. Для этого мы домножаем второе уравнение на (−1) и вычитаем из третьего уравнения второе. С точки зрения построения матрицы L это означает, что коэффициент l
32
нам нужно положить равным минус единице.
Итак, в результате прямого хода метода Гаусса мы получили следующий вид матрицы L:
L =


1 0
0 2
1 0
−1 −1 1


Кроме того, после прямого прохода метода Гаусса мы получили систему линейных уравнений вида





2x
1
+ x
2
+ x
3
=
5
−8x
2
− 2x
3
= −12
x
3
=
2
Тем самым мы построили и верхнетреугольную матрицу
U =


2 1
1 0 −8 −2 0
0 1


Иными словами, мы в процессе прямого хода метода Гаусса построили LU -разложение матрицы
A.


написать администратору сайта