1
线性代数总览
线性代数(-)线性方程组
线性代数是解一次方程的学问。
线性=一次=简单
由于一个未知数的线性方程ax=b的解
的状况在小学时即已被大家完全掌握,所以
本课程面临的问题将是解两个以上未知数即
下面形式的线性方程组:
=+++
=+++
=+++
mnmnmm
nn
nn
bxaxaxa
bxaxaxa
bxaxaxa
"
""""""""""""
"
"
2211
22222121
11212111(1)
这是一个含有n个未知数m个方程的线性
方程组,是线性代数的基本研究对象。
当m=n=2时,方程组(1)就是我们非
常熟悉的
2
=+
=+
2222121
1212111
bxaxa
bxaxa(2)
或者
=+
=+
222
111
cybxa
cybxa(3)
当
1221
0abab−≠时,方程组(3)有唯一解:
12211221
12211221
,
cbcbacac
xy
abababab
−−
==
−−
。
注意上述解中的分母相等,均为
1221
abab−,且
该数与方程组(3)的系数关系密切,我们
愿意用一个特殊的符号表示它(这样做最大
的好处是:易记),即11
22
ab
ab
,称此数为方程组
(3)的系数行列式。如此一来,上述解中
的分子也分别变为了11
22
cb
cb
以及11
22
ac
ac
。
这样的结果当然非常美妙,足以令我们
心旷神怡。高兴之余,我们必然要问:m=n=3
时如何?m=n>3时如何?
容易计算(只是较麻烦,这是不可避免
的),当m=n=3时,如果方程组(1)有唯
一解,则解是
32322332
1
332
baaaababaaabababaa
x
aaaaaaaaaaaaaaaaaa
++−−−
=
++−−−
3
其余两个未知数的表达式类似。自然地,由
m=n=2时的记号,可以记此分母为
111213
212223
313233
aaa
aaa
aaa
,
也称为方程组(1)的系数行列式(此时为
三阶行列式)。
三阶行列式已经较为复杂了,可以想
象,m=n=4以及更大的数所对应的情形---即
n阶行列式---将会更加复杂.所以需要专门
研究.
一般情况下(比如m≠n时)的线性方程组
其解如何?回答这个问题,实际上就构成了
线性代数的基本框架(第一条主线)。此时,
行列式不再是有效的工具,取而代之的是更
为重要有效的概念----矩阵,即按照线性方
程组的系数的顺序排列成的矩形数表或阵
列。
矩阵的引入大大简化了符号系统(比如,
一个m×n的线性方程组可以简单地写成
Ax=b,其中A是m×n的系数矩阵,x是所有
未知数按照原有顺序组成的n×1矩阵(即
列矩阵),b是由自由项(或常数项)按顺
4
序组成的m×1矩阵)。不仅如此,历史的进
程表明,矩阵几乎是无所不包的工具和概
念,因此矩阵本身也是极其值得研究的对
象。这就构成了线性代数的第二条主线。
简单地说,线性代数是利用矩阵研究线性
方程组和利用线性方程组研究矩阵的学问。
一个线性方程组可以表达为三种不同的
形式,即
z开放形式(初等形式:多个方程并列);
z矩阵形式Ax=b;
z向量形式α
1
x
1
+α
2
x
2
+…+α
n
x
n
=b
了解了三种形式之间的关系即了解了线
性代数之大部。
我们知道,一个线性方程组可能出现下述
几种情况:
1.相容方程组(compatiblesystem):即至少
有一个解的线性方程组;
2.矛盾方程组(incompatiblesystem):没有
5
解的线性方程组;
3.确定方程组(determinatesystem):有惟
一解的线性方程组;
4.不定方程组(indeterminatesystem):有多
于一解的线性方程组.
值得注意的是,每一个不定线性方程组有
无穷多个解.这与次数超过1的方程组形成
鲜明对照.
在m=n时,线性方程组(1)是确定的⇔系
数行列式非零.在这种情况下,方程组的惟一
解可按Cramer法则(Cramerrule,1750)求
出.
当系数行列式等于零或m≠n时,上述方
法失效.这时,要确定线性方程组的类型,须使
用关于矩阵的核心概念-秩(Frobenius,1877).
一个矩阵的秩表达了其所代表的线性方程组
所含独立方程的个数(或使用线性代数的术
语,该矩阵的线性无关的行或列的最大个数).
矩阵的线性无关的行的最大个数称为矩阵的
行秩;矩阵的线性无关的列的最大个数称为
矩阵的列秩.
关于矩阵的秩有下述结论:
6
行秩=列秩=该矩阵非零子式的最高阶数.
关于矩阵秩的最著名的结果是
(Sylvester,1814-1897):
设A
m×p
,B
p×n
,则r(A)+r(B)-p≤
r(AB)≤min{r(A),r(B)}.
其证明具有相当的启发性.先看第二个不
等式:矩阵的乘法具有什么样的性质?”左行
右列”.更进一步,乘积矩阵的行等于右边矩阵
的行的线性组合,组合系数是左边矩阵相应
的行;乘积矩阵的列等于左边矩阵的列的线
性组合,组合系数是右边矩阵相应的列.
(插入例子:二阶矩阵的乘积.)
于是,AB的列均可由A的列线性表示,而
其行可由B的行线性表示,从而其列秩不超
过A的列秩,其行秩不超过B的行秩,因此该
不等式成立.再来看第一个不等式:回忆可逆
矩阵不改变矩阵的秩,而且存在可逆矩阵P
与Q使得0
00
r
E
PAQ
=
,其中r=r(A).于是
PAB=PAQQ-1B=(PAQ)Q-1B=C,
其中C的前r行为Q-1B的前r行,后m-r
行均为零。注意r(Q-1B)=r(B),故共有p行的
7
矩阵Q-1B的前r行的秩至少为r(B)-(p-
r)=r(A)+r(B)-p,即C的秩至少为r(A)+r(B)-
p,但r(C)=r(AB),ok.
与线性方程组(1)相关联的有两个矩阵:系
数矩阵A=(a
ij
)以及由A加入自由项的列得
到的增广矩阵B=(A,b)=(a
ij
,b
i
).
线性方程组的主定理(Kronecker-Capeli
Theorem):
线性方程组(1)是相容的⇔A的秩=B的
秩.进一步,线性方程组(1)有惟一解⇔A的秩
=B的秩=n(=未知数的个数).
相容线性方程组的诸未知量可分为主未
知量(主元)与自由未知量(自由变量).对自由
未知量的任一组值,存在惟一确定的主未知
量的值,它们一起给出方程组的一个解.主未
知量与自由未知量的分法通常不是惟一的,
确切地说,如果A的秩等于B的秩,且等于r,
则其系数可以组成一个行列式D≠0的任意r
个未知量均可视为主未知量,其他的为自由
的.在这种情况下,行列式D称为方程组的主
子式(注意与行列式的主子式的差别).在计算
解中只须取含主子式D的r个方程,并按一
8
般形式(如用Cramer法则)用自由未知量表
达主未知量.这些表达式称为通解,自由未知
量在其中起着自由参数的作用.对于r=n的
情况,所有未知量均为主未知量,且不存在通
解.特别,当r=n=m时,我们又回到Cramer
法则,所不同的是,代替系数行列式不等于零,
现在使用的是”系数矩阵可逆”这一更为重要
广泛的概念(尽管可逆矩阵在此处作用并不
突出).此时我们再次感到Cramer法则中的
绝妙之处:
).,,2,1(
);,,2,1(
2211
2211
njAaAaAaD
niAaAaAaD
njnjjjjj
ininiiii
⋅⋅⋅=+⋅⋅⋅++=
⋅⋅⋅=+⋅⋅⋅++=
≠
=
=+⋅⋅⋅++
ji
jiD
AaAaAa
jninjiji02211
理论上一次性消去了n-1个未知数!
从(1)用零代替自由项得出的线性方程组
=+++
=+++
=+++
0
0
0
2211
2222121
1212111
nmnmm
nn
nn
xaxaxa
xaxaxa
xaxaxa
"
""""""""""""
"
"
(2)
称为对应于(1)的齐次线性方程组.方程组(2)
9
总是相容的(因为零解满足它).它有非零解的
必要充分条件是它的矩阵A的秩应该小于
未知量的个数n.特别,当m=n时,齐次线性方
程组有非零解当且仅当它的行列式等于零.
相容的线性方程组(1)的解与对应的齐次
线性方程组(2)的解有如下联系:(1)的解与(2)
的解之和为(1)的解;(1)的两个解之差为(2)的
解.(1)的所有解可由(2)的每一个解加上(1)的
同一个特解得到.(请对照线性微分方程的解
的结构,那里的结果只是线性代数理论的简
单应用!)
上述作法与解析几何中一个线性方程组
表示一个几何体(在平面上是直线,在空间内
则是平面)的直观印象相去甚远,难以反映几
何代数一体化的客观实在.考察直线L:x-y=0,
其元素可以改写成集合L={(x,y)|x=y}或
L={(x,x)|x∈R}.于是,在向量的加法(该法则是
力的合成法则!)下,我们有:若α,β∈L,则
α+β∈L;对任意实数k,kα∈L.这表明,一旦引
入合理的运算,几何体也会具有相当好的代
数性质(许多性质还是远远超出几何范畴或
几何想象的).于是,线性空间的概念横空出世.
10
所以线性空间的原型就是(过原点的)直线与
平面,尽管很多教材都未反映出此点.
所谓的线性空间是一个非空集合V,其元
素称为向量,向量之间有“加法”运算,另有
一个称为数乘的运算联系V中的向量与一
个数域F中的数,满足两组条件,第一组条件
保证该集合是一个加群(近世代数的基本概
念,加法运算下的整数集合是原型),第二组条
件保证加法与数乘运算是和谐的(复数或实
数的加法与乘法的关系是原型).
n维向量的核心概念(也是较困难的概念)
是一组向量的线性相关性(与无关性).两个向
量的线性相关实际上就是成比例或共线,三
个向量时该概念便是共面.由此产生向量组
的秩的概念,进而导致向量空间的几个最重
要的概念:子空间,基,维数和坐标.
关于线性空间最重要的事实之一就是,任
何有限维线性空间均同构于数域F上的n
维线性空间Fn(即n元数组按通常加法与数
乘构成的线性空间).
线性方程组解的几何解释:齐次方程组(2)
的所有解组成Fn的一个子空间U,其维数等
11
于n-r,其中n是未知量的个数,而r是方程组
矩阵A的秩.如果r
的,且它的基亦称为线性方程组(2)的基本解
组或基本解系.由此产生一系列研究矩阵的
巧妙且高效的方法,其中最简洁易懂且常考
者为:
(1)设A,B均为n阶矩阵,AB=0,则
r(A)+r(B)≤n.
(2)r(ATA)=r(A);
(3)设A是n阶矩阵,则r(An+1)=r(An).
其中包含的”智慧”乃是线性方程组(特
别是齐次方程组)矩阵与线性空间之”三位一
体”,代数与几何之融会贯通.(2)与(3)的证明
的关键在于认识到线性方程组ATAx=0与
Ax=0同解以及An+1x=0与Anx=0同解.对前
者而言,Ax=0的解显然是ATAx=0的解;反之,
若y是ATAx=0的解,则ATAy=0,于是
yTATAy=0;从而(Ay)T(Ay)=0,此即向量Ay的
长等于0,ok.对于后者,由于A=0或A可逆
时结论显然成立,故可设A的秩介于1与n-
1之间,于是A,A2,…,An这n个矩阵必有两个
秩相等,设为As,At,其中s
12
样,r(As)=r(As+1)=…=r(At),于是At-1x=0与
Atx=0同解;由此可证,At+1x=0与Atx=0同解:
设y是At+1x=0的解,即At(Ay)=0,于是Ay是
Atx=0的解,从而也是At-1x=0的解,即At-
1(Ay)=0,故Aty=0.因此,r(At)=r(At+1).归纳法
生效.OK.
反之,对Fn的每一个子空间U,存在一个齐
次线性方程,其解恰好组成U.由一个固定向
量x
0
加上U的每一个向量所得到的向量的
集合Z=x
0
+U称为Fn的线性簇或线性流形(在
一维或二维的情形下,就是直线与平面:当过
原点时,就称为子空间了).在dimU=n-1的情
况下,也称为超平面.一个相容的线性方程组
(1)的所有解组成一个线性簇Z;反之,对任意
的线性簇Z,存在一个相容的方程组,其解恰
好组成该线性簇Z.
13
线性代数(二)矩阵理论
由于矩阵的极端重要性,研究矩阵成为线
性代数的另一个主题(甚至超过线性代数真
正的主人---线性方程组).但这个课题过于庞
大,线性代数选择了其中一个用途较广的分
支,即方阵的幂的计算(因为矩阵的难度就来
自于其乘法).
当阶数较高时,矩阵乘法将变得非常繁杂.
这就需要找出简单的方法.显然,如果能将一
般矩阵和某个对角矩阵联系起来,就有希望
简化计算.在解线性方程组时,我们已经知道,
任意矩阵均可通过初等变换化为较为简单的
形式:
0
00
r
E
PAQ
=
其中P与Q是可逆矩阵,r是A的秩.若A是
方阵,则上式右边的矩阵的任意次幂仍是它
自身,即
0
().
00
r
k
E
PAQ
=
14
或
0
()
00
r
k
E
PAQPAQPAQPAQ
==•••
"
但上式与Ak似乎关系不大,因此,需要进一
步的考察.我们发现,如果上式右边的矩阵P
与Q满足条件QP=E(即Q=P-1),则右边就变
成了PAkQ,此时Ak即呼之欲出了.不过限制
P与Q的关系后,PAQ是否还具有上式左边
的形式呢?由于我们的目的是计算方阵的幂,
这并不需要将方阵化为标准型,对角型就足
够了.于是我们将计算Ak的问题化为另一个
重要的研究课题:
哪些矩阵A可以对角化,即存在可逆矩阵
P使得
P-1AP=D=diag{λ
1
,λ
2
,…,λ
n
}
是对角矩阵?
P-1AP称为与A相似的矩阵.相似是矩阵
的等价关系.
为使A可以对角化,设
P=(α
1
,α
2
,…,α
n
)
注意到P可逆,诸α
i
均非零且线性无关.由于
15
AP=PD,按分块矩阵的乘法可得:
(Aα
1
,Aα
2
,…,Aα
n
)=(λ
1
α
1
,λ
2
α
2
,…,λ
n
α
n
),
于是,
Aα
i
=λ
i
α
i
,i=1,2,…,n.
即
(A-λ
i
E)α
i
=0,i=1,2,…,n.
这样,线性方程组
(A-λ
i
E)x=0,i=1,2,…,n,
均有非零解α
I
,从而系数行列式
|A-λ
i
E|=0,i=1,2,…,n
因此,诸λ
i
,i=1,2,…,n均是代数方程
|A-λE|=0或|λE-A|=0
的根.反之,如果λ是上述方程的根,则线性方
程组(λE-A)x=0就有非0解α,从而可以作为
上述可逆矩阵P的一个列向量.因此上述方
程的根非常重要,这就是矩阵A的特征根或
特征值.而代数方程|λE-A|=0相应的多项式
称为矩阵A的特征多项式.对每个特征根λ
i
,
满足条件Aα
i
=λ
i
α
i
的非零向量α
i
称为A的
属于特征根λ
i
的特征向量.(回忆求多元函数
条件极值的Lagrange乘数法,那里的参数λ
的含义正是此处的特征值!)
16
由于P可逆,故诸特征向量α
i
,i=1,2,…,n
线性无关,从而有下述
定理2.1n阶方阵A可逆⇔A有n个线
性无关的特征向量.
问题由此变为:什么样的方阵有n个线
性无关的特征向量?
注意,相似矩阵具有相同的特征多项式
(但反之不对).设
12
12
||()()()t
n
nn
t
EAλλλλλλλ−=−−−"
其中,n=n
1
+n
2
+…+n
t
,诸根λ
j
是互不相同的,
则A相似于对角矩阵当且仅当对每一个λ
j
,
j=1,2,…,t,r(λ
j
E-A)=n-n
j
.这是因为,属于不
同特征根的特征向量线性无关.
特征值与特征多项式有众多良好的性质
和应用(必考之内容!).
(1)|A|=λ
1
λ
2
…λ
n
,即矩阵的行列式等于特
征值之积;
由此即知,方阵A可逆当且仅当其特征值
均非零.
(2)a
11
+a
22
+…+a
nn
=λ
1
+λ
2
+…+λ
n
;即矩
阵的迹等于其特征值之和;
17
(3)设A有特征值λ,f(x)是一多项式.则f(A)
有特征值f(λ).若A可逆,则A-1有特征值1/λ;
(4)设f(x)是一多项式.若f(A)=0,则A
的任意特征值λ均满足f(λ)=0.
上述几条经常被用来考察对矩阵(尤其是
可逆矩阵等)的理解程度.
例2.1计算行列式
1112131
2122232
3132333
123
n
n
n
nnnnn
abxababab
ababxabab
abababxab
ababababx
+
+
+
+
"
"
"
###%
#"
其中,
1122
0
nn
ababab+++≠".
本题只要对特征多项式有一定认识,则易
如反掌.所求行列式对应的矩阵A=xE+B,其
中B=(a
i
b
j
)的任意两行均成比例,故其秩为
1(最重要的矩阵类型之一)或0,但由题中所
给条件,B≠0,于是,B至少有n-1个特征值为0,
另有一特征值等于trB=a
1
b
1
+a
2
b
2
+…+
18
a
n
b
n
≠0.从而,A有n-1个特征值x,另有一个
特征值x+
例2.2设A为三阶矩阵,X为三维向量,
X,AX,A2X线性无关,A3X=4AX-3A2X。
试计算行列式|2A2+3E|。
很多人觉得此题无从下手,实在冤枉了出
题人.由A3X=2AX-3A2X可知,A(A2+3A-
4E)X=0.由此知,|A|=0:否则,A可
逆,X,AX,A2X将线性相关,矛盾!从而(A2+
3A-4E)X=0:故X是齐次线性方程组
(A2+3A-4E)Y=0的非零解.于是|A2+3A-
4E|=0.故A的三个特征值为0,1,-4.于是
2A2+3E的三个特征值为3,5,35.所以,
|2A2+3E|=3×5×35=525。
至于象已知f(A)=0,求xE+tA的逆矩阵
一类的题目,就更不在话下了.
例2.3设n阶矩阵A满足A2+3A-4E=0,
证明:
(1)r(A-4E)+r(A+E)=n;
(2)A可以对角化;
(3)2A+3E可逆,并求其逆。
特别地,实对称矩阵A一定可以正交对
19
角化(即存在矩阵Q,QTQ=E,使得QTAQ=D),
且其特征根均是实数.这就为一个插曲埋下
了伏笔,即实二次型.
实n元二次齐式
2
1
1,1
(,,)
n
nijijiiiijij
ijniij
fxxaxxaxaxx
≤≤=<
==+∑∑∑"
称为实二次型.一般而言,判断该二次型的基
本性质是相当困难的.比如我们很难判断该
二次型是否恒非负或恒非正?或什么时候正,
什么时候负?但利用矩阵的乘法(确切地说,
利用矩阵的对角化),一切均可迎刃而解.
为此,只须适当调整系数,即可认为a
ij
=a
ji
,
从而
f(x
1
,…,x
n
)=xTAx,
其中A=(a
ij
)是n阶实对称矩
阵,x=(x
1
,x
2
,…,x
n
)T是n个未知元组成的n维
列向量.矩阵A称为二次型的矩阵,其秩称为
二次型的秩.若对未知量的任意非零值,二次
型的值均为正(负,非负,非正),则称二次型以
及其矩阵为正定(负定,半正定,半负定)的.
由于存在正交矩阵Q,使得
QTAQ=D=diag{λ
1
,λ
1
,…,λ
n
},从而可令x=Qy,
20
y=(y
1
,y
2
,…,y
n
)T为新的未知量,则有
f(x
1
,…,x
n
)=xTAx=yTQTAQy=yTDy
=λ
1
y
1
2+λ
2
y
2
2+…+λ
n
y
n
2,
于是交叉项消失了(此称为二次型的标准形
式),从而有结论:
定理2.2二次型f(x
1
,…,x
n
)=xTAx正定(负
定,半正定,半负定)⇔A的特征值均为正(负,
非正,非负).
二次型的标准形式还可进一步化为所谓
规范形式,即令y=Cz,使CTDC=diag{1,…1,-
1,…,-1,0,…,0},则
f(x
1
,…,x
n
)=xTAx=yTDy=zTCTDCz
=z
1
2+z
2
2+…+z
p
2-z
p+1
2-…-z
r
2,
其中r是二次型的秩,p称为二次型的正惯性
指标(就是A的正特征值的个数,按重数计
算),r-p称为负惯性指标(就是矩阵A的负特
征值的个数,按重数计算),2p-r称为符号差.
随同二次型而来的关于矩阵的一个重要
概念是“合同”:数域P上两个n阶矩阵A
与B称为是合同的如果存在P上可逆矩阵
Q使得B=QTAQ.
借助于二次型,容易得出下述结果:
21
定理2.3实对称矩阵A是正定的⇔A合
同于单位矩阵⇔A=MTM,其中M是可逆矩
阵(高矩阵,即列满秩的矩阵即可).
本文发布于:2022-12-07 18:02:14,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/88/61038.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |