chapter1矩阵

更新时间:2024-04-24 09:34:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

矩阵是什么? 矩阵的代数性质

1.矩阵是线性映射的表示:

线性映射的相加表示为矩阵的相加 线性映射的复合表示为矩阵的相乘

2.矩阵是一种语言,它是表示复杂系统的有力工具。

学习矩阵理论的重要用途之一就是学会用矩阵表示复杂系统的关系,培养根据矩阵推演公式的能力是学习矩阵论的目的之一。

定义一个矩阵有几种方式:可以通过定义矩阵的每一个元素 来定义一个矩阵,也可以通过矩阵具有的性质来定义一个矩阵。如:对称矩阵可以定义为:aij=aji 也可以定义为: (x, Ay)=(Ax,y),

还可以定义为: Ax=?f(x), 其中f(x)=xTAx/2,即它对向量x的作用相当于函数f(x)在x处的梯度。

2. 矩阵可以表示为图像

矩阵的大小可以表示为图像。反之,一幅灰度图像本身就是矩阵。图像压缩就是矩阵的表示问题. 这时矩阵相邻元素间有局部连续性,既相邻的元素的值大都差别不大。

3. 矩阵是二维的(几何性质)

矩阵能够在二维的纸张和屏幕等平面媒体上表示,使得用矩阵表示的问题显得简单清楚,直观,易于理解和交流。 很多二元关系很直观的就表示为矩阵,如关系数据库中的属性和属性值,随机马尔科夫链的状态转移概率矩阵,图论中的有向图或无向图的矩阵表示等。

第一章:线性空间和线性变换 1. 线性空间 集合与映射

集合是现代数学最重要的概念,但没有严格的定义。 集合与其说是一个数学概念,还不如说是一种思维方式,即用集合(整体)的观点思考问题。整个数学发展的历史就是从特殊到一般,从个体到整体的发展历程。

集合的运算及规则,两个集合的并、交运算以及一个集合的补;集合中元素没有重合,子集,元素 设S,S'为集合

映射:为一个规则?:S ? S', 使得S中元素a和S'中元素对应, 记为 a'=?(a),或?:a?a'.

映射最本质的特征在于对于S中的任意一个元素在S'中仅有

唯一的一个元素和它对应。

映射的原象,象;映射的复合。满射,单射,一一映射。 若S'和S相同,则称?为变换。 若S'为数域,则称?为函数。

线性空间的定义和性质

定义1.1设V是一个非空集合,它的元素用x,y,z等表示,并称之为向量;K是一个数域,它的元素用k,l,m等表示,如果V满足下列条件 (I)

在V中定义一个加法运算,即当x,y?V时,有惟一的

x?y?V,且加法运算满足下列性质

(1) (2) (3) (4)

结合律x?(y?z)?(x?y)?z; 交换律x?y?y?x;

存在零元素0,使x+0=x;

存在负元素,即对任何一向量x?V ,存在向量y,使x+y=0,则称y为x的负元素,记为-x,于是有

x+(-x) = 0

(II) 在V中定义数乘运算,即当x?V, k?K,有唯一的kx?V, 且

数乘运算满足下列性质

(5)数因子分配律 k(x+y)=kx+ky ;

(6) 分配律 (k+l)x = k x+l x ; (7) 结合律 k(l x)=(k l ) x ;

(8) 1 x = x

则称V为数域K上的线性空间或向量空间。

特别地, 当K为实数域R时,则称V为实线性空间; 当K为复数域C时,则称V为复线性(酉)空间。

例:次数不超过n?1的多项式Pn全体按照通常的多项式加法和数乘构成一个线性的多项式函数空间; 即:f(x)=a0xn?1+a1xn?2+…+an?2x+an?1

g(x)=b0xn?1+b1xn?2+…+bn?2x+bn?1 定义 f(x)?g(x)=f(x)+g(x),

k?f(x)=(k?a0)xn?1+(k?a1)xn?2+…+(k?an?2)x+k?an?1

n维实向量的全体按照通常的向量加法和数乘构成一个实线性空间,我们把这个空间称为实向量空间; 即:x, y?Rn, 定义:(x?y)i=xi+yi ,(k?x)i=k?xi

所有m?n实矩阵的全体按照通常的矩阵加法和数乘构成一个实线性空间,称之为矩阵空间;

由例如,取V=R, x,y?V, 定义 x?y=(x3+y3)1/3, k?x=k1/3x,k?R. 易验证这样定义的加法和数乘仍然构成一个线性空间。

线性空间中,向量的关系:

线性相关:若存在一组不全为零的数c1,c2,…,cm,使得

c1x1+c2x2+…+cmxm=0

则称向量组x1,x2,…,xm线性相关,否则为线性无关。 极大线性无关组:一个不可能再往里添加向量而保持

它们的线性无关性

引理1.1:线性无关组总是可以扩充为极大线性无关组。 例如:x1=(1,0,0)T,x2=(0,1,0)T, 则设

x3=(?,?,?)T,

其中?表示任意的数,只要??0,则x1,x2,x3就为极大线性无关组。 引理1.2:在一个线性空间中任两个极大线性无关组若它们的所

含向量个数都有限,则所含向量个数一定相同.

证明:设x1,x2,…,xm和y1,y2,…,yn为线性空间V中的两个极大线性无关组。则存在矩阵A,B使得

(x1,x2,…,xm)=(y1,y2,…,yn)A (1) (y1,y2,…,yn)=(x1,x2,…,xm)B (2) 将式(1)代入式(2)可得

(y1,y2,…,yn)=(x1,x2,…,xm)B=(y1,y2,…,yn)AB (3) 另一方面,我们知道

(y1,y2,…,yn)=(y1,y2,…,yn) En (4)

其中, En为n阶单位矩阵。由于 y1,y2,…,yn为极大线性无关组,因此表示系数矩阵应该唯一,也就说,由式(3)和式(4)可得 AB = En, 由此有

trace(AB)= trace(En)= n (5)

类似地,将式(2)代入式(1)可得

(x1,x2,…,xm)=(x1,x2,…,xm)BA=(x1,x2,…,xm)Em ,

再由 x1,x2,…,xm为极大线性无关组可得BA = Em,由此有

trace(BA)= trace(Em)= m (6)

这样利用矩阵迹算子trace(?)的性质,联合式(5)和式(6)可得

n= trace(AB)= trace(BA)=m。

因此,这两个极大线性无关组所含向量个数相同。

(定义)线性空间V的维数:V中极大线性无关组的所含向量的个数,定义为线性空间的维数。

维数有限的称为有限维空间,否则称为无穷维空间。

这个定义之所以有意义,是因为在引理1.2中我们证明了极大线性无关组的个数是相同的。

本书仅仅研究有限维空间,这里得到的结论有些可以直接推广到无穷维空间,但有些却不可能。必须小心!

在后面的讨论中我们仅仅讨论有限维空间,而不一一说明。

线性空间中向量的表示

线性空间的基:若线性空间V的向量x1,x2,…,xr满足

1) x1,x2,…,xr线性无关;

2) V中的任意向量x都是x1,x2,…,xr的线性组合; 则称x1,x2,…,xr为V的一个基或基底,相应地称xi为基向量。 推论1.1: 线性空间中任意一组极大无关组构成它的一个基。 定义1.2:称线性空间Vn的一个基x1,x2,…,xn为Vn的一个坐标系。设向量x?Vn,它在该个基下的线性表示为

x = c1 x1+c2x2+…+cnxn

则称 c1,c2,…, cn为x在该坐标系下的坐标或分量,有时我们称 n维向量(c1,c2,…, cn)T为向量x在该个基下的表示。

这实际定义在V和Rn或(Cn)的之间一一映射

?: V? Rn(或Cn) 即

?: x?V? (c1,c2,…, cn)T?Rn(或Cn)

数域相同的线性空间和n维列向量空间的关系:

定理1.2 在一个基下我们看到任意n维线性空间V和n维列向量空间Rn(或Cn)代数同构,即存在V和Rn或(Cn)的之间一一映射

?:V? Rn(或Cn) 使得

?(x+y)= ?(x)+ ?(y), x, y?V ?(kx) =k ?(x), x?V, k?K,

也就是?保持加法和数乘运算。

(按后面的定义,?实际为可逆的线性映射)。

这个定理说明虽然n维线性空间有无穷多,但是从代数的角度我们仅仅研究n维实(或复)向量空间就足够了。

例如:前面介绍次数不超过n?1的多项式全体按照通常的多项式加法和数乘构成一个线性的多项式函数空间Pn,选择Pn的一个基x1=1,x2=x,x3=x2,…,xn=xn?1, 则任意次数不超过n?1的多项式 f(x) = a0xn?1+a1xn?2+…+an?2x+an?1

= (1,x,x2,…,)( an?1, an?2,…, a0)T

这样( an?1, an?2,…, a0)T就是多项式f(x)在基x1,x2,…,xn的坐标。显然我们可以看成将f(x)映射为( an?1, an?2,…, a0)T,这时明显可见映射为线性的,即若

?: f(x)? ( an?1, an?2,…, a0)T ?: g(x)? ( bn?1, bn?2,…, b0)T

则 ?: f(x)+g(x)? (an?1+bn?1, an?2+bn?2,…, a0+b0)T

基变换与坐标变换

在线性空间Vn中,同一向量对不同的基,它的坐标表示是不一样的。当由一个基x1,x2,…,xn变换为另一个基y1,y2,…,yn时,则由基的定义可得

y1=c11x1+c21x2+…+cn1xn y2= c12x1+c22x2+…+cn2xn

?

yn= c1nx1+c2nx2+…+cnnxn 或用矩阵形式写为

Y = XC 称为基变换公式 (1.1) 其中矩阵C为

c11 c12 … c1n

c21 c22… cn2 称为由旧基到新基的过渡矩阵。

?

cn1 cn2…cnn

Y=(y1,y2,…,yn), X= (x1,x2,…,xn)

实(复)矩阵A为奇异矩阵定义为:存在非零n维实(复)向量x使得Ax = 0.

推论1.2 过渡矩阵非奇异. (自行证明)

从推论1.2我们可以发现, 任何一个非奇异矩阵都可以看成是 线性空间的两个基之间的过渡矩阵,换句话说,是一个基在另一个基下的坐标表示。

向量在不同基下的表示坐标的关系:

设由一个基x1,x2,…,xn变换为另一个基y1,y2,…,yn时过渡矩阵为C,向量x在基x1,x2,…,xn和基y1,y2,…,yn的坐标表示分别为

? =[?1,?2,…,?n]T, ? =[?1,?2,…,?n]T则有

x=X??=Y??=(X?C)??= X?(C ??),从而有?=C??或者?=C-1?? 或用分量形式推导得

x???ixi???kyk???k?cikxi??xi?cik?ki?1k?1k?1i?1i?1k?1nnnnnn

即为 ?=C??

线性子空间

定义:设V1是数域K上线性空间V的非空子集合,且对V已有的线性运算满足以下条件

(1)对加法封闭: 若x, y?V1,则x+y?V1 (2)对数乘封闭:若x?V1,k?K,则k?x?V1. 则称V1为V的线性子空间或子空间。 仅由0元素构成的子空间为零子空间。 注意:零子空间的维数为0而不是1。 子空间的运算:交, 和, 直和

两个子空间V1,V2的交V1?V2仍为子空间。

定义1.8 设V1, V2为数域K上的线性空间V的子空间,且x?V1, y?V2,则由x+y 的全体构成的集合称为V1和V2的和,记为 V1+V2.记V1+V2={z | z=x+y, x?V1,y?V2}。

显然,两个子空间V1, V2的和V1+V2仍为子空间,并且交与和分别满足结合律, 即(V1?V2) ?V3=V1?(V2 ?V3),

(V1+V2)+ V3=V1+(V2 +V3),

从而它们都可以推广到几个子空间的情形,并且

V1?V2 ?… ?Vn 或V1+V2 +… +Vn有意义。

子空间的维数公式:dim V1+dim V2=dim (V1+V2)+dim(V1?V2)

直和的定义: 若V1?V2=0,则V1+V2为V1,V2的直和,记为 V1⊕V2。

性质:对于V1⊕V2中的元素z, 在V1和V2分别存在唯一x和y使得z = x + y.即z的分解唯一。 显然有V1⊕V2? dim(V1?V2)=0

? dim V1+dim V2=dim (V1⊕V2)

子空间的构成:1)由几个子空间的交或和构成。 2)向量x1,x2,…,xm组扩张而成。

由单个非零向量x对数乘运算封闭构成的一维子空间 L(x)={z | z=k?x, k?K}.

同理记L(x1,x2,…,xm)=L(x1)+L(x2)+…+L(xm) 显然dim(L(x1,x2,…,xm)) ? m

思考题1:一个n维线性空间的真子空间有多少?

思考题2:若V1,V2, …,Vm为线性空间V的真子空间,证明存在 一个向量x?V,但x?V1?V2? …?Vm成立。

特别讨论在实线性空间Rm中矩阵A=(aij)?Rm?n的列向量构成的子空间L(a1,a2,…,an)称为矩阵A的值域(列空间),记为

R(A)=L(a1,a2,…,an)?Rm 矩阵的秩

矩阵的列秩:由矩阵的列向量构成的最大无关组的个数。 矩阵的行秩:由矩阵的行向量构成的最大无关组的个数。 定理: 矩阵的行秩和列秩相同。

证明:由于 rank(A)=rank(AAT)?rank(AT) 同样,rank(AT) ?rank(A) 这样,rank(A)= rank(AT),

即矩阵的行秩和列秩相同.

从而它们称为矩阵的秩,记为rank(A). 定理 dim(R(A))=rank(A).

定义1.7 设在实线性空间Rn中矩阵A=(aij)?Rm?n,称集合{x|Ax=0}为矩阵A的核空间,记为N(A),即N(A)={x|Ax=0}?Rn.

称N(A)的维数为A的零度,记为n(A),即n(A)=dim(N(A)). 定理: dim(R(A))+dim(N(A))=n.

思考:若A?Cn?n,R(A)⊕N(A)成立吗?举例说明?

成立的条件是什么?

2 线性映射,线性函数,线性变换及它们的矩阵表示

表示是什么?表示究是本质来说是一种映射,它把我们不熟悉或抽象的事物映射为我们熟知或具体的事物。

例如:抽象的线性空间在一个基下可表示为实或复的向量空间。 同样地,线性空间之间的线性映射都可以表示为矩阵。这正是矩阵的代数本质所在。(向量为特殊的矩阵) 这就是本节所研究的内容。

定义:数域相同的线性空间X到线性空间Y的映射T称为线性映射,若T满足下列条件:1) T(x+y)=T(x)+T(y)

2) T(kx)=kT(x)

若线性空间W和线性空间V的维数分别为:m=dim(W),n=dim(V)

x1,x2,…,xm以及y1,y2,…,yn分别为W和V的一个基, 则线性映射可以表示为一个Rn?m(或者Cn?m)的矩阵。 设向量Txi在基y1,y2,…,yn的坐标表示为

Txi=(y1,y2,…,yn) (a1i,a2i,…,ani)T=(y1,y2,…,yn)ai, i=1,2,…,m 记矩阵A=(a1,a2,…,am),

而基为 Y=(y1,y2,…,yn), X= (x1,x2,…,xm)。

则有 TX=(Tx1,Tx2,…,Txm)=Y ?A (2.1)

对任意向量x在基x1,x2,…,xm的坐标表示为? =[?1,?2,…,?m]T,向量Tx在基y1,y2,…,yn的坐标表示为? =[?1,?2,…,?n]T,那么我们有 Tx=Y??=T(X??)=(TX) ??=(Tx1,Tx2,…,Txm) ??

=Y?(A? )? ?=A? (2.2)

从而对于线性映射T,在基X和Y的下的表示为矩阵A. T : x ? y = T x 其中x=X?, y=Y?

? ? ? ?

A: ? ? ? = A ?

注意对于同一映射,若基X和Y选择不同,则T的表示A一般不相同。

一个很自然的问题就是各种表示之间的关系如何? 若用映射的形式我们可以表示为:

A=?(T; X,Y) (2.3)

设线性空间W的另一组为X', 且X'=XC, 线性空间V的另一组为Y', 且Y'=YD,或Y=Y' D?1 (注意,因为C和D分别为过渡矩阵,从而可逆) 设线性映射T在基X'和Y'下的矩阵为A',即 TX'=Y' A' 则 TX'=T(XC)=(TX)C(由(2.1))

=(YA)C=Y(AC)=Y'D?1AC=Y'A' 从而我们有 A'= D?1AC (2.4)

这就是线性映射在不同基下的矩阵表示的关系式。 注意: D?Rn?n, A?Rn?m, C?Rm?m.

线性映射的复合: S: W?V; T: V?Z 定义 (T?S)(x)=T(S(x)).

其中W, V和Z为线性空间, S和T都为线性映射。

很明显, 线性映射的复合仍为线性映射。 设x1, x2,…,xm为W的一个基, y1,y2,…,yn为V的一个基 z1,z2,…,zr为Z的一个基, S在W和V的当前基下的表示为A, 而T在V和Z的当前基下的表示为B, 则它们的复合T?S在当前基下的矩阵表示为BA.

由于映射的复合一般不可交换,从而对应的矩阵的乘法也不可交换, 即 BA=AB一般不成立。

思考题:根据(2.3),若用映射的形式我们可以表示为:

BA=?(T?S; X, Z)

可见,T?S的矩阵表示和V的基Y的选择无关,假如选择另外 一组V的基Y?,证明这一点。

定理:设T为线性空间W到线性空间V的线性映射,则W内的线性子空间W1在V中的象V1为V的线性子空间。

反之, V中的线性子空间V1的逆象 T-1(V1)={ x | ? y ?V1 s.t. y=Tx } 也为W中的线性子空间。

证明:利用子空间的定义,显然可以得到。

定理:设T为线性空间W到线性空间V的线性映射,W1,W2为W内的子空间,则

1). T(W1+W2)= T(W1)+T(W2)

2). T(W1?W2)? T(W1) ?T(W2) (思考为什么等式不能成立?)

记R(T)为W在V中的象,称之为值域, 即 R(T)={ y?V | y=Tx, ? x?W }

记N(T)为V中零向量空间的逆象T-1(0),称之为T的核,即

N(T)={ x| Tx=0, x?W }

T的值域R(T)的维数dim(R(T))称为T的秩,其核子空间的维数dim(N(T))称为T的亏度。 dim(R(T))+ dim(N(T))=dim(W)

证明:设x1,x2,…,xr为N(T)的一个基,扩充它们使之为W的一个基:x1,x2,…,xr,xr+1,…,xn,那么我们证明T(xr+1),…,T(xn)为R(T)的一个基。

首先证明T(xr+1),…,T(xn)线性无关.设tr+1T(xr+1)+…+tnT(xn)=0 则T(tr+1xr+1+…+tnxn)=0,从而tr+1xr+1+…+tnxn?N(T)

所以tr+1xr+1+…+tnxn能够被x1,x2,…,xr线性表示。因此存在t1,…,tr使得t1x1+…+trxr=tr+1xr+1+…+tnxn,即

t1x1+…+trxr?tr+1xr+1?…?tnxn=0

因此t1=t2=…=tr=tr+1=…=tn=0

这样就说明T(xr+1),…,T(xn)线性无关。

其次我们证明对于任给y?R(T),y能被T(xr+1),…,T(xn)线性表示. 由于y?R(T),因此存在x?W使得y=T(x). 由于

x1,x2,…,xr,xr+1,…,xn为W一个基,因此存在t1,…,tr,tr+1,…,tn使得 x=t1x1+…+trxr+tr+1xr+1+…+tnxn

从而 y=T(x)=T(t1x1+…+trxr+tr+1xr+1+…+tnxn) = t1T(x1)+…+trT(xr)+tr+1T(xr+1)+…+tnT(xn) = tr+1T(xr+1)+…+tnT(xn)

因此y能够被T(xr+1),…,T(xn)线性表示。同时由于T(xr+1),…,T(xn)线性无关。这样它们就构成了R(T)的一个基。从而有 dim(R(T))+ dim(N(T))=dim(W) 证毕.

例:对于Rn到Rm的线性映射T,对于任给x?Rn,T(x)=Ax,其中A为Rm?n的矩阵,这时R(T)=R(A),即A的列向量构成的线性子空间. N(T)为Ax=0的解的全体构成的子空间.

由dim(R(T))+ dim(N(T))=dim(W)可以看出,Ax=0的基础解系的个数为n?r(A),其中r(A)=R(T)为A的秩. 这个结论我们在高等数学里已经得到过.

对于W到V的两个的线性映射T1和T2分别定义它们的加法和数乘如下:

(T1+T2)(x)=T1x+T2x (2.4) (kT1)(x) = k (T1x) (2.5) 那么有以下定理:

定理2.4:所有W到V的线性映射的全体按(2.4)和(2.5)定义的加法和数乘构成一个线性空间。这个空间的维数为mn.

从这里我们可以看到,借助矩阵表示,我们可以完全利用矩阵运算研究线性映射,其实反过来也是对的,即,有时我们可以借助线性映射来研究矩阵。有时候,如果我们利用线性映射的某些特点可以证明矩阵的某些性质,如下例所示。

例 设A?Cm?n, B?Cn?p. 则N(AB)=B?1{N(A)?R(B)}, 线性映射复合的维数公式:

dim(N(AB))=dim(N(B))+ dim(N(A)?R(B)) dim(R(AB))=dim(R(B)) ? dim(N(A)?R(B)) 所以可以证明,rank(A)+rank(B)?n?rank(AB) dim(R(AB))+dim(R(BC))? dim(R(B))? dim(R(ABC)) 证明:1). 显然 N(AB)=B?1{N(A)?R(B)}成立; 2). 欲证dim(N(AB))=dim(N(B))+ dim(N(A)?R(B)), 显然存在x1,x2,..,xr?Cp使得

Bx1, Bx2,.., Bxr为N(A)?R(B)的一个基, 那么显然x1,x2,..,xr线性无关。

再取N(B)的一个基为xr+1,x r+2,..,xs,那么可以证明 x1,x2,..,xr, xr+1,x r+2,..,xs,为N(AB)的一个基。从而有 dim(N(AB))=dim(N(B))+ dim(N(A)?R(B)) 类似地可以证明

dim(R(AB))=dim(R(B)) ? dim(N(A)?R(B)) 或者由

dim(R(AB))+dim(N(AB))=dim(R(B))+dim(N(B)) 可得dim(R(B))? dim(R(AB))=dim(N(A)?R(B)) 3). dim(R(B))? dim(R(AB))=dim(N(A)?R(B))

? dim(N(A))=n? dim(R(A)) 因此有rank(A)+rank(B)?n?rank(AB) 等号成立的充要条件是N(A)?R(B). 同样的

dim(R(BC))? dim(R(ABC))=dim(N(A)?R(BC)) ? dim(N(A)?R(B)) = dim(R(B))? dim(R(AB)) 因此有

dim(R(AB))+dim(R(BC))? dim(R(B))? dim(R(ABC)) 等号成立的条件就是 N(A)?R(BC)= N(A)?R(B)

因此这个例子说明,线性映射和矩阵之间的相互关系,既可以利用矩阵讨论线性映射的性质,也可以利用线性映射讨论矩阵的性质,二者之间建立联系是有助于矩阵研究的。

几个特殊的线性映射:

1)线性函数,即取 V=R1,或C1称之为实或复线性函数。在泛

函分析中称之为线性泛函。

2)线性变换:若线性映射T为:W?W, 则称T为线性变换。 线性映射和线性映射的区别:

1. 线性映射T:W ?V,

线性变换T: W?W.

2. 线性映射的矩阵表示A与W和V的选择基有关。 线性变换的矩阵表示A仅需选择W的一个基而不是两个基。

区别2的意思是,线性空间W上的线性变换T的矩阵表示A仅需选择一个基x1,x2,…, xn,那么

Txi=(x1,x2,…,xn) (a1i,a2i,…,ani)T=(x1,x2,…,xn)ai, i=1,2,…,n 这时有TX=XA.

( 我们称A为线性变换T在线性空间W的基x1,x2,…, xn 的矩阵表示。)

这时如果将T看作W?W的线性映射,我们分别选择W的两个基X= (x1,x2,…,xm)和Y=(y1,y2,…,yn),这时T的矩阵A表示为 Txi=(y1,y2,…,yn) (a1i,a2i,…,ani)T=(y1,y2,…,yn)ai, i=1,2,…,m 这时有TX=Y A.

在以后,我们所线性变换时,仅需选择一个基。

由于线性变换仅为线性映射的特殊情形,因此前面讨论的关于线性映射的所有定义和性质对线性变换都适应,我们不必重复。

下面我们仅讨论线性变换的特殊之处。 线性变换的矩阵表示在不同基下的关系: 设线性空间W的两组不同基X和X'之间满足关系

X'=XC

那么线性变换T在基X和X'下的矩阵表示分别为A和A', 则 A'= C?1AC

定义: 线性变换在不同基下的表示矩阵称为相似矩阵。 定理: 矩阵A和A'相似的充要条件为存在可逆矩阵C

使得 A' = C?1AC

容易验证矩阵相似关系为等价关系。 即, 自反性:A和A相似;

对称性:若A和B相似,则B和A相似;

传递性:若A和B相似,B和C相似,则A和C相似。

从这儿我们可以看出,在相似等价意义下具有的性质有时也称线性变换的性质。例如,相似的矩阵具有相同的行列式,所以我们可以认为线性变换的对应矩阵的行列式为线性变换对原空间的单位超立方体经变换后的多面体的体积。这正是多元积分的变量替换的Jacobi行列式。

又如 我们知道,相似的矩阵具有相同的的特征多项式,所以我们可以定义线性变换的特征多项式。同样可以导出线性变换的特征值,线性变换的迹(定义为线性变换的所有特征值的和)。

几个特殊的变换: 零变换T0: T0(x)=0. 恒等变换I: I(x) = x. 数乘变换Tk: Tk(x)= k ?x.

正交变换T: ||Tx||2=||x||2,其中||.||2为欧氏范数(第2章介绍)

对于复合变换T?T记为T2, 类似地, 记Tk+1=Tk?T, 显然若线性变换T的矩阵表示为A, 则Tk的矩阵表示为Ak, 从而线性变换f (T)=a0Tm+a1Tm?1+…+am-1T+am I

(此处I表示恒等变换)

的矩阵表示为矩阵多项式:

f (A)= a0Am+a1Am?1+…+am-1A+amEn 其中En表示单位矩阵。

线性变换的特征值和特征向量

由于线性变换在不同基下的矩阵表示不相同,那么一个很自然的问题就是,怎样选择特殊的基使得给定线性变换在该个基下的表示矩阵最简单。 为此引入下列概念.

定义: 若存在非零向量x和数?满足

Tx=? x

则称?为T的特征值, x为相应的特征向量。 注意: 由定义,特征向量非零。

定义:矩阵A的特征矩阵?I?A的行列式det(?I?A)=|?I?A|, 称为矩阵A的特征多项式,记为?(?)。?(?)的根?0为A的特征根或特征值;相应方程(?0I?A)x=0的非零解x称为A的属于?0的特征向量。

若线性变换T在线性空间的一个基X下的矩阵表示为A, 即

T X=(Tx1,Tx2,…,Txn)=XA

设T的特征向量x在基X的坐标表示为?,即

x=?1x1+?2x2+…+ ?nxn =X(?1,?2,…, ?n)T=X? 那么有 X(?0??)=?0x=Tx=T X?=XA? 从而 ?0??= A?,

由于上述推导可以倒推, 因此求线性变换T的特征值?0和特征向量x等价于在一个基X下求T的表示矩阵A的特征值?0和特征向量?。这时?为x在基X下的坐标, 即 x=X?。

定义(特征子空间):设?0为线性变换T的一个特征值,称线性变换?0I?T 的核空间V?0={x | (?0I?T)x=0 } 为T的属于?0的特征子空间, 其中I表示恒等变换。

定义:变换矩阵A的迹 Trace(A)=Tr(A)=?aii

i?1n性质1:Tr(A)等于A的所有特征值的和.

由根与系数的关系可得。 性质2: Tr(AB)=Tr(BA).

性质3: 对任意可逆矩阵P, Tr(A)=Tr(P?1AP), 这说明矩阵A的迹由线性变换T(在某种基下对应于矩阵A)决定,与基(坐标)的选择无关。

矩阵的性质

定理1.16(Sylvester) 设A?Rm?n , B?Rn?m , AB的特征多项式为?AB(?), BA的特征多项式为?BA(?), 则?n?AB(?)=?m ?BA(?) 证明:根据矩阵等式有: Im 0 Im A ?Im-AB 0

-B In 0 ?In B In

Im 0 ?Im A ?Im A -B In ?B ?In 0 ?In-BA 对矩阵等式取行列式可得结论。

特殊矩阵:严格下三角矩阵L,对角矩阵D

下三角矩阵D+L, 单位下三角矩阵I+L, 严格下三角矩阵L, 上三角矩阵D+LT, 单位上三角矩阵I+LT, 严格上三角矩阵LT,

块对角矩阵, 块三角矩阵;

初等矩阵(定义): E(u,v;?)=I??uv

H

性质1: E(u,v;?)E(u,v;?)= E(u,v;?+????vHu); 性质2: det(E(u,v; s))=1? s?vHu

性质3. Ln =0

性质4. 若对角矩阵D的元素各不相同,对于变换矩阵A有DA=AD, 则 A为对角矩阵。

定理1.17 任意n阶矩阵A与三角矩阵相似.

证明:对阶数n利用数学归纳法证明. 当n=1时显然成立. 设当阶数为n?1时定理成立。下面证明定理对n阶矩阵仍然成立,设x1,x2,…,xn是n个线性无关的列向量,其中x1为A的特征值?的特征向量,即A?x1=??x1,记P=(x1,x2,…,xn) 于是AP=(Ax1,Ax2,…,Axn)=(??x1,Ax2,…,Axn)

由于Axi?Cn,因此Axi可以由x1,x2,…,xn唯一地线性表示,即有 Axi=b1ix1+b2ix2+…+bnixn i= 2,3,…,n 于是AP=(??x1,Ax2,…,Axn)

??b12?0b22=(x1,x2,…,xn)??????0bn2??b1n???b2n? ?????bnn??即

??b12?b1n??0??1? PAP=?A1??????0?由归纳假定,对于n?1阶矩阵A1存在矩阵Q使得Q?1A1Q=U,

其中U为上三角矩阵. 记

R=

?10T???0Q?????10T?APR=??0Q-1????, S=PR, 则有

SAS=RP

?1?1?1

??b12?b1n??0?T??10???? ?A1?????0Q????0?=

??b12?b1n???b12?b1n??0??0???=?? -1QA1Q???U????????0??0?为上三角矩阵.

定理1.18 (Hamilton-Cayley) n阶矩阵A是其特征多项式的根, 即设?(?)=det(?I?A)=?n +a1?n?1+…+an-1?+an 则 ?(A) =An +a1An?1+…+an-1A+anI=0.

证明略.(可以对矩阵阶数n使用数学归纳法,利用定理1.17很简单的证明)

设对于n?1阶矩阵定理成立,那么对于n阶矩阵A, 由定理1.17可得存在可逆矩阵P和上三角矩阵R使得 P?1AP=R. 很明显,A和R有相同的特征多项式?(?),并且P?1?(A)P=?(R),因此如果能够证明?(R)=0,那么?(A)=0也就能够成立了。 事实上,设A的n个特征值为?1, ?2,…,?n,

?R1R=??0??, ?n??那么?(R)=(?1En?R) (?2En?R) ...(?n?1En?R) (?nEn?R)

=????????????nEn?1?R1??1En?1?R1??n?1En?1?R1…? ????0?n??n?0?1??n??0?n?1??n???其中?为n?1维列向量。根据上三角矩阵的乘积的对角块矩阵为相应对角块矩阵的乘积,那么 ?(R)=

推论:任何一个n阶可逆矩阵A的逆可以表示为A的次数不超过n?1的多项式,即A?1=g(A),其中g(x)的为次数不超过n?1的多项式.

定义19. 在所有首项系数为1的多项式中使得A成为它的根的最小次数多项式m(?)称为A的最小多项式。

定理1.19 矩阵A的最小多项式m(?)可整除以A为根的任意首项系数为1的多项式? (?), 且m(?)是唯一的。

定理1.20矩阵A的最小多项式m(?)和特征多项式? (?)的零点相同。

定理1.21 设n阶矩阵A特征多项式? (?),特征矩阵?I?A的全体n?1阶子式的最大公因式为d(?),则A的最小多项式为 m(?)=? (?)/d(?)

定理1.22 如果?1,?2,…,?s是矩阵A的互不相同的特征值,

(R1)????0?????E?R?????nn?11?, (?j??n)??00?j?n??x1,x2,…,xs是分别属于它们的特征向量, 那么x1,x2,…,xs线性无关。

定理1.23如果?1,?2,…,?k是矩阵A的互不相同的特征值,xi1,xi2,…,xi ri是属于?i的线性无关的特征向量, 那么x11,x12,…,x1r1,…, xk1,xk2,…,xkrk线性无关。 证明:对k利用数学归纳法可得结论.

不变子空间

定义1.20 如果线性空间V的线性子空间V1对线性变换T保持不变,即,任给x?V1 , 有Tx?V1, 则称V1为T不变子空间. 定义1.21 设T为线性空间V的线性变换,若V1为T不变子空间,这时T可以看作V1的线性变换,记T在V1上的限制为T|V1。

不变子空间的性质:

性质1. 不变子空间的和与交仍为不变子空间。

性质2. 线性变换T的值域R(T),核N(T)仍为不变子空间。

性质3. 设f(t)为多项式,则T的不变子空间为f(T)的不变子空间,N(f(T))为T的不变子空间,从而特征子空间

V?={x| Tx=?x}为T的不变子空间。

证明: 设V1为T的不变子空间,则任给x?V1有Tx?V1,从而 T2x=T(Tx)?V1,因此有Tkx?V1,对任何的非负整数成立。因此有V1为f(T)的不变子空间。

设x?N(f(T)), 则有f(T)x=0. 并且f(T)(Tx)=T(f(T)x)=0 因此Tx?N(f(T)),从而N(f(T))为T的不变子空间.

推论:若T为可逆变换,则T的不变子空间也是T?1的不变子空

间.

证明: 利用结论T?1可以表示为T的多项式,即T?1=g(T)可得结

论.

利用不变子空间简化线性变换的矩阵

定理1.27 设T是线性空间Vn的线性变换,且Vn可分解为s个T的不变子空间的直和 Vn=V1?V2?…?Vs 在每个不变子空间Vi中选取一个基

xi1,xi2,…,xini i =1,2,3,…,s

它们的合并构成Vn的一个基,则T在该个基下的矩阵为块对角矩阵 A=diag(A1,A2,…,As)

推论1: 线性变换可对角化的充要条件为存在一组特征向量构成的基。

推论2 设?1,?2,…,?k是线性变换T的全部的k互不相同的特征

值,则T可对角化的充要条件为

dim(N(?1I?T))+ dim(N(?2I?T))+…+ dim(N(?kI?T))= n 推论3 若线性变换T有n个互不相同的特征值,则T可对角化。

Jordan 标准形

定理1.28 设T是复数域C上的线性空间Vn的线性变换, 任取Vn的一个基, T在该基下的矩阵为A, T的特征多项式 ?(?)=det(?I?A)=(???1)m(???2)m?(???s)m

12s (m1+m2+…+ms=n)

则Vn可分解为不变子空间的直和 Vn=N1?N2?…?Ns

其中Ni={x| (T??iI)mx=0, x?Vn}是线性变换(T??iI)m的核空间。

ii若给每个子空间Ni选一个基,它们的并构成Vn 的基,且T在该个基下的矩阵为如下形式的对角块矩阵

?J1(?1)???J2(?2)? J???????Js(?s)??其中

??i?0Ji(?i)??????01?i?00??0?? ?1????i??定义1.21 在上面的定义中 J称为矩阵A的Jordan 标准形, Ji(?i)为(???iI)m对应的Jordan 块。

i

定理. 设矩阵A为复数域C的矩阵, 特征多项式的分解?(?)=det(?I?A)=(???1)m(???2)m?(???s)m

12s存在, 则存在非奇异矩阵P使得 P?1AP= J.

定理1.30 每个n阶复矩阵A都与一个Jordan 标准形相似,这个Jordan 标准形除去其中Jordan块的排列次序外,是由A唯一确定的。

欧氏(Euclid)空间

定义: 设V是实数域R上的线性空间,对V中任意两个x和y,按某种规则定义一个实数,用(x,y)表示,且满足下列四个条件: 1). 交换律:(x,y)=(y, x); 2). 分配律:(x,y+z)=(x, y)+(x,z) 3). 齐次性: (kx,y)=k (x,y), ? k?R

4). 非负性:(x,x)?0, 当且仅当 x=0时,(x,x)=0.

则称V为Euclid空间,简称欧氏空间或实内积空间.

思考:任意线性空间在它的两个向量能否定义内积, 若否,举例说明;若能,证明这一点。

例1.对于我们以前定义的线性空间V=Rn, x?y =((x13+y13)1/3,(x23+y23)1/3,…,(xn3+yn3)1/3 )T k☉x=k1/3?x

我们已经证明了这样定义的加法和数乘确实为线性空间。那么对于它的内积,我们可以定义为:(x,y)=(x1?y1)3 +(x2?y2)3+…+(xn?yn)3. 例2. 对于V=R+, x?y =x?y, k☉x=xk, 我们已经证明了这样定义的加法和数乘确实为线性空间。那么对于它的内积,我们可以定义为: (x,y)=logx?logy

例3. 对于例2的一维空间,我们可以使用笛卡尔乘积扩充为多维空间 V=R+?R+?…?R+, 对于任意x,y?V,x=(x1,x2,…,xn)T, y=(y1,y2,…,yn)T 定义 x?y =(x1?y1, x2?y2,…,xn?yn )T

k☉x=((x1)k, (x2)k,…,(xn)k)T,显然可以验证这样的加法和数乘确实构成一个线性空间。对于对于任意x,y?V,x=(x1,x2,…,xn)T, y=(y1,y2,…,yn)T 定义它们的内积为

(x, y)=log x1?log y1+log x2?log y2+…+log xn?logyn

这样我们对于这个n维线性空间,定义了一种内积。 例4. 对于一般线性空间V,我们可以在其上选择一个基X=(x1,x2,…,xn),那么对于任意两个向量x, y?V, 设它们的坐标分别为x?(?1,?2,…,?n)T, y?(?1,?2,…,?n)T,这时我们可以定义内积为 (x,y)=?1??1+?2??2+…+?n??n

容易验证这样的定义仍然满足内积的条件。显然这样定义的内积与基函数的选择有关。我们可以讨论这样定义的两个不同基之间的内积的关系。(留作思考题)

作业题:针对例3中定义的线性空间,求出它的一个基,对这个基给出由例4中定义的内积,然后比较这样定义的内积和例3中定义的内积的关系。

定义: 在Euclid空间中,非负实数(x,x)称为向量x的长度(或模,范数), 记为||x||或|x|.

定义: 非零向量x和y的夹角定义为

=arccos

性质1 (x,k?y)=k (x,y) 性质2 (x,0)=(0,x)=0 性质

n?n?nn?3.????ixi,??jyj?????i?j(xi,yj) j?1?i?1?i?1j?1(x,y)

||x||?||y||定义Gram矩阵A=(aij)=( (xi,xj) ), 其中X=(x1,x2,…,xn)为一个基。 性质4. Schwarz不等式 |(x,y)|? ||x||?||y||

证明:给定的m个向量x1,x2,…,xm,对于m维向量 ?=(?1, ?2,…,?m)T, 作y=?1?x1+?2?x2+…+?m?xm, 则二次型 F(?)=||y||=(y, y)=

2

m?m?mmT

???ixi,??jxj?????i?j(xi,xj)=?B?? 0

j?1?i?1?i?1j?1其中B=(bij)二次型的矩阵。由于对于任意的m维向量?,二次型F(?)为非负的。因此矩阵B为半正定矩阵,从而det(B)?0 特别的,当m=2时令x1=x,x2 =y有, B=??(x,x)(x,y)??

?(y,x)(y,y)?从而0?det(B)=(x,x)?(y,y)?(x,y)2,即为Schwarz不等式。等号成立的充要条件为x和y相关.

推论:设x,y?Rn,A为对称正定矩阵,则 |xTy| ? xTAx?yTA?1y (证明留作思考题)

性质5. 三角不等式 ||x+y||?||x||+||y||

性质6. (Reize表示定理) Euclid空间Vn中所有的线性函数都可表示为内积形式, 即设l(x)为Vn为的一个线性函数, 则一定存在一个向量 ul ?Vn使得对任一x?Vn有l(x)=(ul,x).

正交性

Euclid空间的向量正交性: x和y正交的定义为(x,y)=0,

记为x ?y.

定理: Euclid 空间的向量x和y正交的充要条件为

||x+y||2=||x||2+||y||2

定义:如果Euclid空间中的一组非零向量两两正交则称之为正交

向量组。

定理: 正交向量组一定线性无关。

定义:在Euclid空间Vn中,n个正交向量组成的极大线性无关

组构成Vn的正交基。由单位向量组成的正交基为标准正交基。

定理:任意Euclid空间Vn中存在一组正交基。对任意一组Vn

的一个基x1,x2,…,xn,存在一组正交基y1,y2,…,yn满足L(x1,x2,…,xi)=L(y1,y2,…,yi) , i=1,2,…,n成立。 证明过程就是 Gram-Schmidt正交化过程。

子空间的正交性: 设Euclid空间Vn的两个子空间V1和V2满

足任给x?V1, y?V2满足(x,y)=0, 则称V1和V2正交。 子空间的正交补:设Euclid空间Vn的子空间V1,它的正交补定

义为V1?={x| (x,y)=0, ?y?V1 , x ?Vn}. 定理: V1?V1?=Vn 定理: 对任意矩阵A?Rm?n, 有

R?(A)=N(AT), R(A)?N(AT)=Rm R?(AT)=N(A), R(AT)?N(A)=Rn

正交变换及其正交矩阵表示

定义:设V为Euclid空间,T为其线性变换,如果T保持V中

任意向量x的长度不变,即||x||=||Tx||,则称T为正交变换。 定理 T为正交变换的充要条件为保持内积不变,即 (x,y)=(Tx,Ty).

定义:若方阵Q满足 QTQ=I或Q?1=QT,

则称Q为正交矩阵。

定理(正交变换的矩阵表示). Euclid空间的线性变换为正交变换的充要条件为它对于标准正交基的矩阵是正交矩阵。

正交矩阵的性质: 性质1. 正交矩阵非奇异.

性质2. 正交矩阵的逆矩阵仍是正交矩阵. 性质3. 正交矩阵的乘积仍是正交矩阵。 性质4. 正交基变换矩阵为正交矩阵。 性质5. 正交矩阵的特征值位于单位元。

对称变换和对称矩阵

定义1.30 设T是欧氏空间V的一个线性变换,且对V中任意两个向量x,y都有

(Tx,y)=(x,Ty)

成立,则称T为V中一个对称变换。

定理: 在Euclid 空间中线性变换是实对称变换的充要条件为它在标准正交基下的矩阵为对称矩阵。

定理:实对称矩阵的特征值都为实数,属于不同特征值的特征向量互相正交。

定理:任何实方阵都可以分解成两个实对称矩阵的乘积.

酉空间介绍:

定义: 设V是复数域C上的线性空间,对V中任意两个x和y,按某种规则定义一个复数,用(x,y)表示,且满足下列四个条件: 1). 交换律:(x,y)= (y, x),此处 (y, x)为(y,x)的复共轭; 2). 分配律:(x,y+z)=(x, y)+(x,z) 3). 齐次性: (kx,y)=k (x,y), ? k?C

4). 非负性:(x,x)?0, 当且仅当 x=0时,(x,x)=0.

则称V为酉空间,简称复欧氏空间或复内积空间.

Euclid 空间的所有性质均可平行推广到复内积空间中,在此不一一罗列。可参看教材。

在此特别指出几个特别重要的地方:

1.酉变换T在标准正交基下的矩阵为酉矩阵A满足AHA=AAH=I.

2.Heirmite变换T在标准正交基下的矩阵A为Hermite矩阵,

即满足 (Tx,y)=(x,Ty) 即 A=AH .

3. Heirmite矩阵的谱分解:设A为Heirmite矩阵, 则

A=?1 p1?(p1)H+?2 p2?(p2)H+…+?n pn?(pn)H 其中?i 和pi分别为A的特征值和特征向量。

应用谱分解证明:若A和B都为正定Heimite矩阵,则C=A?B仍为正定Heirmite矩阵,其中,cij = aij ?bij,即C的每个元素为A和B元素的乘积。

需要特别讨论和注意的几个相似性定理:

定理1.41. 1).设A?Cn?n,则存在酉矩阵P使得 PHAP=U,其中U

为上三角矩阵。

2) 设A?Rn?n且它的所有特征值为实数,则存在正交矩阵Q使得 QTAQ=U,其中U为上三角矩阵。 定义:设A?Cn?n且AHA=AAH,则称A为正规矩阵.

定理1.42:1).设A?Cn?n,则A酉相似于对角矩阵的充要条件为

A为正规矩阵,即存在酉矩阵P使得 PHAP=D,其中D为对角矩阵.

2)设A?Rn?n且它的所有特征值为实数,则A正交相似于对角矩阵的充要条件为A为正规矩阵,即存在正交矩阵Q使得 QTAQ=D,其中D为对角矩阵。 定理1.17 任意n阶矩阵与上三角矩阵相似.

定理1.30 每个n阶复矩阵A都与一个Jordan 标准形相似,这个Jordan 标准形除去其中Jordan块的排列次序外,是由A唯一确定的。

向量的正交化

给定一组线性无关的向量x1,x2,…,xn,求取一组正交向量z1,z2,…,zn使得L(x1,x2,…,xk)=L(z1,z2,…,zk),k=1,2,…,n 1). Gram-Schmidt正交化过程

y1=x1

y2=x2??12y1 , ?12= (x2,y1)/(y1,y1)

y3=x3??13y1 ??23y2, ?13=(x3,y1)/(y1,y1),?23=(x3,y2)/(y2,y2) y4=x4??14y1 ??24y2??34y3, ?14=(x4,y1)/(y1,y1),

?24=(x4,y2)/(y2,y2),?34=(x4,y3)/(y3,y3)

yn=xn??1ny1 ??2ny2?…??n?1,nyn?1, ?1n=(xn,y1)/(y1,y1),

?2n=(xn,y2)/(y2,y2),?n?1,n=(xn,yn?1)/(yn?1,yn?1)

最后还需要将所得的正交向量单位化,得到标准正交向量组 z1=y1/||y1||,z2=y2/||y2||,…,zn=yn/||yn||. 这个过程就称为Gram-Schmidt正交化过程

但是为了数值稳定性,我们有时使用所谓列正交化过程,其计算过程可以表示如下: 设y1(0)=x1,y2(0)=x2,…,yn(0)=xn 对于l=1,2,3,…n,计算

zl=yl(l?1)/||yl(l?1)||, 对于k= l, l+1,…,n yk(l)=yk(l?1)??lkzl, 其中?lk=(yk(l?1), zl)

这时可以证明这样得到的z1,z2,…,zn和行正交化过程得到的理论上完全相同,但在数值稳定上列正交化过程更稳定。

本文来源:https://www.bwwdw.com/article/curp.html

Top