1.2 线性变换及其矩阵

更新时间:2023-08-31 22:55:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

线性变换及其矩阵

§1.2 线性变换及其矩阵

在讲线性空间之前我们说:“空间”是定义一些结构的能够容纳运动的对象集合,而变换则规定了对应空间的运动。由于变换的存在使得线性空间研究由静态的量的研究转化为了动态的元素之间关系的研究。那么,线性空间中的变换是如何定义的呢?它的实质又是什么呢?在本节中,我们将主要解决这一问题。

在开始定义线性变换之前,我们首先来回顾一下线性系统的定义: 线性系统的一个基本特征就是其模型方程具有线性属性即满足叠加原理。叠加原理是说:若线性系统的数学描述T(T看作是信号空间上的变换),则对任意两个输入信号x和y以及任意两个非零常数c1和c2,下述关系式满足:

部请勿

一、 线性变换

下面,我们给出一般线性空间上的线性变换的定义

T(c1x+c2y)=c1Tx+c2Ty

1. 线性变换及其性质

设V是数域K上的线性空间, T是V上的变换,若T满足:对

x,y∈V, k,l∈K,T(kx+ly)=k(Tx)+l(Ty),则称T是V上的线性变换。

那么线性变换具有什么性质呢?我们来看一下。 线性变换的性质:

(1) Tθ=T(0x+0y)=0(Tx)+0(Ty)=θ

(2) T( x)=T(( 1)x+0y)=( 1)(Tx)+0(Ty)= (Tx)

(3) x1,x2,...,xm∈V线性相关 Tx1,Tx2,...,Txm线性相关 (4) x1,x2,...,xm∈V线性无关Tx1,Tx2,...,Txm线性无关

(5) T是V上的线性变换 T(x+y)=Tx+Ty,T(kx)=k(Tx),( x,y∈V, k∈K) 例:矩阵空间Rn×n,给定矩阵Bn×n,则变换TX=BX+XB( X∈Rn×n)是Rn×n的线性变换。

例:把线性空间R2中的所有向量均绕原点依顺时针方向旋转φ角的变换,就是

线性变换及其矩阵

η1 α1

一个线性变换。这时象 与原象 之间的关系为:

α2 η2

η1 cosφ

η = sinφ 2

sinφ α1

α cosφ 2

在该例中,如果在做过一次变换的基础上再进行一次变换,那么新的变换应该怎么表示呢。下面我们讨论与之相关的线性变换的运算。 2.线性变换的运算及运算规律

为给出线性变换的运算,我们首先给出单位变换与零变换的概念: 零变换T0:T0x=0 单位变换Te:Tex=x

线性变换的运算:(请大家自行验证下面定义的变换仍为线性变换) 变换的加法:定义 (T1+T2)x=T1x+T2x

数乘:定义 (kT)x=k(Tx)

资请勿

mdef

负变换:定义 (-T)x=-(Tx)

料外

m

注:V上所有变换构成的集合在以上加法运算和数乘运算下构成线性空间,记为

变换的乘法:定义 (T1T2)x=T1(T2x)

逆变换:若T,S为V上的线性变换,且满足(ST)x=(TS)x=x( x∈V),则称T在V上是可逆的,其逆变换为S,记作逆变换T-1=S。

幂变换:设T为V上的线性变换,则T=Tm 1T也为V上的线性变换,称为幂变换。

多项式变换:设T为V上的线性变换,多项式f(t)=∑aiti

i=0

Hom(V)。

(ai∈K),则

f(T)=∑aiTi

i=0

m

也为V上的线性变换,称为多项式变换。

上面讨论了线性变换的定义与运算,那么我们如何将抽象的线性变换形象化的进行表示呢。下面我们探讨线性变换与矩阵的关系。 3. 线性变换的矩阵表示

根据线性变换的定义,要想确定一个线性变换,似乎需要把线性空间中所有

线性变换及其矩阵

元素的象都找出来。事实上不必如此,由于线性空间中所有元素都可以由其基表示,因此,只要求出基元素的象即可。

设T是Vn上的线性变换,x1,x2,...,xn是Vn的基, x∈Vn,且x=a1x1+a2x2+

...+anxn,则Tx=a1Tx1+a2Tx2+...+anTxn,故,只需要确定Tx1,Tx2,...,Txn即可确定任意元素的象。

由于Tx1,Tx2,...,Txn仍属于Vn,因此令

写成矩阵形式

a12a22 an2

a1n a

Txn=a1nx1+a2nx2+ +annxn=(x1,x2, ,xn) 2n

ann

a11 a

Tx1=a11x1+a21x2+ +an1xn=(x1,x2, ,xn) 21

an1 a12 a

Tx2=a12x1+a22x2+ +an2xn=(x1,x2, ,xn) 22

an2

a11 a

T(x1,x2, ,xn)=(Tx1,Tx2, ,Txn)=(x1,x2, ,xn) 21

an1

a12a22 an2

a1n a2n

ann

其中,

a11 aA= 21

an1

a1n a2n

ann

称A为线性变换T在基x1,x2,...,xn上的矩阵。

线性变换运算后的矩阵表示是什么呢?我们有以下定理:

定理:设线性空间Vn的基为x1,x2,...,xn,线性变换T1与T2的表达矩阵分别为A与

线性变换及其矩阵

B,则 (1) T1+T2在该基下的表达矩阵为A+B (2) kT1在该基下的表达矩阵为kA (3) T1T2在该基下的表达矩阵为AB (4) T1 1在该基下的表达矩阵为A 1

(5) 线性变换的多项式f(T)=∑aiTm i在该基下的矩阵为矩阵

i=0m

多项式f(A)=∑aiAm i

i=0

m

证:T1(x1,x2, ,xn)=(x1,x2, ,xn)A,T2(x1,x2, ,xn)=(x1,x2, ,xn)B

由此可得

TT12(x1,x2, ,xn)=T1[T2(x1,x2, ,xn)]=T1[(x1,x2, ,xn)B]

左=T(∑ci1xi,...,∑cimxi)=(∑ci1Txi,...,∑cimTxi)=(Tx1,Tx2, ,Txn)C=右

(3) 先证: C=(cij)n×m,T[(x1,x2, ,xn)C]=[T(x1,x2, ,xn)]C

(1) 略, (2)略。

1

(4) 记T1 1=T2,则TT12=T2T1=Te AB=BA=I B=A

(5)可证。 (5) 根据以上结论,

上面我们给出了线性变换的矩阵表示,那么线性变换与矩阵之间到底是一种什么关系呢?下面我们给出解答。 4. 线性变换空间与矩阵空间的同构

数域K上的n维线性空间Vn上所有线性变换所构成的线性空间为Hom(Vn),并给定Vn的一个基x1,x2,...,xn。设σ是Hom(Vn)到Kn×n上的映射

其中A为线性变换T在基x1,x2,...,xn下的表达矩阵。 关于映射σ,我们有如下引理:

σ:Hom(Vn)→Kn×n

T→σ(T)=A

=[T1(x1,x2, ,xn)]B=(x1,x2, ,xn)AB

线性变换及其矩阵

引理:映射σ是单射

证:设T1≠T2∈Hom(V),且σ(T1)=A1,σ(T2)=A2 只需证A1≠A2即可。采用反证法可以证明。 引理:映射σ是满射

证:给定Vn的基x1,x2,...,xn和矩阵A时,可以确定基象组。Tx1,Tx2,...,Txn。

x∈Vn,设其在基x1,x2,...,xn下的坐标为α,定义变换

Tx=(Tx1,Tx2,...,Txn)α

可以证明T是线性变换。

从而,给定矩阵,在基确定的情况下可以找到相应的线性变换。因此,该引

根据上述两个引理与上面定理的第一、二条,我们得到下述结论: 定理:在选定一组基后, Hom(Vn)与Kn×n同构,且它们的维数为n2

理成立。

例:零变换对应于零矩阵,数乘变换对应于数量矩阵。

“矩阵是线性空间中的线性变换的一个描述。在一个线性空间中,只要我们选定一组基,那么对于任何一

理解这句话的关键,在于把“线性变换”与“线性变换的一个描述”区别开。一个是那个对象,一个是对那个对象的表述。就好像我们熟悉的面向对象编程中,一个对象可以有多个引用,每个引用可以叫不同的名字,但都是指的同一个对象。如果还不形象,那就干脆来个很俗的类比。

比如有一个人,你打算给它拍照片,只要你给照相机选定了一个镜头位置,那么就可以给这个人拍一张照片。这个照片可以看成是这个人的一个描述,但只是一个片面的的描述,因为换一个镜头位置给这个人拍照,能得到一张不同的照片,也是这个人的另一个片面的描述。所有这样照出来的照片都是这同一个人的描述,但是又都不是这个人本身。

同样的,对于一个线性变换,只要你选定一组基,那么就可以找到一个矩阵

个线性变换,都能够用一个确定的矩阵来加以描述。”

好了,现在我们可以给出了线性变换与矩阵之间的关系了:

线性变换及其矩阵

来描述这个线性变换。换一组基,就得到一个不同的矩阵。所有这些矩阵都是这同一个线性变换的描述,但又都不是线性变换本身。但是这样的话,问题就来了如果你给我两张照片,我怎么知道这两张照片上的是同一个人呢?同样的,你给我两个矩阵,我怎么知道这两个矩阵是描述的同一个线性变换呢?如果是同一个线性变换的不同的矩阵描述,那就是本家兄弟了,见面不认识,岂不成了笑话。现在,我们来解决这一问题,顺带着解决象与原象坐标之间的关系。 5. 不同基下的线性变换,象与原象坐标间的关系

n

V定理:设线性空间的基为(I)x1,x2,...,xn,(II)y1,y2,...,yn,由基(I)到(II)的过渡

矩阵为C,V上的线性变换T:

n

T(y1,y2, ,yn)=(y1,y2, ,yn)B,

1

则B=CAC。

部内

B=C 1AC。

资请勿外传

证:因为

T(y1,y2, ,yn)=T[(x1,x2, ,xn)C]=[T(x1,x2, ,xn)]C=[(x1,x2, ,xn)A]C

1

=(x1,x2, ,xn)A=(y1,y2, ,yn)CAC

T(y1,y2, ,yn)=(y1,y2, ,yn)B

好了,我们找到了同一个线性变换的矩阵兄弟们的一个性质,那就是: 若矩阵A与B是同一个线性变换的两个不同的描述(之所以会不同,是因为选定了不同的基,也就是选定了不同的坐标系),则一定能找到一个非奇异使得A、B之间满足这样的关系:B=C 1AC。称满足此关系的矩阵A、矩阵C,

B为相似矩阵,记为A~B。

定理:设线性空间Vn的基为x1,x2,...,xn,线性变换T的表达矩阵为A, x∈Vn的

α1 β1 β1 α1

,Tx的坐标为 ,则 =A 。 坐标为 αn βn βn αn

T(x1,x2, ,xn)=(x1,x2, ,xn)A,

线性变换及其矩阵

α1 β1 , Tx=(x, ,x) , 证:x=(x1, ,xn) 1n αn βn

α1 α1

=(x, ,x)A

又因 Tx=(Tx1, ,Txn) 1n

αn αn

β1 α1

=A 。 证毕。

综上,

βn αn

既然线性变换与矩阵具有上述紧密的联系,下面我们将上一节中矩阵值域与核的概念推广到线性变换上去。 6. 线性变换的值域与核

V上的线性变换T的值域: R(T)={ Tx |x∈V}

定理:线性空间V的线性变换T的值域和核都是V的线性子空间,分别称为T

V上的线性变换T的核: N(T)={ x | Tx=θ, x∈V}

的象空间和核空间。

y1∈R(T) x1∈V,st

证:(1)V非空 R(T)非空。

y2∈R(T) x2∈V,st

y1+y2=Tx1+Tx2=T(x1+x2)∈R(T)(∵x1+x2∈V)ky1=k(Tx1)=T(kx1)∈R(T)(∵ k∈K,kx1∈V)

故,R(T)是V的子空间。

(2) θ∈V,Tθ=θ θ∈N(T) N(T)非空。

x,y∈N(T) T(x+y)=Tx+Ty=θ x+y∈N(T) x∈N(T), k∈K T(kx)=kTx=θ kx∈N(T)

y1=Tx1y2=Tx2

故,N(T)是V的子空间。

注:定义T的秩=dimR(T), T的亏=dimN(T)。

定理:设线性空间Vn的基为x1,x2,...,xn,T是Vn上的线性变换,则

线性变换及其矩阵

R(T)=L(Tx1,Tx2,...,Txn),dimR(T)+dimN(T)=n

证:(1)先证R(T) L(Tx1,Tx2,...,Txn):

y∈R(T) x∈Vn,sty=Tx

x=c1x1+c2x2+...+cnxn y=c1(Tx1)+c2(Tx2)+...+cn(Txn)∈L(Tx1,Tx2,...,Txn) 再证R(T) L(Tx1,Tx2,...,Txn):

y∈L(Tx1,Tx2,...,Txn) c1,c2,...,cn,sty=c1(Tx1)+c2(Tx2)+...+cn(Txn)

xi∈Vn Txi∈R(T) y=c1(Tx1)+c2(Tx2)+...+cn(Txn)∈R(T)

(2)设dimN(T)=m,且N(T)的基为y1,y2,...,ym,扩充为Vn的基

km+1ym+1+...+knyn=l1y1+...+lmym

( l1)y1+...+( lm)ym+km+1ym+1+...+knyn=θ

因为T是Vn上的线性变换,所以km+1ym+1+...+knyn∈N(T),故

因y1,y2,...,ym,ym+1,...,yn线性无关,所以km+1=...=kn=0,因此,Tym+1,...,Tyn线性无关,从而dimR(T)=n m,即dimR(T)+dimN(T)=n。 证毕。

ξ1 ξ1+ξ2 3ξ3 ξ4

ξ 3ξ ξ 3ξ+4ξ 234 4

, 例:向量空间R中,x= ,线性变换T为Tx= 12

ξ3 0 ξ0 4

求R(T),N(T)的基与维数。

解:(1)取R4的简单基e1,e2,e3,e4,计算

T(km+1ym+1+...+knyn)=θ

设数组km+1,...,kn使得km+1(Tym+1)+...+kn(Tyn)=θ,则

则 R(T)=L(Ty1,Ty2,...,Tym,Tym+1,...,Tyn)=L(Tym+1,...,Tyn)

y1,y2,...,ym,ym+1,...,yn

线性变换及其矩阵

1 1 3 1 3 1 3 4 Te1= ,Te2= ,Te3= ,Te4=

0 0 0 0 0 0 0 0

该基象组的一个最大线性无关组为Te1,Te2。 故dimR(T)=2,且R(T)的一个基为Te1,Te2。

ξ1 11 3 1

ξ 3 1 34

,则N(T)={x|Tx=θ}={x|A 2 =0} (2)记A=

ξ3 0000

0000 ξ4

ξ1 3 3 ξ 3 7 2

A =0的基础解系为 , 。 ξ3 2 0 ξ 0 4 4

dimR(T)=rankA,dimN(T)=n rankA。

证:(1)rankA=m A的列向量组中极大线性无关组的长度为m

元素组Tx1,Tx2,...,Txn中极大线性无关组的长度为m dimR(T)=dimL(Tx1,Tx2,...,Txn)=m

(2)由前述定理知另外一个结论成立。

二、 线性变换的特征值问题

物理、力学和工程技术中很多问题在数学上都归结为求特征值问题。例如,振动问题(大型桥梁或建筑物的振动、机械的振动、电磁震荡等),物理学中的某些临界值的确定。 1. 特征值与特征向量

例:线性空间Vn中的线性变换T在基x1,x2,...,xn上的表达矩阵为A,则

3 3

3 7

故,dimN(T)=2,且N(T)的一个基为 , 。

2 0 0 4

线性变换及其矩阵

1.1特征值、特征向量的定义

T是数域K上的线性空间V的一个线性变换,如果对于数域K中的某个元素λ0,存在一个非零向量x,使得

Tx=λ0x

那么称λ0为T的一个特征值,而x称为T属于特征值λ0的一个特征向量。 注:特征向量的方位经线性变换后不变,只是长度发生变化

注:每一个特征值对应的特征向量可能不唯一,但每个特征向量对应唯一的特征值。

取定V的一组基底x1,x2,...,xn,设T在这组基下的表达矩阵是A,元素x在这组基下的坐标是α=[α1,α2,...,αn]T,那么我们有

(*)

特征向量。

(*)表明如果λ0为线性变换的一个特征值,那么λ0必定是 (λ)=0的一个根 如果λ0是 (λ)=0的一个根,那么det(λ0I A)=0 (λ0I A)α=0有非零解

x=(x1,x2,...,xn)α满足Tx=λ0x

从而,欲求线性变换的特征值与特征向量只需求出其表达矩阵的特征值与特征向量即可。

1.2线性变换的特征值与特征向量求法:

(1) 选定线性空间的一个基底,求线性变换T在此基底下对应的矩阵A; (2) 求解矩阵A的特征多项式 (λ)=det(λI A)的所有根;

特征值或特征根,而其相应的方程(λ0I A)α=0的非零解称为A属于特征根λ0的

+a1λn 1+ +an 1λ+an,称为A的特征多项式,其中。 (λ)=0的根λ0称为A的

称λ0I A为A的特征矩阵,A的特征矩阵的行列式 (λ)=det(λI A)=λn

线性变换及其矩阵

(3) 求出矩阵A的每一个特征值对应的特征向量; (4) 以A的特征向量为坐标求出对应的特征向量。 例:设

T:R3→R3

ξ1 2ξ1 2ξ2+2ξ3 →Tx= 2ξ ξ+4ξ

x= ξ123 2 ξ3 2ξ1+4ξ2 ξ3

(1) 求证: T是R上的一个线性变换,

3

1 0 0 3

(2) T在R的一个基e1=0,e2=1,e3=0下的表达矩阵是A

0 0 1

解:(1)的证明略

λ 2

2 2

λI A=

所以A的特征值是 λ1=3 (二重)与λ2= 6。 对于特征值λ1=3,解齐次线性方程组

2 2 1 12 2

α=0 000 α=0, (3I A)α=0 24 4

2 44 000

得到一个基础解系:

2 2

1 , 0 0 1

从而T的属于λ1=3的极大线性无关特征向量组是

4

2λ+1

λ+1

(3)求T的特征值等价于求对应表达矩阵的特征值和特征向量。

2

4=(λ 3)2(λ+6)

2 22

214 (2) 省略过程, T在基e1,e2,e3下的表达矩阵为A=

24 1

(3) 求 T的全部特征值与特征向量。

线性变换及其矩阵

y1= 2e1+e2,

y2=2e1+e3

于是T属于 3的全部特征向量是

k1e1+k2e2,k1,k2∈K,k1,k2不同时为零

对于特征值λ2= 6,解齐次线性方程组

82 2 ( 6I A)α=0 2 5 4 0 18 18 2 αr×1→r5=02 3

2 5 4 α=0 01 5 r2×4→r1

2 4 0 9 9 00

得到一个基础解系:

1

2 2

从而 T 的属于 λ2= 资

6的极大线性无关特征向量组是

于是 T 的属于部

y3=e1+2e2 2e3

λ传

2= 6 的全部特征向量

ky外

3,0≠k∈K。

1.3 几个结论

设矩阵A的特征多项式 请

A(λ)所有根为λ1, ,λn(可能有重根),则

A(λ)=(λ λ1)* *(λ λn)=λn (λ1+ +λn)λn 1+ +( 1)nλ1 λn 又因,

λ a11

a12

a1n a21λ a22

a2n

A(λ)=det(λI A)=

an1

an2

λ ann

=λn (a11+ +ann)λn 1+ +( 1)ndetA

从而,我们得:

Δ

(1)λ1+ +λn=a11+ +ann=tr(A),tr(A)称为矩阵A的迹(trace)。

4 1 α0 =0

线性变换及其矩阵

(2)detA=λ1 λn

关于矩阵的迹,我们有如下结论:

定理:设A=(aij)m×n,B=(bij)n×m,则tr(AB)=tr(BA) 证:证明请参照教材P48,定理1.12. 定理:相似矩阵具有相同的迹。 证:证明请参照教材P48,定理1.13. 注:该定理表明迹是相似不变量。

定理:相似矩阵具有相同的特征多项式与特征值。 证:设B=P 1AP,则

det(λI B)=det(λI P 1AP)=det(P 1(λI A)P)=detP 1det(λI A)detP=det(λI A)

注:该定理表明,特征多项式与特征值是相似不变量。线性变换的矩阵的特征多项式与基的选择无关,它直接被线性变换所决定。

i=1

证:det(λI A)=

λI A2

λI A1

det(λI A)= det(λI Ai)

m

λI Am

2 线性变换的零化多项式与最小多项式

2.1 Hamilton-Cayley 定理

首先,我们看一下Hamilton-Cayley 定理的内容,然后给出证明。 定理:(Hamilton-Cayley 定理)设An×n, (λ)=det(λI A)=λn+a1λn 1+

+an 1λ+an,则 (A)=An+a1An 1+ +an 1A+anI=On×n

10 10 2例:考虑较为简单的矩阵A= ,则 (λ)=λ 3λ+2,将A= 12 代入该12 10 10 10 10

32=O2×2。 +式可得 (A)=

12 12 12 01

mi=1

定理:设A1,A2,...,Am均为方阵,A=diag(A1,A2,...,Am),则

=∏det(λI Ai)。

线性变换及其矩阵

为给出矩阵论中极为重要的Hamilton-Cayley 定理,首先给出下述引理。 引理:An×n相似于三角矩阵。

证:归纳法。n=1时,A=(a11)是上三角矩阵 A相似于上三角矩阵 假设n=k 1时定理成立,下证n=k时定理也成立。

设Ak×k的特征值为λ1,λ2,...,λk,对应λ1的特征向量为x1 Ax1=λ1x1,扩充x1为Ck的基:x1,x2,...,xk(列向量)。

令P1=(x1,x2,...,xk),则P1可逆,且AP1=(Ax1,Ax2,...,Axk)

Axj∈Ck Axj=b1jx1+b2jx2+...+bkjxk

λ1b12

0b

22 AP1=(x1,x2,...,xk)

0bk2

(j=1,2,...,k) b1k b2k

bkk

资部

A1的特征值为λ2,...,λk,由假设知,存在k 1阶可逆矩阵Q使得

λ2 *

Q 1A1Q=

λk

10 0

ΔΔ0 令 P2=, P=PP12,则 Q 0

由归纳法原理,对任意n定理成立。 Hamilton-Cayley 定理的证明:

A的特征值为λ1,λ2,...,λn (λ)=(λ λ1)(λ λ2)...(λ λn)。

λ1 *

。 P 1AP=

λk

λ1b12 0

1 P1AP1=

0

A1

b1k

线性变换及其矩阵

λ1 *

由上述引理,存在逆矩阵P1AP= n×n,使得P 。 λ

n

(P 1AP)

=(P 1AP λ1I)(P 1AP λ2I)...(P 1AP λnI) 0

* * λ1 λ2*

* = λ2 λ1 0

λ1 λn*

* *

λn λ

1 λ λn 1 λn

n λ2

0

0**

*

* *

0 λ1 λ3

0* * λ* * * λ1 λn*

2 λ3

= 0

0

0*

*

*

λ*

n 1 λn 0

0*

λ λ

0

n3

=O料

n×n

P 1 (A)P=O部

(A资

)=O。

注:|A|≠0 a内

n≠0,A 1=

1a(An 1

+ann

21A+ +an 1I) 注:An∈span{An 1,...,A,I} 2.2 Hamilton-Cayley 定理的应用勿

11 1

例:A= 111 ,计算A100+2A50

0 12

解:令f(λ)=λ100+2λ50, (λ)=det(λI A)=(λ 1)2(λ 2)

(λ)除f(λ):f(λ)= (λ)g(λ)+(b0+b1λ+b2λ2)

f'(λ)=[ (λ)g(λ)]'+(b1+2b2λ)

由f(1)=3,f'(1)=200,f(2)=2100+251,得

b0+b1+b2=3

b10051

b2b 0=2+2 400 b10152

1+2=2001= 2 2+606

bb

0+21+4b2=2100+251 b2=2100+251 203

* * 0

线性变换及其矩阵

从而, (A)=O f(A)=b0+b1A+b2A2

2.3零化多项式与最小多项式

零化多项式:给定多项式g(λ),若g(A)=0,则称g(λ)为A的零化多项式

由该定义可以看出,矩阵可能对应多个零化多项式(特征多项式是其中一个),它们之间到底有什么关系呢?下面我们研究这一问题。

最小多项式:以An×n为根,且次数最低的首1多项式,记作m(λ)。

f(λ)=1 f(A)=I≠O m(λ)≥1

(λ)=det(λI A) (A)=O m(λ)≤n

f2(λ)=(λ 2)(λ 4):f2(A)=(A 2I)(A 4I)=O m(λ)=f2(λ)

定理:(1)多项式f(λ)满足f(A)=O m(λ)|f(λ),(2)m(λ)唯一。

f1(λ)=λ+k( k∈R):f1(A)=A+kI≠O m(λ)>1

3 32

, (λ)=det(λI A)=(λ 2)2(λ 4) 15 2例:A=

130

证:(1)反证法。

m(λ)/|f(λ) f(λ)=m(λ)g(λ)+r(λ)

(λ)都是A的最小多项式,则 (2)设m(λ)与m

(A)=O m(λ)|m (λ) 首1m

(λ) m(λ)=m

(λ)|m(λ) m(A)=O m

定理:不计重数时,m(λ)与 (λ)的零点相同。

证: 上一定理 m(λ)的零点是 (λ)的零点。再设λ0是 (λ)的零点,则有

Ax=λ0x(x≠0) m(A)x=m(λ0)xm(A)=O m(λ0)x=0 m(λ0)=0,

(A)=O,m(A)=O

m(λ)不是A的最小多项式,矛盾!

线性变换及其矩阵

因此,λ0也是m(λ)的零点。 得证。 注:该定理表明m(λ)一定含 (λ)的全部单因式。但m(λ)不一定是 (λ)的全部

11

, (λ)=(λ 1)2,m(λ)≠(λ 1)单因式的乘积。例:A= 01 定理:An×n相似于Bn×n mA(λ)=mB(λ) 证:B=P 1AP A=PBP 1

1)取f(λ)=mA(λ),则f(A)=mA(A)=O,从而有

f(B)=f(P 1AP)=P 1f(A)P=O

从而,mB(λ)|f(λ),即mB(λ)|mA(λ)。

2)取g(λ)=mB(λ),则g(B)=mB(B)=O,从而有

g(A)=g(PBP 1)=Pg(B)P 1=O

从而,mA(λ)|g(λ),即mA(λ)|mB(λ)。

根据1)2),mA(λ)=mB(λ)。 2.4 最小多项式求法 定理:对An×n,mA(λ)=式}

证:该证明从略。

3 32

,求m(λ)。 152 例:设A=

130 解:

3 2 λ 3

,λI A= 1λ 52

1 3λ

Dn(λ)= (λ)=det(λI A)=(λ 2)2(λ 4)

Dn(λ)

,其中Dk(λ)=最大公因式{A(λ)的所有k阶子

Dn 1(λ)

线性变换及其矩阵

M11=λ2 5λ+6,M21=3(λ 2),M31=2(λ 2)M12=λ 2,M22=λ2 3λ+2,M32=2(λ 2)

M13= (λ 2),M23= 3(λ 2),M33=λ2 8λ+12

Dn 1(λ)=(λ 2)m(λ)=

Dn(λ)

=(λ 2)(λ 4)

Dn 1(λ)

三、 线性变换的最简矩阵表示

线性变换在不同的基下的表示矩阵是相似的,那么,这些相似矩阵中必有最简单的一个。这个最简单的矩阵称为线性变换的最简矩阵表示。如果能找到它,显然会给线性变换的研究带来方便。

位变换,这有些特殊。另外,数量矩阵对应的数乘变换也有些特殊。比上述三种矩阵稍微复杂一些的是对角矩阵。我们来考虑具有这种矩阵表示的线性变换。具

1):什么样的线性变换会有对角矩阵表示?

2):如果一个线性变换具有对角矩阵表示,那么它关于哪个基才有对角矩阵

3):如果线性变换没有对角矩阵表示,那么它的最简矩阵表示具有什么形式呢?

下面,我们将逐步的解决上述问题。

1 线性变换的对角矩阵表示

1.1问题的提出与解决

在线性系统中,通常需要采用一定的变换实现矩阵的最简表示,从而实现变量的最简耦合。那么矩阵的最简表示具有什么形式呢。下面两小节我们将讨论这一问题。

对角矩阵是较为简单的矩阵。无论是计算其乘积、逆还是计算其特征值等,都很方便。那么,我们我们会提出如下问题:

(1) 对于某一线性变换它是否具有对角矩阵表示呢? (2) 在何组基下具有对角矩阵表示?形式如何?

表示?如何求出这个基及对角矩阵?

体来说,我们要研究下面三个问题:

从矩阵角度来看,零矩阵与单位矩阵最为简单,但他们对应的是零变换与单

线性变换及其矩阵

下面我们来看一下这一问题。首先,讨论线性变换具有对角矩阵表示的条件。我们有如下定理:

定理: 在线性空间Vn中,线性变换T在某一基下的表达矩阵为对角矩阵 T有

n个线性无关的特征向量(元素)。

证:必要性。设Vn的基为x1,x2,...,xn,且T(x1,x2,...,xn)=(x1,x2,...,xn)Λ,其中

λ1

,则有

Λ= λn

λ1

=(λx,...,λx)

(Tx1,Tx2,...,Txn)=(x1,x2,...,xn) 111n λn

Txj=λjxj

(j=1,2,...,n)

x1,x2,...,xn是T的n个线性无关的特征向量

λ1

T(y1,y2,...,yn)=(Ty1,Ty2,...,Tyn)=(λ1y1,...,λ1yn)=(y1,y2,...,yn)

λn 从而,线性变换T在基y1,y2,...,yn下的表达矩阵为对角矩阵。 证毕。 一个线性变换矩阵能否在某一基下为对角矩阵的问题,相当于一个矩阵能否相似于对角矩阵的问题。关于该问题,我们有如下定理: 定理:An×n相似于对角矩阵 A有n个线性无关的特征向量。 证:

λ1

存在可逆矩阵P=(x,x,...,x),st A~Λ= n12

λn

A(x1,x2,...,xn)=(x1,x2,...,xn)Λ

取y1,y2,...,yn为Vn的基,则有

Tyj=λjyj

(j=1,2,...,n)

充分性。设T有n个线性无关的特征向量y1,y2,...,yn,即

P 1AP=Λ

本文来源:https://www.bwwdw.com/article/bkoi.html

Top