第五专题 矩阵的数值特征(行列式、范数、条件数、迹、秩、相对特征根)

更新时间:2023-05-05 10:40:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第五专题矩阵的数值特征

(行列式、迹、秩、相对特征根、范数、条件数)

一、行列式

已知A p×q, B q×p, 则|I p+AB|=|I q+BA|

证明一:参照课本194页,例.

证明二:利用AB和BA有相同的非零特征值的性质;

从而I p+AB,I q+BA中不等于1的特征值的数目相同,大小相同;其余特征值都等于1。

行列式是特征值的乘积,因此|I p+AB|和|I q+BA|等于特征值(不等于1)的乘积,所以二者相等。

?

二、矩阵的迹

矩阵的迹相对其它数值特征简单些,然而,它在许多领域,如数值计算,逼近论,以及统计估计等都有相当多的应用,许多量的计算都会归结为矩阵的迹的运算。下面讨论有关迹的一些性质和不等式。

定义:

n n

ii i

i1i1

tr(A)a

==

==λ

∑∑,etrA=exp(trA)

性质:

1. tr(A B)tr(A)tr(B)

λ+μ=λ+μ,线性性质;

2. T tr(A )tr(A)=;

3. tr(AB)tr(BA)=;

4.

1tr(P AP)tr(A)-=; 5. H H tr(x Ax)tr(Axx ),x =为向量;

;

6. n n k k i i i 1i 1tr(A),tr(A )===λ=λ∑∑;

从Schur 定理(或Jordan 标准形)和(4)证明;

7. A 0≥,则tr(A)0≥,且等号成立的充要条件是A=0;

8. A B(A B 0)≥-≥即,则tr(A)tr(B)≥,且等号成立的充要条件是A=B (i i A B (A)(B)≥?λ≥λ);

9. 对于n 阶方阵A ,若存在正整数k,使得A k =0,则tr(A)=0(从Schur 定理或Jordan 标准形证明)。

若干基本不等式

对于两个m ×n 复矩阵A 和B ,tr(A H B)是m ×n 维酉空间上的内积,也就是将它们按列依次排成的两个mn 维列向量的内积,利用Cauchy-schwarz 不等式

[x,y]2≤[x,x]﹒[y,y]

#

定理:对任意两个m ×n 复矩阵A 和B

|tr(A H B)|2≤tr(A H A)﹒tr(B H B)

这里等号成立的充要条件是A=cB,c为一常数。特别当A和B为实对称阵或Hermit矩阵时

0≤|tr(AB)|≤

定理:设A和B为两个n阶Hermite阵,且A≥0,B≥0,则

0≤tr(AB)≤λ1(B)tr(A) ≤tr(A)﹒tr(B)

λ1(B)表示B的最大特征值。

证明:

tr(AB)= tr(A1/2BA1/2) ≥0,又因为

A1/2[λ1(B)I-B]A1/2≥0,所以λ1(B)tr(A)≥A1/2BA1/2,得

!

tr(AB)= tr(A1/2BA1/2)≤tr(λ1(B) A)

=λ1(B) tr(A)≤tr(A)﹒tr(B)

推论:设A为Hermite矩阵,且A>0,则

tr(A)tr(A-1)≥n

另外,关于矩阵的迹的不等式还有很多,请参考《矩阵论中不等式》。

三、矩阵的秩

矩阵的秩的概念是由Sylvester于1861年引进的。它是矩阵的最重要的数字特征之一。下面讨论有关矩

阵秩的一些性质和不等式。

定义:矩阵A 的秩定义为它的行(或列)向量的最大无关组所包含的向量的个数。记为rank(A)

性质:

(

1. rank(AB)min(rank(A),rank(B))≤;

2. rank(A B)rank(A,B)rank(A)rank(B)+≤≤+;

3. H H rank(AA )rank(A )rank(A)==;

4. rank(A)rank(XA)rank(AY)rank(XAY)===,其中X 列满秩,Y 行满秩(消去法则)。

定理(Sylvester ):设A 和B 分别为m×n 和n×l 矩阵,则

rank(A)rank(B)n rank(AB)+-≤

min(rank(A),rank(B))≤

Sylveste 定理是关于两个矩阵乘积的秩的不等式。其等号成立的充要条件请参考王松桂编写的《矩阵论中不等式》,三个矩阵乘积的秩的不等式也一并参考上述文献。

四、相对特征根

定义:设A 和B 均为P 阶实对称阵,B>0,方程 @

|A-λB|=0的根称为A相对于B的特征根。

性质:|A-λB|=0等价于|B-1/2AB-1/2-λI|=0

(因为B>0,所以B1/2>0)

注:求A相对于B的特征根问题转化为求B-1/2AB-1/2的特征根问题或AB-1的特征根。因B-1/2AB-1/2是实对称阵,所以特征根为实数。

定义:使(A-λi B)l i=0的非零向量l i称为对应于λi 的A相对于B的特征向量。

性质:

①设l是相对于λ的A B-1的特征向量,则

A B-1l=λl 或 A (B-1l)=λB( B-1l)

B-1l 为对应λ的A相对于B的特征向量

(转化为求A B-1的特征向量问题)。

②$

③设l是相对于λ的B-1/2AB-1/2的特征向量,则B-1/2AB-1/2l=λl

可得

A (B-1/2l)=λB(B-1/2l)

则B-1/2l 为对应λ的A相对于B的特征向量

(转化为求B-1/2AB-1/2对称阵的特征向量问题)。

五、向量范数与矩阵范数

向量与矩阵的范数是描述向量和矩阵“大小”的一种度量。先讨论向量范数。

1. 向量范数定义:设V 为数域F 上的线性空间,若对于V 的任一向量x ,对应一个实值函数x ,并满足以下三个条件:

!

(1)非负性 x 0≥,等号当且仅当x=0时成立;

(2)齐次性 x x ,k,x V;α=α?α∈∈

(3)三角不等式x y x y ,x,y V +≤+∈。 则称x 为V 中向量x 的范数,简称为向量范数。定义了范数的线性空间定义称为赋范线性空间。

例1.

n x C ∈,它可表示成[]T 12n x =ξξξ,i C ξ∈, 1n 22i 2i 1x ?=??=ξ ???∑就是一种范数,称为欧氏范数或2-范数。

证明:

(i )非负性 1n 22i 2i 1x 0=??=ξ≥ ???∑,

当且仅当()i 0i 1,2,

,n ξ==时,即x =0时,2x =0

(ii )齐次性

| 11n n 2222i i 22i 1i 1x x ==????α=αξ=α?ξ=α? ? ?????∑∑

(iii )三角不等式

[]T

1

2

n y =ηηη ,i C η∈

[]T

1122n n x y +=ξ+ηξ+ηξ+η

n

2

2

i i 2i 1x y =+=ξ+η∑

()

222

22

i i i i i i i i i i 2Re 2ξ+η=ξ+η+ξη≤ξ+η+ξη n

2

2

2

i i 222i 1

x y x y 2=+≤++ξη∑

(

)

2

22

22

222

2x y

x y 2x

y +=++

根据H?lder 不等式:

1

1

n n

n

p

q

p q i i i i i 1i 1i 1a b a b ===????≤ ?

???

??

∑∑∑,i i 11p,q 1,1,a ,b 0p q >+=> 【

11n

n

n

2

2

22i i i i

2

2i 1i 1i 1

x y ===???

?=ξη≥ξη ? ?

????

∑∑∑

∴ 222x y x y +≤+

2. 常用的向量范数(设向量为[]

T

12

n x =ξξξ)

1-范数:n

i 1

i 1

x

==ξ∑;

∞-范数:1i n

x i max ∞≤≤=ξ;

P-范数:1

n

p p i p i 1x =?

?=ξ ???

∑ (p>1, p=1, 2,…,∞,);

2-范数:()1

H

22x x x =;

椭圆范数(2-范数的推广):

(

)

1

H

2

A

x

x Ax

=,A 为Hermite 正定阵.

'

加权范数:

1n

2

2i i w

i 1x

w =??=ξ ???

∑,

当[]12

n A W diag w w w ==,i w 0>

证明:

p

x

显然满足非负性和齐次性

(iii )[]

T

1

2

n y =ηηη

1n

p

p i p i 1x =?

?=ξ ?

??

∑,1n p

p i p

i 1y =?

?=η ???∑,

1

n

p

p i i p i 1x y =?

?+=ξ+η ?

??

()

n

n

p

p

p 1

i i i i

i i

p

i 1

i 1

n

n

p 1

p 1

i i

i i i

i

i 1

i 1

x y -==--==+=ξ+η=ξ+ηξ+η≤ξ+ηξ+ξ+ηη∑∑∑∑

应用H?lder 不等式

()1

1

n

n

n

q

p

p 1

p 1q p i

i i i i

i i 1i 1

i 1--===?

?

??ξ

+ηξ≤ξ+ηξ??????

??∑∑∑ ()11

n

n

n

q

p

p 1

p 1q p i

i

i i i

i i 1

i 1i 1--===??

?

+ηη≤ξ+ηη??

????

??∑∑∑

)

()111p 1q p p q

+=?-= ∴ 111n n n n q p p p p p p i i i i i i i 1i 1i 1i 1====??????????ξ+η≤ξ+ηξ+η ? ? ???????????∑∑∑∑ 111n n n p p p p p p i i i i i 1i 1i 1===??????ξ+η≤ξ+η ? ? ?????

??∑∑∑ 即

p p p x y x y +≤+

3. 向量范数的等价性

定理 设α、β

为n C 的两种向量范数,则必定存在正数m 、M ,使得 m x x M x αβα≤≤,(m 、M 与x

无关),称此为向量范数的等价性。 同时有11x x x M m βαβ≤≤

注:

(1)对某一向量X 而言,如果它的某一种范数小(或大),那么它的其它范数也小(或大)。 :

(2)不同的向量范数可能大小不同,但在考虑向量序列的收敛性问题时,却表现出明显的一致性。

4、矩阵范数

向量范数的概念推广到矩阵情况。因为一个m ×

n 阶矩阵可以看成一个mn 维向量,所以m n C ?中任何

一种向量范数都可以认为是m ×n 阶矩阵的矩阵范数。

1. 矩阵范数定义:设m n C ?表示数域C 上全体m n ?阶矩阵的集合。若对于m n C ?中任一矩阵A ,均对应一个实值函数A ,并满足以下四个条件:

(1)非负性:A 0≥ ,等号当且仅当A=0时成立;

(2)齐次性:A A ,C;α=αα∈

(3)三角不等式:m n A B A B ,A,B C ?+≤+∈,则称A 为广义矩阵范数;

(4)相容性:AB A B ≤?,则称A 为矩阵范数。

~

5. 常用的矩阵范数

(1)Frobenius 范数(F-范数) F-范数:

12n 2ij F i j 1A a =??= ???∑,

=

矩阵和向量之间常以乘积的形式出现,因而需要考虑矩阵范数与向量范数的协调性。 定义:如果矩阵范数A 和向量范数x 满足

Ax A x ≤?

则称这两种范数是相容的。

给一种向量范数后,我们总可以找到一个矩阵范数与之相容。 》

(2)诱导范数

设A ∈C m ×n

,x ∈C n , x 为x 的某种向量范数,

x 1

A max Ax == 则A 是矩阵A 的且与x 相容的矩阵范数,也称之为A 的诱导范数或算子范数。 (3)p-范数:

p

p

p

Ax A

max

x

=,

()

ij m n

A a ?=,x 为所有可能的向量,[]

T

1

2

n x =ξξξ,

p

p

x x

α=α,

()

p p

1

Ax A x =αα

()0α≠

p p p

x 1

A max Ax

==

111

x 1

A max Ax

==,

n

i 1i 1x 1==ξ=∑,n n

ij j

1i 1j 1

Ax a ===ξ∑∑

可以证明下列矩阵范数都是诱导范数:

(1)

n

ij

11j n

i 1A max a ≤≤==∑ 列(和)范数;

(2

)21i n A ≤≤= 谱范数; H A A 的最大特征值称为H A A 的谱半径。

当A 是Hermite 矩阵时,i 21i n

A max

(A)≤≤=λ是A 的谱半径。

注:谱范数有许多良好的性质,因而经常用到。

2

H

H 222

2A A ; A A A ==

(3)n

ij

1i m

j 1

A

max a ∞

≤≤==∑ 行(和)范数

x

=1

n

p

p i i

1i n

i 1p max ≤≤=→∞

?

?ξ=ξ ???

∑ ,

2x =1

n

2

2i i 1=?

?ξ ?

??

∑)

定理 矩阵A 的任意一种范数A 是A 的元素的连续函数;矩阵A 的任意两种范数是等价的。

定理 设A ∈C n ×n ,x ∈C n , 则F A 和2x 是相容的

2F

2Ax A

x ≤?

证明:由于222F

2Ax A x A x ≤?≤?成立。

定理 设A ∈C n ×n

,则F A 是酉不变的,即对于任意

酉矩阵U,V ∈C

n ×n

,有

F F A UAV =

证明:

F UAV =

==

F A ===

定义 设A ∈C

n ×n ,A 的所有不同特征值组成的集合称为A 的谱;特征值的模的最大值称为A 的谱半径,

记为ρ(A)。

, 定理 ρ(A)不大于A 的任何一种诱导范数,即

ρ(A)≤A 证明:设λ是A 的任意特征值,x 是相应的特征向量,即

Ax=λx

|λ|·||x||= ||Ax||≤||A||·||x||, ||x||≠0

|λ|≤||A||

试证:设A 是n 阶方阵,||A||是诱导范数,当

||A||<1时,I-A 可逆,且有

||(I-A)-1||≤(1-||A||)-1

!

证明:

若I-A 不可逆,则齐次线性方程组

(I-A)x=0

有非零解x ,即x=Ax ,因而有

||x||=||Ax||≤||A||﹒||x||<||x||

但这是不可能的,故I-A 可逆。

于是 (I-A)-1=[ (I-A)+A] (I-A)-1=I+A (I-A)-1

因此||(I-A)-1||≤||I||+||A(I-A)-1||=1+||A(I-A)-1||

≤1+||A||﹒|| (I-A)-1||

即证

||(I-A)-1||≤(1-||A||)-1

补充证明||I||=1:

由相容性可知:

||A||﹒||A -1||≥||A A -1||=||I||

x Ix I x I 1=≤?≥

对于诱导范数( x 1A max Ax ==) x 1

I max Ix 1===。

六、条件数

条件数对研究方程的性态起着重要的作用。 `

定义:设矩阵A 是可逆方阵,称||A||﹒||A -1||为矩阵A 的条件数,记为cond(A),即

cond(A)= ||A||﹒||A -1||

性质: (1)cond(A) ≥1,并且A 的条件数与所取的诱导范数的类型有关。

因cond(A)= ||A||﹒||A -1||≥||A A -1||=||I||=1

(2)cond(kA)= cond(A)=cond(A -1),这里k 为任意非零常数。

当选用不用的范数时,就得到不同的条件数,如: cond 1(A)= ||A||1﹒||A -1||1

cond ∞(A)= ||A||∞﹒||A -1||∞

cond 2(A)= ||A||2﹒||A -1||2

,其中1n ,λλ分别为A H A 的特征值的模的最大值和最小值。谱条件数 |

特别地,如果A 为可逆的Hermite 矩阵,则有

cond 2(A)= 1n λλ

这里1n ,λλ分别为A 的特征值的模的最大值和最小值。

如果A 为酉阵,则cond 2(A)= 1

例 求矩阵A 的条件数cond 1(A),cond ∞(A)

152A 210382-?? ?=- ? ?-??

解:

||A||1=max{6;14;4}=14;

||A||∞=max{8;3;13}=14;

12621A 4844132311-?? ?=- ? ???

`

||A -1||1=17/4;

||A -1||∞=47/4;

cond 1(A)= ||A||1﹒||A -1||1=14×17/4=259/2; cond ∞(A)= ||A||∞﹒||A -1||∞=611/4。

例 设线性方程组Ax=b 的系数矩阵A 可逆。讨论当b 有误差δb 时,解的相对误差δx 的大小。

解:因矩阵A 可逆,所以Ax=b 有唯一解x=A -1b ,设解的误差为δx ,由

A(x+δx)=b+δb

A δx=δb 或δx=A -1δb

11x A b A b --δ=δ≤?δ (1)

又Ax=b ,可得

b A x ≤?,或A 1x b ≤ (2)

所以由(1)和(2),得

1x b b A A cond(A)x b b -δδδ≤??=? 这说明相误差x

x δ的大小与条件数cond(A)密切相关;

当右端b 的相对误差b

b δ一定时,cond(A)越大,解的相对误差就可能越大;cond(A)越小,解的相对误差就可能越小。因而条件数cond(A)可以反映A 的特性。

一般来说:条件数反映了误差放大的程度,条件数越大,矩阵越病态。条件数在最小二乘估计的稳定性研究中有重要应用。

鉴于矩阵A 的条件数范数cond(A)有多种,但最常用的条件数是由谱范数||A||2导出的,称为谱条件

数。在本章中,若无特别声明,讨论的条件数都是谱条件数。

2

A =

12A -= 谱条件数:()

cond A =

若A 是m ×n 阶矩阵,且rank(A) =t≤n ,则A 的条件数定义为

()()()

max min A cond A A σ=σ 即最大奇异值与最小非零奇异值的商。

(3)其它性质

对任意酉矩阵Q ,cond(QAQ H )= cond(A -1); ()()H 2cond AA cond A cond(A)=≥。

(因()()

()()H max H 2H min AA cond AA cond A AA σ==σ)

本文来源:https://www.bwwdw.com/article/10me.html

Top