模煳数学+变分法+Matlab基础教程

更新时间:2024-07-03 02:08:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

绪言

任何新生事物的产生和发展,都要经过一个由弱到强,逐步成长壮大的过程,一种新理论、一种新学科的问世,往往一开始会受到许多人的怀疑甚至否定。模糊数学自1965年L.A.Zadeh教授开创以来所走过的道路,充分证实了这一点,然而,实践是检验真理的标准,模糊数学在理论和实际应用两方面同时取得的巨大成果,不仅消除了人们的疑虑,而且使模糊数学在科学领域中,占有了自己的一席之地。

经典数学是适应力学、天文、物理、化学这类学科的需要而发展起来的,不可能不带有这些学科固有的局限性。这些学科考察的对象,都是无生命的机械系统,大都是界限分明的清晰事物,允许人们作出非此即彼的判断,进行精确的测量,因而适于用精确方法描述和处理。而那些难以用经典数学实现定量化的学科,特别是有关生命现象、社会现象的学科,研究的对象大多是没有明确界限的模糊事物,不允许作出非此即彼的断言,不能进行精确的测量。清晰事物的有关参量可以精确测定,能够建立起精确的数学模型。模糊事物无法获得必要的精确数据,不能按精确方法建立数学模型。实践证明,对于不同质的矛盾,只有用不同质的方法才能解决。传统方法用于力学系统高度有效,但用于对人类行为起重要作用的系统,就显得太精确了,以致于很难达到甚至无法达到。

精确方法的逻辑基础是传统的二值逻辑,即要求符合非此即彼的排中律,这对于处理清晰事物是适用的。但用于处理模糊性事物时,就会产生逻辑悖论。如判断企业经济效益的好坏时,用“年利税在100万元以上者为经济效益好的企业”表达,否则,便是经济效益不好的企业。根据常识,显而易见:“比经济效益好的企业年利税少1元的企业,仍是经济效益好的企业”,而不应被划为经济效益不好的企业。这样,从上面的两个结论出发,反复运用经典的二值逻辑,我们最后就会得到,“年利税为0者仍为经济效益好的企业”的悖论。类似的悖论有许多,历史上最著名的有“罗素悖论”。它们都是在用二值逻辑来处理模糊性事物时产生的。

客观实际中存在众多的模糊性事物和现象,促使人们寻求建立一种适于描述模糊事物和现象的逻辑模式。模糊集合理论便是在这种形势下应运而生的。模糊方法的逻辑基础是连续值逻辑,它是建立在[0,1]上的。如若我们把年利税在

100万元以上者的属于“经济效益好”的企业的隶属度规定为1,那末,相比之下,年利税少1元的企业,属于“经济效益好”的企业的隶属度就应相应减少一点,比如为0.99999,依此类推,企业的年利税每减少1元,它属于“经济效益好”的企业的隶属度就要相应减少一点。这样下去,当企业的年利税为0时,它属于“经济效益好”的企业的隶属度也就为0了,显然,模糊方法的这种处理方式,是符合于人们的认识过程的,连续值逻辑是二值逻辑的合理推广。

现代科学发展的总趋势是,从以分析为主对确定性现象的研究,进到以综合为主对不确定性现象的研究。各门科学在充分研究本领域中那些非此即彼的典型现象之后,正在扩大视域,转而研究那些亦此亦彼的非典型现象。自然科学不同学科之间,社会科学不同学科之间,自然科学和社会科学之间,相互渗透的趋势日益加强,原来截然分明的学科界限一个个被打破,边缘科学大量涌现出来。随着科学技术的综合化、整体化,边界不分明的对象,亦即模糊性对象,以多种多样的形式普遍地、经常地出现在科学的前沿。

模糊集合理论自诞生以来,获得了长足的发展,每年全世界发表的研究论文的数量,以指数级速度增长。研究范围从开始时的模糊集合,发展为模糊数、模糊代数、模糊测度、模糊积分、模糊规划、模糊图论、模糊拓扑??等众多的分枝。

和模糊集合理论的发展速度相比,模糊技术的应用虽稍迟一步,但也取得了令人可喜的进展。自1980年第一例应用模糊技术的产品问世以来,有关这方面的研究报告已逾7000多篇,制造出近千种模糊产品,如计算机、电饭煲、摄像机、微波炉、洗衣机、空调器等。如日本松下公司研制的智能化家用空调器,可根据内置的传感器提供的室内空气温度数据,在室温高或低于25℃时,会自动地“稍稍”调节空调器的阀门,进行4608种不同状态设定选择,从而获得最佳开启状态和尽可能少的消耗。而这种“稍稍”的程度,只有通过有经验的人的感觉来决定。

模糊技术方法不是对精确的摒弃,而是对精确更圆满的刻画。它通过模糊控制规划,利用人类常识和智慧,理解词语的模糊内涵和外延,将各方面专家的思维互相补充。虽然,目前要使模糊技术接近于人的思维,尚难以做到,但正如日本夏普公司电子专家日吉考庄所说:一个普遍应用模糊技术的时代,不久就会到来。

我国自70年代开始模糊数学研究以来,成就突出,已形成了2000至3000

人的世界最庞大的研究队伍,并在高速模糊推理研究等领域,居世界领先地位。但同时在其它方面,也存在着一些差距,尤其突出的是实验室里的成果,还有许多未转化成经济效益。需要在政府和工业界的支持和参与下,成立专门的开发实体,制定规划,并积极开展国际交流,为我国21世纪的技术发展和科学腾飞奠定基础。

第二章 模式识别

§2-1模式识别及识别的直接方法

在日常生活中生活中,经常需要进行各种判断、预测。如图象文字识别、故障(疾病)的诊断、矿藏情况的判断等,其特点就是在已知各种标准类型前提下,判断识别对象属于哪个类型的问题。这样的问题就是模式识别。

一、模糊模式识别的一般步骤

模式识别的问题,在模糊数学形成之前就已经存在,传统的作法主要用统计方法或语言的方法进行识别。但在多数情况下,标准类型常可用模糊集表示,用模糊数学的方法进行识别是更为合理可行的,以模糊数学为基础的模式识别方法称为模糊模式识别。 模式识别主要包括三个步骤:

第一步:提取特征,首先需要从识别对象中提取与识别有关的特征,并度量这些特征,设x1,?,xn分别为每个特征的度量值,于是每个识别对象x就对应一个向量(x1,x2,?,xn),这一步是识别的关键,特征提取不合理,会影响识别效果。

第二步:建立标准类型的隶属函数,标准类型通常是论域

U??(x1,?xn)?的模糊集,xi是识别对象的第i个特征。

第三步:建立识别判决准则,确定某些归属原则,以判定识别对象属于哪一个标准类型。常用的判决准则有最大隶属度原则(直接法)和择近原则(间接法)两种。 二、最大的隶属度原则

若标准类型是一些表示模糊概念的模糊集,待识别对象是论域中的某一元素(个体)时,往往由于识别对象不绝对地属于某类标准类型,因而隶属度不为1,这类问题人们常常是采用称为“最大隶属度原则”的方法

加以识别,这种方法(以及下面的“阈值原则”)是处理个体识别问题的,称为直接法。

最大隶属度原则:设A1,A2?An?F(U)是n个标准类型,x0?U,若

Ai(x0)?max? Ak(x0) 1?k?n?

则认为x0相对隶属于Ai所代表的类型。 例1 通货膨胀识别问题

通货膨胀状态可分成五个类型:通货稳定;轻度通货膨胀;中度通货膨胀;重度通货膨胀;恶性通货膨胀.以上五个类型依次用R?(非负实数域,下同)上的模糊集A1,A2,A3,A4,A5 表示,其隶属函数分别为:

1, 0?x?5?? A1(x)??x?52exp[?[]], x?5?3?x?102A2(x)?exp(?())

5A3(x)?exp(?(A4(x)?exp(?(x?207x?309)) ))

22x?502??exp[?()),A5(x)??15?? 1, 0?x?50 x?50

其中对x?0,表示物价上涨x%。问x?8,40时,分别相对隶属于哪种类型?

解 A1(8)?0.367,9A2(8)?0.8521

A3(8)?0.0529,A4(8)?0.0032 A5(8)?0.0000

A1(40)?0.0000,A2(40)?0.0000

A3(40)?0.0003,A4(40)?0.1299

A5(40)?0.6412

由最大隶属原则,x?8应相对隶属于A2,即当物价上涨8%时,应视

为轻度通货膨胀;x?40,应相对隶属于A5,即当物价上涨40%时,应视为恶性通货膨胀。

三、阈值原则

在使用最大隶属度原则进行识别中,还会出现以下两种情况,其一是有时待识别对象x0关于模糊集A1,A2?An中每一个隶属程度都相对较低,这时说明模糊集合A1,A2?An对元素x不能识别;其二是有时待识别对象x关于模糊集A1,A2?An中若干个的隶属程度都相对较高,这时还可以缩小x的识别范围,关于这两种情况有如下阈值原则。

阈值原则:A1,A2?An?F(U)是n个标准类型,x0?U,d?(0,1]为一阈值(置信水平)令??max?Ak(x0)1?k?n?

若??d则不能识别,应查找原因另作分析。

若??d且有Ai(x0)?d,Ai(x0)?d?Ai(x0)?d 则判决x0相对地属

12m于Ai?Ai??Ai

12m例2 三角形识别问题

我们把三角形分成等腰三角形I,直角三角形R, 正三角形E,非典型三角形T,这四个标准类型,取定论域

X??xx?(A,B,C),A?B?C?180,A?B?C?

这里A,B,C是三角形三个内角的度数,通过分析建立这四类三角形的隶属函数为: I(x)?1? R(x)?1? E(x)?1?T(x)?11801601901180[(A?B)?(B?C)]A?90

(A?C)

A?90]

1A(x)?(n2

min[3(A?B),3(B?C),A?C,2 现给定,x0?(A,B,C)?(85,50,45),x0对上述四个标准类型的隶属度为:

I(x0)?0.916 R(x0)?0.94 E(x0)?0.7T(x0)?0.06

由于x0关于I,R的隶属程度都相对高,故采用阈值原则,取d?0.8,因I(x0)?0.916?0.8,R(x0)?0.94?0.8,按阈值原则,x0相对属于I∩R,即x0可识别为等腰直角三角形。

例3 癌细胞识别

在癌细胞识别问题中细胞分成四个标准类型,即:癌细胞(M),重度核异质细胞(N),轻度核异质细胞(R),正常细胞(T)。

选取表征细胞状况的七个特征: x1:核面积,x2:细胞面积,x5:核内总光密度x7:核内平均透光率,.x2:核周长,x4:细胞周长,x6:核内平均光密度,

根据病理知识,反映细胞是否癌变的主要指标有以下六个,它们都是

X??x:x?(x1,x2,?,x7)? 上的模糊集:

A:核增大A(x)?(1??1ax1x5x122) (a正常核面积?1?1)B:核染色增深,B(x)?(1??22)C:核桨比例置,C(x)?(1??32)?1D:核内染色质不匀E:核畸形,,D(x)?[1?E(x)?[1?(?4x7?522(x7?lgx6)2]?1

x2]2?1x1x42?4?)F:细胞畸形,F(x)?[1?(?6x3?4?)2]?1上述?1,?2,?,?6是适当选取的常数

细胞识别中的几个标准类型分别定义为:

M?[A?B?C?(D?E)]?FN?A?B?C?Mc

T?M1112c

?McR?A2?B2?Cc?Nc?Nc?R121211上述定义中的模糊集A的隶属函数为A(x)?(A(x))2。另两个模糊集B2、

1C2的隶属函数类似定义。

给定待识别细胞x0?X,设x0的核面积等七个特征值为(x1,x2,?x7)据此可算出

000M(x0)、N(x0)、R(x0)、T(x0),最后按最大隶属度原则识别。

例4 冬季降雪量预报

内蒙古丰镇地区流行三条谚语:(1)夏热冬雪大,(2)秋霜晚冬雪大,(3)秋分刮西北风冬雪大,现在根据三条谚语来预报丰镇地区冬季降雪量。

为描述“夏热”(A1)、秋霜晚(A2)、秋分刮西北风(A3)等概念,在气象现象中提取以下特征:

x1:当年6~7月平均气温 x2:当年秋季初霜日期

x3:当年秋分日的风向与正西方向的夹角。

于是模糊集A1(夏热),A2(秋霜晚)、A3(秋分刮西北风)的隶属函数可分别定义为:

??1 x1?x1 ?1?2A1(x1)??1?(x?x) x1?2?1 ? x1 ? x1 1122?1??0 x1? x1 ? 2?1 ??其中x1是丰镇地区若干年6、7月份气温的平均值,?1为方差,实际预报时取 x=19c,?2?21=0.98

? x2?x2?1??x?a2A2(x2)??2 a2?x2?x2

?x2?a2?0 x2?a2??其中x2是若干年秋季初霜日的平均值,a2是经验参数,实际预报时取x2=17(即9月17日),a2=10(即9月10日)。

?1 270??x3?360???-sinx3 180??x3?270?A3(x3)??

0 90??x?180?3???cosx3 0??x3?90?取论域X??x|x?(x1,x2,x3)?,“冬雪大”可以表示为论域X上的模糊集

C,其隶属函数为:

C(x)?A1(x1)∧(A2(x2)∨A3(x3))

采用阈值原则,取阈值d?0.8,测定当年气候因子x?(x1,x2,x3)。计算C(x),若C(x)?0.8则预报当年冬季“多雪”,否则预报“少雪”。

用这一方法对丰镇1959~1970年间隔12年作了预报,除1965年以外均报对,历史拟合率为11/12。

§2-2 贴近度与模式识别的间接方法

一、贴近度

表示两个模糊集接近程度的数量指标,称为贴近度,其严格的数学定义如下:

定义1 设映射

N: F(U)?F(U)?[0,1] 满足下列条件:

(1) ?A?F(U),N(A,A)?1 (2) ?A,B?F(U),N(A,B)?N(B,A)

(3) 若A,B,C?F(U)满足

A(x)?C(x)?A(x)?B(x) (?x?U)

有N(A C)?N(A B)

则称映射N为F(U)上的贴近度,称N(A B)为A与B的贴近度。 贴近度的具体形式较多,以下介绍几种常见的贴近度公式 (1) Hamming 贴近度

NH(A ,B)?1?1nn?i?1A(xi)?B(xi)

或 NH(A ,B)?1?1(b?a)?baA(x)?B(x)dx

(2)Euclid贴近度 NE(A ,B)?1?1n1b?an?(A(xi?1i)?B(xi))

2或 NE(A ,B)?1?(3)格贴近度 定义7 映射

?ba(A(xi)?B(xi))dx

2Ng:F(U)?F(U)?[0,1]

(或=(A,B)?Ng(A,B)?(A?B)?(A⊙B),

c12[A?B?(A⊙B)])

c称为格贴近度,称Ng(A,B)为A与B格贴近度。其中, A?B???A(x)?B(x)x?U? (称为A与B的内积)

A⊙B???A(x)?B(x)x?U? (称为A与B的外积)

若U??x1,x2,?,xn?,则 A?B???A(xi?B(xi)?

i?1nA⊙B???A(xi?B(xi)?

i?1n值得注意的是,这里的格贴近度是通过定义来规定的,事实上,格贴近度不满足定义

1

中(1),即

Ng(AA)?1,

但是,当

?A?F(U),A1??,suppA?U时,格贴近度满足定义1的(1)-(3)。另外格贴

近度的计算很方便,且用于表示相同类型模糊度的贴近度比较有效,所以在实际应用中也常选用格贴近度来反映模糊集接近程度。

还有许多贴近度,这里不在一一介绍。

贴近度主要用于模糊识别等具体问题,以上介绍的贴近度表示式各有优劣,具体应用时,应根据问题的实际情况,选用合适的贴近度。 二、模式识别的间接方法——择近原则 在模式识别问题中,各标准类型(模式)一般是某个论域X上的模糊集,用模式识别的直接方法(最大隶属度原则、阈值原则)解决问题时,其识别对象是论域X中的元素。另有一类识别问题,其识别对象也是X上的模糊集,这类问题可以用下面的择近原则来识别判决。

择近原则:已知n个标准类型A1、A2、?、An?F(X),B?F(X)为待识别的对象,N为F(X)上的贴近度,若

N(Ai,B)?max?N(Ak,B)| k?1,2,?n?

则认为B与Ai最贴近,判定B属于Ai一类。

例5 岩石类型识别

岩石按抗压强度可以分成五个标准类型:很差(A1)、差(A2)、较好(A3)、好(A4)、很好(A5)。它们都是X?[0,??)上的模糊集,其隶属函数如下(图2-1)

0 200 400 600 900 1100 1800 2000 (kg/cm)2AA5(x)A4(x)A3(x)A2(x)A1(x)1 x

图 2-1

?1 0?x?1001?A1(x)???(x?200) 100?x?200

?100?0 x?200?x 0?x?200?200?1 200?x?400A2(x)??

1(x?600) 400?x?600???200?0 600?x?1(x?400) 400?x?600?200?1 600?x?900A3(x)?? 1(x?1100) 900?x?1100???200?0 其它?1(x?900) 900?x?1100?200?1 1100?x?1800A4(x)?? 1(x?2200) 1800?x?2200???400?0 其它?0 x?1800?1A5(x)??(x?1800) 1800?x?2200

400??1 2200?x今有某种岩体,经实测得出其抗压强度为X上的模糊集B,隶属函数为(图2-3)。

图 2-3

?1(x?712) 712?x?800?88?1 800?x?1000B(x)??

1(x?1120) 1000?x?1120???120?0 其它试问岩体B应属于哪一类。

计算B与Ai(i?1~5)的格贴近度,得:

Ng(A1,B)?0, Ng (A2,B)?0, Ng(A3,B)?1 Ng(A4,B)?0.68, Ng(A5,B)?0

按择近原则,B应属于A3类,即B属于“较好”类(A3类)的岩石。 例6 小麦亲本识别

在小麦杂交育种过程中,亲本选择是关键。现有五种类型的小麦亲本,它们是: A1:早熟型,A2:矮杆型,A3:大粒型, A4:高肥丰产型,A5:中肥丰产型。

判断小麦亲本类型的主要依据是以下五种性状特征:

x1:抽穗期,x2:株高,x3:有效穗数, x4:主穗粒数,x5:百粒重。

第i种类型亲本的第j个特征,是模糊集Aij,这些模糊集除A11(早熟型的抽穗期)与A22(矮杆型的株高)外,其余都是中间型的正态分布模糊集。为简单计,将正态分布函数

展开,取前两项作它的近似值,则有

?(x?a)2?22e?1?12?2(x?a)

2于是Aij的隶属函数可表示为:

1?21?(x?a), aij?2?ij?x?aijij2?2?ij??1, aij?x?bijAij(x)??

12?1?(x?bij), bij?x?bij?2aij22?ij??0, 其它?而A11,A22的隶属函数取为偏小值型:

?1 x?bii?1A(x)??21?(x?bii) x?bii2?2?ii? (i?1,2)

为确定隶属函数中的参数值,在熟知的标准类型中,每类型选出k个新本为样本,分别计算各样本的第j个特征的均值xijl及方差?ijl(l?1,2,?,k),取

aij?minxijl:l?1,2,?kbijijl??max?x?ij??:l?1,2,?k?

k2ijll?11k??以上参数值见表(2-1)

表 2-1

亲本 参数 性状 抽穗期 株高 有效穗数 主穗粒数 百粒重 早熟 矮杆 1大粒 1高肥丰产 1中肥丰产 1a1j - 67.1 9.1 40.2 3.0 b1j 22?1j a2j 5.5 - 8.3 37.5 2.4 b2j 9.6 70.0 18.2 52.5 3.4 22?2j 1.0 72.4 10.8 80.7 0.3 a3j 5.8 67.9 9.4 44.2 4.0 b3j 11.9 90.9 13.2 54.5 6.0 22?3j 1.2 52.2 15.6 21.2 0.3 a4j 5.2 67.9 9.8 41.2 3.6 b4j 11.3 81.2 13.2 51.0 4.2 22?4j 0.9 35.9 11.3 13.3 0.3 a5j 5.1 76.5 7.2 37.6 3.3 b5j 8.9 84.6 13.2 48.3 4.0 122?5j 1.2 57.5 5.8 93.9 0.2 6.7 87.7 11.2 55.0 4.4 1.1 50.0 18.1 92.0 0.3

现有一待识对象B,它的第j个特征Bj是中间型正态分布模糊集,隶属函数可近似表示为:

2?(x?xj),?1?22?j?Bj(x)???0 ??xj?其它2?j?x?xj?2?j (j?1,2,3,4,5)。

式中参数值见表(2-2)

表 2-2 特性 参数 x 2? 抽穗期 8.5 1.5 株高 85.6 4 有效穗数 6.2 1.9 主穗粒数 36.2 70 百粒重 3.43 0.28 计算识别对象B的第j个特征与第i种标准类型对应特征Aij的格贴近度

(Aij,Bj)(i?1,2,3,4,5)并定义第i种标准类型Ai与识别对象B的贴近度为:

5(Ai,B)??(Aij,Bj)

j?1计算结果列于表(2-3)

表 2-3 NgNg A A A 早熟(A1) 矮杆(A2)大粒(3)高肥(4)中肥(5)0.50 1.00 1.00 0.23 1.00 0.23 1.00 0.00 0.88 0.98 1.00 0.00 1.00 1.00 0.77 0.89 0.98 0.77 1.00 0.76 0.64 0.83 1.00 0.64 1.00 0.99 0.96 0.98 1.00 0.96 (Ai1,B1) (Ai2,B2) ( ( ( (Ai3Ai4Ai5AiNgNgNgN,B3 ),B4) ,B5 ),B )表(2-3)的最后一行为B与各标准类型的贴近度。由于B与A5的贴近度最高(0.96),故判定识别对象B为A5代表的类型,即B为中肥丰产类型的亲本。

例7 遥感土地复盖类型分类

遥感是根据不同的地物对电磁波谱有不同的响应这一原理,来识别土地复盖的类型。空间遥感的一个象元相当于地面0.45公倾地物的综合。遥感图象识别分类中,要涉及不少模糊概念,例如,“以红松为主的针叶林”就是一个没有明确界线的模糊概念。这是遥感本身的特性决定的。因此用模糊数学的方法对遥感图象进行识别分类应该是行之有效的方法。 美国爱达荷大学R.C.Heller 教授指出,国际上当以水体、沙地、森林、城镇、作物、干草作为分类单位(即标准类型)时,空间遥感的分类精度可达83.93%甚至更高。但当分类单位深入到更小的土地复盖单元时,精度就不理想了。

现在将分类单位细分阶段为以下五种标准类型: A1:公路,A2:村庄农田,A3:红松为主的针叶林, A4:阔、针混交林,A5:白桦林。

对于多波段遥感技术,假设采用p个波段,则每一地物对应一个p维数据向量x?(x1,x2,?,xp)。1975年1月22日美国发射LandSat-2,提供了

MSS-4,5,6,7这四个波段的数据,故有p?4。取论域

X??x|x?(x1,x2,x3,x4)?

其中x1,x2,x3,x4分别为象元对应于MSS-4,5,6,7各波段的光谱强度。于是五种标准类型Ai(i?1~5)可表为X上的模糊集。

由于各波段光谱强度是正态分布模糊集,故第i个标准类型的(j+3)波段光谱强度的隶属函数为:

?xj?aij2???Aij(xj)?exp??()? (j?1,2,3,4)

?ij????定义第i种标准类型Ai为:

Ai?Ai1?Ai2?Ai3?Ai4

因而

?xj?aij2???Ai(x)?minAij(xj)?exp??max()?

1?j?41?j?4?ij????其中aij为若干个第i种类型第(j+3)个波段光谱强度的均值,?ij为方差,东北凉水林场的这些参数值见表(2-4)

表 2-4 标准类型 A1 A2 MSS-4 ai1 MSS-5 ai2 MSS-6 ai3 MSS-7 ai4 ?i1 ?i2 ?i3 ?i4 19.06 21.89 15.46 16.22 17 0.56 2.88 1.22 0.64 0.82 18.24 24.68 12.58 12.78 13.2 1.60 4.82 0.88 0.58 0.42 51.24 47.37 36.54 42.41 45 4.32 4.09 3.55 2.87 0.94 25.24 21.63 17.33 21.22 23.20 1.98 2.39 2.08 1.50 0.42 A3 A4 A5 设B为识别对象,定义Ai与B的贴近度为:

4N(Ai,B)??Ng(Aij,Bj) (1)

j?1其中 Ng(Aij,Bj)=

12[((Aij?Bj)?(Aij⊙Bj)] (2)

c

表 2-5 类型 N 判别 A1 A2 A3 A4 A5 max 识别对象 结果 A1 A2 效果 正确 正确 正确 正确 正确 B1 B2 0.92 0.65 0.50 0.50 0.50 0.72 0.99 0.50 0.50 0.50 0.50 0.50 0.99 0.61 0.50 0.50 0.50 0.60 0.99 0.62 0.50 0.50 0.50 0.65 0.89 0.92 0.99 0.99 0.99 0.89 B3 B4 A3 A4 B5 A5

按(A?B)???1?(A(x)?B(x)x?X?及(A⊙B)c?Ac?Bc

cNg(Aij,Bj)?12?(aij?aj[1?e?ij??)2j] (3-2

6)

(这里aj与?j是Bj的均值与方差)。

现有东北凉水林场空间遥感象元(待识别对象)五个,按(1)与(2)计算它们与五个标准类型的贴近度,计算结果在表(2-5)按择近原则进行识别判决,准确率100%。

例8 雷达识别

现有n个雷达类,每个雷达类可用发射频率、脉冲重复频率、脉冲宽度等特征来刻画,假设共有j个特征,第i类雷达的第j个特征可以取nij个值。由于保密的需要及信号环境的日益复杂,这些特征及其取值都带有一定的模糊性。设第i类(i?1~n)雷达的k个特征为

Ai1,Ai2?,Aik,i类雷达的第j个特征(j?1~k)取值为Aij(m?1,2,?nij),其隶属函数为

m中间型柯西分布,即

A(u)?[1?(miju?aijm?ijm)]

2?1设X为待识别对象,它的k个特征为X1,X2,?Xk,X的第j个特征Xj的隶属函数也取中间型柯西分布:

Xj(u)?[1?(u?xj)] (j?1,2,?,k)

2?1?j采用格贴近度,令

dij?(Aij,Xj)dij?max?dmijmm|m?1~nij?

则dij为识别对象X的第j个特征与i类雷达第j个特征贴近程度的度量。 一般情况可令

kdi??aj?1jdij

(di是各dij的加权平均值,权系数aj表示j个特征的重要性程度)di可作为识别对象X与第i类雷达总贴近的度量。根据di的大小可判定X属于何类雷达,但是,由于权系数aj的确定有一定的模糊性,Aij及Xj的隶属函数的确定带有一定的主观性,从而导致贴近度dij有一定的模糊性。因此对aj及dij进行模糊化处理,设

Aj?(aj;cj,cj)L?R Dij?(dij;wij,wij)L?R

mm这里Aj,Dij都是L?R模糊数(见第五章),取L?R。

cj?aj?(1?aj),wij?dij?(1?dij)令

mDi??ADij?1

ijDi的隶属函数为

mDi(di)?supkj?1?[Aj(uj)?Dij(uij)]

di??ajdijj?1则Di为识别对象X与第i类雷达的贴近程度的模糊测度。

为得到X所属雷达类别的确切判决,类似于阈值法则,给定水平值?,令

di?sup?di|di?(Di)??di?inf?di|di?(Di)??

若 di?max?di:1?i?n?且i0唯一,则判定X为i0类雷达;

0若 di?di?max?di:1?i?n?且di?di,则判定X为i1类雷达。

1212用上述方法(将权系数及贴近度模糊化),经上千次仿真试验,比传统的贴近度及线性加弘平均法,误判率有所下降。

第三章 模糊规划

§3-1 模糊极值

一、有界函数的模糊极值

设 f:X?R (R为实数集)

x?y?f(x)

是有界函数,求函数f(x)的普通极值问题是求x?使

f(x)?max??f(x)x?X?

满足上式的x?为f(x)在X上的最大值点,f(x?)为最大值,最大值点不一定唯一.

设f(x)的一切最大值点的集合为

M?xf???f(x)?maxf(x),x?X

?称Mf为f(x)的优越集.当x?Mf时,函数在x处取到最大值f(x),x使f(x)达到最优.当x?Mf时,f(x)虽不是最大值,但对不同的x,f(x)与最大值的差异有所不同,也就是说,对于不属于Mf的x,它们的“优越性”程度

模糊化,并

有所不同,为了反映X中各点不同的优越程度,将优越集M利用它将极值模糊化.

定义1设f:X?R是有界函数,定义Mff的隶属函数为

Mf(x)?f(x)?min?f(x)x?X?max?f(x)x?X??min?f(x)x?X? (?x?X)

称Mf为f的无条件模糊优越集称f(Mf)的f的无条件模糊极大值.这里f(Mf)?F(R),它的求属函数按扩张原理为

f(Mf)(y)???Mf(x)f(x)?y? (约定???0)

注 (1)当x?x1为f(x)的极大点,即f(x1)?max?f(x)x?X?时Mf(x1)?1,

当x?x2为f(x)的极小点,即f(x2)?min?f(x)x?X?时

Mf(x2)?0,f(x1)?f(x2)充分必要条件是

Mf(x1)?Mf(x2)

??x1x2?X?

(2)当y1?max?f(x)x?X?时,f(Mf)(y1)???Mf(x)f(x)?y1?

当y2?min?f(x)x?X?时,f(Mf)(y2)???Mf(x)f(x)?y2? 当y?f(X)?R时,

f(Mf)(y)???Mf(x)f(x)?yy?f(x)?????0

因此,f(Mf)(y)反映了在模糊意义下,y对f的模糊数大值的求属程度.

例1

设X??x1,x2,x3,x4,x5?,

f:X?R,

定义f(x1)?0, f(x2)?3, f(x3)??1f(x4)?1, f(x5)?1,则

maxf(x)?3 minf(x)??1, 并且Mf(x)?(f(xi)?1)4(i?1,2,3,4,5)

于是Mf?(0.25,0,1,0.5,0.5)

又 f(Mf)(0)???Mf(x)f(x)?0??Mf(x1)?0.25 f(Mf)(3)?Mf(x2)?1

f(Mf)(?1)?Mf(x3)?0

f(Mf)(1)???Mf(x)f(x)?1??Mf(x4)?Mf(x5)?0.5

故 f(Mf)?0.25/0?1/?1?1/3?0.5/1

f的无条件模糊极小集mf定义为?f的无条件极大集,显然有

max?f(x)x?X??f(x)max?f(x)x?X??min?f(x)x?X? mf(x)? (?x?X)

且有,mf(x)?1?Mf(x),所有极小集mf是极大集M二、模糊约束下有界函数的模糊极值

f的余集.

设:f:X?R是有界函数,C?F(X),考虑f在C约束下的最大值问题,这是一个模糊规划问题,求解这个问题意味着既要最大限度地满足约束,又要最大限度地达到理想目标,为此定义如下:

定义2 设目标函数f:X?R是有界函数,C?F(X)是模糊约束,令

D?C?Mf

这里的Mf是定义1中f的无条件模糊优越集,称D为f在C约束下

的条件模糊优越集,称f(D)为f在C约束下的条件模糊极大值.它们的求属函数分别为:

Mf(x)?f(x)?min?f(x)x?X?max?f(x)x?X??min?f(x)x?X?D(x)?C(x)?Mf(x)

f(D)(y)???D(x)?(C(x)?Mf(x))f(x)?y?

求解目标函数f(x)在模糊约束C下的条件极大值有如下三个步骤: (1)求无条件模糊优越集Mf

(2)求条件模糊优越集D?C?Mf (3)求条件最佳决策,即选择x?,使

D(x)?max?D(x)x?X?

???x就是所求的条件极大点,f(x)就是在模糊约束C下的条件极大值.

例2采区巷道布置是矿井开拓中的重要内容,其目的就是建立完善的矿井生产系统,实现采区合理集中生产,改善技术经济指标.因此,合理地选择最优巷道布置方案,对于矿井生产具有十分重要的意义.根据煤矿开采的特点和采区在矿井生产的作用,在选择最优巷道布置方案时,要求达到下列标准:

(1)生产集中程度高; (2)采煤机械化程度高; (3)采区生产系统十分完善; (4)安全生产可靠性好; (5)煤炭损失率低; (6)巷道掘进费用尽可能低.

上述问题,实际上就是一个模糊约束下的条件极值问题,我们可以把(1)~(5)作为模糊约束,而把(6)作为目标函数.

设某矿井的采区巷道布置有六种方案可供选择,即X={x1(方案Ⅰ), x2 (方案Ⅱ), x3(方案Ⅲ), x4(方案Ⅳ), x5(方案Ⅴ), x6(方案Ⅵ)}.

经过对六种方案进行审议,评价后,将其结果列于表1

方案 评价项目 C1:生产集中程度高 C2:采煤机械化程度高 C3:采区生产系统完善 x1 x2 x3 x4 x5 x6 较低 高 一级 较低 高 高 较高 较低 一般 较高 较高 较高 较低 较低 一般 很高 高 很高 高 一般 较高 很高 高 一般 一般 较高 高 较高 高 很低 C4:安全生产可靠度高 C5:煤炭损失率低 C6:mf巷道掘进费用(万元) 59.40 69.10 78.80 34.50 44.20 63.60 将表

1

中的语言真值(评价结果)转化为各模糊约束集

Ci?F(X),(i?1,2,3,4,5)的隶属度转化的对应关系如下:

对C1, C2, C3, C4而言,对应关系为: 很 低 0.0

对 C5而言,对应关系为 很 低 1.0

将表1中的巷道掘进费用目标函数f用公式

maxf?f(x)maxf?minf较 低 0.2 一 般 0.4 较 高 0.6 高 0.8 很 高 1.0 较 低 0.8 一 般 0.6 较 高 0.4 高 0.2 很 高 0.0 mf(xi)?

计算出,因此得表2

其值语言与隶属函数转换表2

方案 CImf x1 x2 x3 x4 x5 x6 C1 C2 C3 0.2 0.8 0.4 0.2 0.2 0.44 0.8 0.6 0.2 0.4 0.4 0.22 0.4 0.6 0.2 0.2 0.6 0 1.0 0.8 1.0 0.8 0.6 1 0.6 1.0 0.8 0.4 0.6 0.78 0.6 0.8 0.6 0.8 1.0 0.34 C4 C5 mf

计算模糊判决集D为

D?mf?C1?C2?C3?C4?C5 (按列求最小) ?0.2/x1?0.2/x2?0/x3?0.6/x4?0.4/x5?0.34/x6 由maxD(xi)?0.6?D(x4)

xi?X根据最大求属度原则,方案四最优

例3 在某种食品中投放某种调味剂,每公斤食品中的含量设为x克,对顾客爱好作调查统计,得爱好函数为

?x(1?x/10)e,?2f(x)???0,?0?x?100,

x?100. 对于使爱好函数值越大的x值,所制产品越畅销,因而收益越大,但是由于成本核算等等原因,对x值需要进行限制,这种限制集合的边界是模糊的,即x的约束条件为一模糊集A,其隶属函数为

?1, 0?x?1.??A(x)??

1?, x?1.2?1?(x?1)?试确定合理的剂量x?,使得在接受约束的条件下,获得最优收益. 解 这是一个规划问题,分三步进行.

(1) 求无条件模糊优越集Mf?(x)?12e(1?x/10)f,由于

?x20e(1?x/10),

令f?(x)?0,得x?10.又当x?10时,f?(x)?0,x?10时,

f?(x)?0,因而supf(x)?f(10)?5,inff(x)?f(0)?0.因此

?x(1?x/10)e, 0?x?10?10Mf(x)??

?0 , x?100?(2) 求条件模糊优越集Af

?x(1?x/100?e, 0?x?x,?10?1??Af(x)?A(x)?Mf(x)??, x?x?100 2?1?(x?1)? 0 , x?100??其中x?满足方程

x10e(1?x/10)?11?(x?1)2

(3) 选择x,使

Af(x)???11?(x?1)?2?0.4593,

即A对目标f的可能度为45.93%,而要实现这种可能性,应选择调味剂的最佳剂量为2.085克.

0?1A(x)Mf(x)Af(x)1x?X

需要说明的是,在本例中如果将约束条件确切化,以A的核[0,1]为约束,这是一个普通规划问题,所得结论是选择最佳剂量为1克.从约束条件看,已是100%遵守,但所能达到的最高目标相对整个目标函数来说是很低的,由Mf(1)?0.246,说明相对整个目标来说,其优越程度仅达24.6%.如果把条件放松为模糊约束条件A,且适当降低A(x)的水平,却可以获得较好的目标值.如例中的结果,当x??2.085时,从接受约束条件来看虽仅达45.9%,但目标函数的优越程度也升到了45.9%,从而提高了整体优化水平.由于在实际问题中,约束条件往往不是绝对的,有一定的伸缩性,模糊规划的思想就是利用这点灵活性,兼顾目标函数与约束条件综合地选择最优方案.

例4 植物的种植密度与产量有密切的关系.已知某种杉树的种植密度?与产量V的关系如下:

V?f(?)?106?,(??1000)

V表示每公顷土地产出木材的体积.这里?表示每公顷土地上种植的棵数,

现有一片杉树森林,其密度不均匀,估计?“大约是三千”.试估计该森林每公顷木材最高产量.

解 设C表示“大约是三千”这一模糊,C的隶属函数为

C(x)?e?(??3000)10000002, (??R)

估计木材产量的问题,就是求在C的约束下函数f的模糊条件极大值.为此先求有界函数f的无条件模糊优越集.因supf(?)?500,inf??1000??1000f(?)?0,所

Mf(?)?f(?)?0500?0?1500f(?)?103?

f在约束条件C下的条件模糊优越集为:

C?C?Mf,Cf(?)?C(?)?Mf(?)

f条件模糊极值为f(Cf),其隶属函数为:

f(Cf)(y)???1[C(?)?Mf(?)]

??f(y)为求条件最佳决策??,即满足条件

??Cf(?)?maxCf(?)的?

??1000注意到Mf的隶属函数曲线是单调降的,而C是正态分布模糊集,f在约

束C下的模糊最佳决策(即模糊条件极大点),是方程

103??e?(??3000)100002

的两个根当中的较小者,解之得???2130.

由Cf(2130)?0.469?46.9%可知,???2130时,接受约束的程度为46.9%,同时,相对于整体目标函数,优越程度也是46.9%.

由f(2130)?334.74(米3)可知,该森林每公顷木材最高产量估计为

334.74(米).

3

§3-2 模糊线性规划

一、普通线性规划

普通线性规划的一般形式为 目标函数max Z?c1x1?c2x2??cnxn

?a11x1?a12x2??a1nxn?b1?ax?a22x2??a2nxn?b2?211?约束条件 ???

?ax?ax??ax?bm11m22mnnm???xj?0(j?1,2,?,n)矩阵表达形式

maxZ?CX?AX?b??x?0

其中

?a11?a1n?A??????a?amn?m1??? C?(c1,c2??cn) ??TTx?(x1,x2??xn) b?(b1,b2,?bm)

线性规划问题的标准形式

maxZ?CX?AX?b??x?0 (3-1)

二、模糊线性规划

在实际问题中,有时线性规划的约束条件带有模糊性,这就是解谓的模糊线性规划,其模型为

maxZ?c1x1?c2x2???cnxn

~?a11x1?a12x2???a1nxn?b1?~?a21x1?a22x2???a2nxn?b1? ? ? ?~?am1x1?am2x2???amnxn?bm??xj(j?1,2?n)

~这是“?”表示一种弹性约束,可读作“近似小于等于”.“近似小于等于”

n是一个模糊概念,可以用一个模糊集来表示它.?aijxj表示第i个约束的左

j?1n边表达式,模糊集Di表示“

?j?1~aijxj?bi”这一事实,当

n?aj?1ijxj?bi 时,完

全接受约束,应有Di(x)?1;适当选择一个伸缩系数di,约定当

nn?j?1naijxj?bi?di时,不认为

?j?1~aijxj?bi,这时应有Di(x)?0;当

?aj?1ijxj?[bi,bi?ai]时,Di(x)应从1下降到0,表示约束程度降低.为了简

单可行,Di(x)规定如下:

~设 X?xx?Rn,x?0,对每一个约束aijxj?bi,相应地有X中一个

??模糊渠Di与之对应,它的隶属函数为

??1 aijxj?bi ?nnn?Di(x)?fI(?aijxj)?1?(?aijxj?bi)/di bi??aijxj?bi?di

j?1j?1j?1?n??0 ?aijxj?bi?di j?1?

其中di是适当选择的常数,叫做伸缩指标,di?0i?1,2,?m,这样

一来,我们将弹性约束转化成模糊约束,再令D?D1?D2???Dm就将全部约束条件转化成一个模糊约束.

~当di?0(i?1,2?m)时,D退化为普通约束集D,模糊约束条件中“?”

退化为“?”

模糊线性规划的模型简记为

maxZ?Cx~?AX?b (3-2) ??x?0约束的弹性必然导致目标的弹性,为将目标函数模糊化,先求解普通线性规划问题:

maxZ?Cx

?AX?b 满足 ? (3-3)

x?0?以及 maxZ?Cx 满足 ???AX?b ?d x?0 (3-4)

T其中d?(d1,d2,?,dm)称为(3-2)的伸缩指标向量.

设Z0是(3-32)的最优值,Z1是(3-4)的最优值.Z0所满足的约束条件为

Ax?b,对应的模糊约束D(x)?1.若适当降低模糊约束的隶属度D(x),可

以相应提高目标函数值Z,Z1所满足的约束条件已放到最宽Ax?b?d,对

应的模糊约束D(x)也接近于0.于是目标函数的弹性可表示为

Z0?Z?Cx?Z1.为此构造模糊目标集G(x)?F(X).其隶属函数为

n??0 ?cjxj?z0j?1?nn?cjxj)??(?cjxj?z0)/d0 z??cjxj?z0

j?1?j?1n??1 ?cjxj?z0)j?1?nG(x)?g(?j?1 其中d0?Z1?Z0

由模糊目标的上述隶属函数可知,当D(x)?1时,G(x)?0,要提高目标函数值使之大于Z0.就必须降低D(x).为了兼顾目标与约束,可采用模糊决策为DF?D?G,最佳决策为x?,x?满足

DF(x)?maxx?X?DF(x)?maxx?X?(D(x)?G(x))

若令??D(x)?G(x), 则有

max(D(x)?G(x))?max??D(x)??,G(x)?0,??[0,1]x?X?

?max??D1(x)??,?,Dn(x)??,G(x)??,??[0,1]x?X?于是求最佳决策x?的问题,就转化为求普通线性规划问题:

maxZ??n??1?(?aijxj?bi)/di?? (i?1,2,?m)j?1?n ?(cx?Z)/d????jj00j?1?????0,xj?0 (j?1,2?n)?

maxZ???n??aijxj?di??bi?di (i?1,2?m)?j?1 (3-5) ?cx?d??Z?jj00?????0xj?0(j?1,2?n)?

求解上述普通规划问题,可得

最佳决策 x??(x?1,?,x?n)T

n目标函数值 Z???c?jxj.

j?1

例5:求解模糊线性规划问题

maxZ?x1?3x2?x3?x1?2x2?x3?8???x1?3x2?x3?2 ??x1,x2,x3?0取伸缩指标d1?2,d2?8

解 (一)解普通线性规划

maxZ?x1?3x2?x3?x1?2x?2?x3?8??x1?3x2?x3?2 ??xi?0i?1,2,3最优解x(0)?(4,2,0)T最优值

(二)解普通线性规划

maxZ?x1?3x2?x3?x1?2x2?x3?8?2???x1?3x2?x3?2?8 ??xi?0i?1,23,4,5最优解x(1)?(2,4,0)T Z1?14 Z0?10(3-6) (三) 解普通线性规划

maxZ???x1?2x2?x3?2??8?2 ??x?3x?x?8??2?8 ?123?x?3x?x?(14?10)??023?1 解 这个线性规划采用大M法 原线性规划改写为

maxZ???Mx7?x1?2x2?x3?2??x4?10???x1?3x2?x3?8??10 ?x?3x?x?4??x?x?102367?1(M充分大的正数)

∴x??(3,3,0)T ??1/2

从而(3-4)的最优值

例6某企业根据市场信息及自身生产能力,准备开发甲、乙两种系列产品.甲种系列产品最多大约能生产400套,乙种系列产品最多大约能生产250套.据测算,甲种产品每套成本3万元,每套获纯利润7万元;乙种系列产品每套成本2万元,每套获纯利润3万元.生产甲、乙两种系列产品的资金总投入大约不能超过1500万元.在上述条件下,如何安排两种系列产品的生产,才能使企业获利最大?

解 设甲种系列产品生产x1套,乙种系列产品生产x2套,则 目标:maxz?7x1?3x2

~?3x1?2x2?1500 (1)?~?x1?400 (2)约束:?~ (3-7)

?x2?250 (3)?x?0,x?02?1设约束条件(1)、(2)、(3)的伸缩系数分别取为d1?50(元),d2?5(套),

d3?5(套).为将目标函数模糊化,解经典线性规划问题

使

maxz?7x1?3x2?3x1?2x2?1500? (4) ?x1?400??x2?500?x?0,x?02?1用单纯形法求解,得z0?3250,x1?400,x2?150 再解经典线性规划问题

maxz?7x1?3x2?3x1?2x2?1500 ?50? (5) ?x1?400 ?5 ??x2?250?5?x?0,x?02?1解得

z1?z0?d0?3337.5,x1?405,x2?167.5

于是

d0?3337.5?3250?87.5

将z0、d0、d1、d2、d3代入(3-5),将原问题经为经典线性规划问题:

max?

?3x1?2x2?50??1500?50?x?5??400?5?1?使 ?x2?5??250?5

?7x?3x?87.5??32502?1????0,x1?0,x2?0??

上述线性规划问题最优解为x1?402.5,x2?158.75,??0.5.因此安排甲种系列产品403套、乙种系列产品159套(取整数)时,能获得最大利润,最大利润为:

z?7x1?3x2?3293.75万元

???对比经典线性规划问题(4),利润提高43.75万元,这是因为甲种系列产品403套比400套多3套;乙种系列产品生产159套比150套多9套,这是在伸缩指标允许范围内.总费用3x1?2x2?1527元虽然比1500超出27元,这也是伸缩指标允许的.以上讨论说明,在适当放松约束时可以提高利润.

??

Z??3?3?3?0?12

编者:山东科技大学济南校区公共课部 唐林炜 张来亮 樊铭渠

高国成 麻兴斌

参考文献

1、胡淑礼 模糊数学及其应用,四川大学出版社,1994.

2、张跃、邹寿平、宿芬,模糊数学方法及其应用,煤炭工业出版社,1992. 3、李安贵、张志宏、段凤英、模糊数学及其应用,冶金工业出版社,1994. 4、杨雄、李崇文,模糊数学和它的应用,天津科技出版社,1993. 5、唐林炜、樊铭渠伪模糊度的公理化定义及余滋伪模糊度,系统工程理论与实践,1999(8).

6、唐林炜、高国成、樊铭渠、无解的模糊关系方程的最优近似解,模糊系统与数学,1999(3).

§1 变分法简介

作为数学的一个分支,变分法的诞生,是现实世界许多现象不断探索的结果,人们可以追寻到这样一个轨迹:

约翰·伯努利(Johann Bernoulli,1667-1748)1696年向全欧洲数学家挑战,提出一个难题:“设在垂直平面内有任意两点,一个质点受地心引力的作用,自较高点下滑至较低点,不计摩擦,问沿着什么曲线下滑,时间最短?”

这就是著名的“最速降线”问题(The Brachistochrone Problem)。它的难处在于和普通的极大极小值求法不同,它是要求出一个未知函数(曲线),来满足所给的条件。这问题的新颖和别出心裁引起了很大兴趣,罗比塔(Guillaume Francois Antonie de l'Hospital 1661-1704)、雅可比·伯努利(Jacob Bernoulli 1654-1705)、莱布尼茨(Gottfried Wilhelm Leibniz,1646-1716)和牛顿(Isaac Newton1642—1727)都得到了解答。约翰的解法比较漂亮,而雅可布的解法虽然麻烦与费劲,却更为一般化。后来欧拉(Euler Lonhard,1707~1783)和拉格朗日(Lagrange, Joseph Louis,1736-1813)发明了这一类问题的普遍解法,从而确立了数学的一个新分支——变分学。

有趣的是,在1690年约翰·伯努利的哥哥雅可比·伯努利曾提出著名的悬链线问题 (The Hanging Chain Problem)向数学界征求答案,即,固定项链的两端,在重力场中让它自然垂下,问项链的曲线方程是什么。在大自然中,除了悬垂的项链外,我們还可以观察到吊桥上方的悬垂钢索,挂着水珠的蜘蛛网,以及两根电线杆之间所架设的电线,这些都是悬链线(catenary)。

伽利略(Galileo, 1564~1643)比贝努利更早注意到悬链线,他猜测悬链线是抛物线,从外表看的确象,但实际上不是。惠更斯(Huygens, 1629~1695)在1646年(当时17岁),经由物理的论证,得知伽利略的猜测不对,但那时,他也求不出答案。到1691年,也就是雅可比·伯努利提出悬链线问题的第二年,莱布尼兹、惠更斯(以62岁)与约翰·伯努利各自得到了正确答案,所用方法是诞生不久的微积分,具体说是把问题转化为求解一个二阶常微分方程

?dydy2?a1?()?2dx?dxy(0)?y0??y?(0)?0??2

解此方程并适当选取参数,得

y?12a(eax?e?ax) (1)

即为悬链线。

悬链线问题本身和变分法并没有关系,然而这和最速降线问题一样都是贝努利兄弟间的相互争强好胜、不断争吵的导火索,虽然雅可比·贝努利在解决悬链线问题时略占下风,但他随后所证明的“悬挂于两个固定点之间的同一条项链,在所有可能的形状中,以悬链线的重心最低,具有最小势能”,算是扳回了一局,俩兄弟扯平了!之所以提到悬链线问题,有两方面考虑,其一,这是有关数学史上著名的贝努利家族内的一个趣闻,而这是一个在变分法乃至整个数学物理领域有着巨大贡献的家族,其二,有关悬链线的得几个结论,可以用变

分法来证明!

现实中很多现象可以表达为泛函极小问题,我们称之为变分问题。求解方法通常有两种:古典变分法和最优控制论。我们这儿要介绍的基本属于古典变分法的范畴。 1.1 变分法的基本概念 1.1.1 泛函的概念

设S为一函数集合,若对于每一个函数x(t)?S有一个实数J与之对应,则称J是定义在S上的泛函,记作J(x(t))。S称为J的容许函数集。

例如,在[x0,x1]上光滑曲线y(x)的长度可定义为

J??x1x01?y?dx (2)

2考虑几个具体曲线,取x0?0,x1?1, 若y(x)?x,则

J(y(x))?J(x)?1?01?1dx??x2

?1若y(x)为悬链线,则

J(ex?e2?x)??101?(ex?e4?x)2dx??1ex?e20dx?e?e2

1对应C[x0,x1]中不同的函数y(x),有不同曲线长度值J,即J依赖于y(x),是定义在1函数集合C[x0,x1]上的一个泛函,此时我们可以写成

J?J(y(x))

我们称如下形式的泛函为最简泛函

J(x(t))??tft0?(t))dt (3) F(t,x(t),x?(t)。上述曲线长度泛函即为一最简泛函。 被积函数F包含自变量t,未知函数x(t)及导数x1.1.2 泛函极值问题

考虑上述曲线长度泛函,我们可以提出下面问题:

在所有连接定点A(x0,y0)和B(x1,y1)的平面曲线中,试求长度最小的曲线。 即,求y(x)?y(x)y(x)?C1[x0,x1],y(x0)?y0,y(x1)?y1,使 J(y(x))????x1x01?y?dx

2取最小值。此即为泛函极值问题的一个例子。以极小值为例,一般的泛函极值问题可表述为,

称泛函J(x(t))在x0(t)?S取得极小值,如果对于任意一个与x0(t)接近的x(t)?S,都有J(x(t))?J(x0(t))。所谓接近,可以用距离d(x(t),x0(t))??来度量,而距离可以定义为

?(t)?x?0(t)|} d(x(t),x0(t))?max{|x(t)?x0(t)|,|xt?t?t0f泛函的极大值可以类似地定义。其中x0(t)称为泛函的极值函数或极值曲线。

1.1.3 泛函的变分

如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为泛函的自变量,函数x(t)在x0(t)的增量记为

?x(t)?x(t)?x0(t)

也称函数的变分。由它引起的泛函的增量记作

?J?J(x0(t)??x(t))?J(x0(t))

如果?J可以表为

?J?L(x0(t),?x(t))?r(x0(t),?x(t))

其中L为?x的线性项,而r是?x的高阶项,则称L为泛函在x0(t)的变分,记作 ?J(x0(t))。用变动的x(t)代替x0(t),就有?J(x(t))。

泛函变分的一个重要形式是它可以表为对参数?的导数:

?J(x(t))?这是因为当变分存在时,增量

?J?J(x(t)???x)?J(x(t))?L(x(t),??x)?r(x(t),??x) 根据L和r的性质有

L(x(t),??x)??L(x(t),?x)

limr(x(t),??x)?limr(x(t),??x)???J(x(t)???x(t))??0 (4)

??0???0??x?x?0

所以

???J(x???x)??0?limJ(x???x)?J(x)??0?

?limL(x,??x)?r(x,??x)??0??L(x,?x)??J(x)

1.2 泛函极值的相关结论

1.2.1 泛函极值的变分表示 利用变分的表达式(4),可以得到有关泛函极值的重要结论。

泛函极值的变分表示:若J(x(t))在x0(t)达到极值(极大或极小),则

?J(x0(t))?0 (5)

证明:对任意给定的?x,J(x0???x)是变量?的函数,该函数在??0处达到极值。根据函数极值的必要条件知

???J(x0???x)??0?0

再由(4)式,便可得到(5)式。

变分法的基本引理:?(x)?C[x1,x2],??(x)?C1[x1,x2],?(x1)??(x2)?0,有

?x2x1?(x)?(x)dx?0,

则 ?(x)?0, x?[x1,x2]。 证明略。

1.2.2 泛函极值的必要条件

考虑最简泛函(3),其中F具有二阶连续偏导数,容许函数类S取为满足端点条件为固定端点(6)的二阶可微函数。

x(t0)?x0,x(tf)?xf (6)

泛函极值的必要条件:设泛函(3)在x(t)∈S取得极值,则x(t)满足欧拉方程

Fx?ddtFx??0 (7)

欧拉方程推导:首先计算(3)式的变分:

?J? ? ????tfJ(x(t)???x(t))?????0

dt

?t0?(t)???x?(t))F(t,x(t)???x(t),x??0?tft0?)?x?Fx?? [Fx(t,x,x?(t,x,x)?x]dt对上式右端第二项做分布积分,并利用?x(t0)??x(tf)?0,有

?所以

tft0?)?x?dt???Fx?(t,x,xddttfddtt0?)?xdt, Fx?(t,x,x?J??tft0[Fx?Fx?]?xdt

利用泛函极值的变分表示,得

?tft0[Fx?ddtFx?]?xdt?0

因为?x的任意性,及?x(t0)??x(tf)?0,由基本引理,即得(7)。 (7)式也可写成

??Fx?x????0 (8) Fx?Ftx??Fxx?xx通常这是关于x(t)的二阶微分方程,通解中的任意常数由端点条件(6)确定。 1.2.3几种特殊形式最简泛函的欧拉方程

?,即F?F(t,x) (i) F不依赖于x 这时Fx??0,欧拉方程为Fx(t,x)?0,这个方程以隐函数形式给出x(t),但它一般不满足边界条件,因此,变分问题无解。

(ii) F不依赖x,即F?F(t,x?) 欧拉方程为

ddt?)?0 Fx?(t,x?)?c1,由此可求出x???(t,c1),积分后得到可能的将上式积分一次,便得首次积分Fx?(t,x极值曲线族

x????t,c?dt

1?,即F?F(x?) (iii) F只依赖于x这时Fx?0,Ftx??0,Fxx??0,欧拉方程为

??Fxx?x??0

??0或Fx?x??0,如果???0,则得到含有两个参数的直线族x?c1t?c2。另外xx由此可设?若Fx?x??0有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c的直线族

x?kt?c,它包含于上面含有两个参数的直线族 x?c1t?c2 中,于是,在F?F(x?)情

况下,极值曲线必然是直线族。

?,即F?F(x,x?) (iv)F只依赖于x和x这时有Ftx??0,故欧拉方程为

?Fxx???xFx?x??xFx??0

此方程具有首次积分为

?FxF?x??c1

事实上,注意到F不依赖于t,于是有

ddt?Fx?)?Fxx??Fx??????Fx??x?(F?xxxddt?(Fx?Fx??xddtFx?)?0。

1. 3 几个经典的例子

1.3.1 最速降线问题

最速降线问题 设A和B是铅直平面上不在同一铅直线上的两点,在所有连结A和B的平面曲线中,求一曲线,使质点仅受重力作用,初速度为零时,沿此曲线从A滑行至B的时间最短。

解 将A点取为坐标原点,B点取为B(x1,y1),如图1。根据能量守恒定律,质点在曲

线y(x)上任一点处的速度

1dsdt2满足(s为弧长) A(0, 0) x ?ds? m???mgy

2?dt?将ds?21?y'(x)dx代入上式得 B(x1,y1) dt?1?y'2dx

y 图1最速降线问题

2gy于是质点滑行时间应表为y(x)的泛函

J(y(x))??x21?y'202gydx

端点条件为

y(0)?0,y(x1)?y1

最速降线满足欧拉方程,因为

F(y,y')?1?y'2y

不含自变量x,所以方程(8)可写作

Fy?Fyy'y'?Fy'y'y''?0

等价于

ddx(F?y'Fy')?0

作一次积分得

y(1?y'2)?c1 令 y'?ctg?2,则方程化为

y?c11?y'2?c1sin2?2?c12(1?cos?)

又因

dyc1sin?cos?2d?dx?c1y'?2?2(1?cos?)d?

ctg?2积分之,得

x?c2(??sin?)?c2

由边界条件y(0)?0,可知c2?0,故得

c1?x?(??sin?)??2 ??y?c1(1?cos?).??2这是摆线(园滚线)的参数方程,其中常数c1可利用另一边界条件y(x1)?y1来确定。 1.3.2 最小旋转面问题

最小旋转面问题 对于xy平面上过定点A(x1,y1)和B(x2,y2)的每一条光滑曲线

y(x),绕x轴旋转得一旋转体。旋转体的侧面积是曲线y(x)的泛函J(y(x)),易得

J(y(x))??x2x122?y(x)1?y'(x) dx

容许函数集可表示为

S?y(x)|y(x)?C[x1,x2],y(x1)?y1, y(x2)?y2

?1?解 因F?y1?y\ 不包含x,故有首次积分

F?y'Fy'?y1?y'?y'y2y'1?y'2?c1

化简得 y?c11?y'2

令y'?sht,代入上式, y?c11?sh2t?c1cht 由于 dx?dyy'?c1shtdtsht?c1dt

积分之,得 x?c1t?c2 消去t,就得到y?c1chx?c2c1 。

这是悬链线方程,适当选择条件(令该悬链线过(0,1/a)点,且该点处的切线是水平的)就可得到(1)。本例说明,对于平面上过两个定点的所有光滑曲线,其中绕x轴旋转所得旋转体的侧面积最小的是悬链线!

1.3.3 悬链线势能最小

1691年,雅可比·伯努利证明:悬挂于两个固定点之间的同一条项链,在所有可能的形状中,以悬链线的重心最低,具有最小势能。下面我们用变分法证明之。

考虑通过A、B两点的各种等长曲线。令曲线y=f(x)的长度为L,重心坐标为(x,y),

L?由重心公式有

?bads??ba1?(dydx)dx

2x??bax1?(Ldydx)dx2 , y??bay1?(Ldydx)dx2

由于只需探讨曲线重心的高低,所以只对纵坐标的公式进行分析,注意到问题的表述,说明L是常数,不难看出重心的纵坐标是y(x)的最简泛函,记作

J(y(x))?b?ay(x)1?(y?)dx

2此时对应的欧拉方程(8)可化为

yy???(y?)?1?0

2令p?dydx解得 y2?k(1?p2),k?0,进而得

1kch[k(x?c)]。

y?此即为悬链线,它使重心最低,势能最小!大自然中的许多结构是符合最小势能的,人们称之为最小势能原理。 1.4 泛函极值问题的补充

1.4.1 泛函极值的几个简单推广

(ⅰ)含多个函数的泛函 使泛函

J(y(x),z(x))??x2x1F(x,y,y',z,z')dx

取极值且满足固定边界条件

y(x1)?y1,y(x2)?y2,z(x1)?z1,z(x2)?z2.

的极值曲线y?y(x),z?z(x)必满足欧拉方程组

d?Fy?Fy'?0??dx ??F?dF?0zz'?dx?(ii)含高阶导数的泛函

使泛函 J(y(x))??x2x1F(x,y,y',y\)dx

取极值且满足固定边界条件

本文来源:https://www.bwwdw.com/article/kys.html

Top