多元函数极值问题探究--0932098--李开

更新时间:2024-06-26 21:49:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中央民族大学学士论文

Bachelor Thesis of Minzu University of China

多元函数极值问题探究

An Extremum Exploration of Multivariate Function

姓名:李开

学号:0932098年级:09级 院系:理学院

专业:信息与计算科学 指导老师:李成岳 日期:2013/4/24

摘要

本文首先介绍了二元函数极值的定义,并运用二元函数的泰勒公式和连续性定理证明了二元函数取极值的必要条件和充分条件,着重讨论了临界条件下判别式等于零的情况,并给出了进一步讨论的方法,之后利用曲面理论引进了二元函数极值问题的几何意义并结合坐标平移法给出了求一些无稳定点的二元函数的极值的方法。本文接着将二元函数推广至多元函数,又结合高等代数中二次型理论及微分几何中曲面第二基本形式理论给出了多元函数极值的定义,必要条件,充分条件和几何意义并予以了证明。本文还介绍了多元函数条件极值的定义,必要条件和充分条件,并引入了拉格朗日乘数法这一求条件极值的有力工具。本文最后给出了多元函数极值理论的一些应用,如最小二乘法,空间距离和不等式的证明以及在实际运用多元函数极值理论求解时的一些注意事项和技巧策略。

关键词:泰勒公式二次型曲面基本形式II拉格朗日乘数法 Abstract

Firstly this thesis introduces the definition of binary function extremum, proves the necessary and sufficient conditions of the binary function at its extremal point using Taylor’s formula and continuity theorem, offers a method of further exploration on critical condition where the discriminant equals to zero, explains the geometrical meaning of binary functionextremum based on curved surface theory, and puts forward a method of seeking the extremal point ofsome binary functions without stationary points using coordinate translation. Secondly this thesis extends binary function extremum to multivariate, introduces its definition, proves its necessary and sufficient conditions at its extremal point, and explains its geometrical meaning combined with the quadraticformtheory of advanced algebra and the second fundamental formtheory of curved surface of differential geometry. Besides this thesis describes the definition of multivariate function conditional extremum, and introduces Lagrange multiplier method, a useful tool solving conditional extremum problems, when proving its necessary and sufficient conditions. Finally this thesis introduces some applications of multivariate function extremum theory, such as least square method, problems concerning spatial distance and inequality proof, and some precautions and strategies when solving problems involved using multivariate function extremum theory.

Key words:Taylor’s Formula, QuadraticForm, the Second Fundamental

Form of Curved Surface, Lagrange Multiplier Method

2

正文

一、二元函数极值

1.二元函数极值的定义

设二元函数f(x,y)在点P(a,b)的邻域G内有定义。若?(a?h,b?k)?G,有

f(a?h,b?k)?f(a,b)(f(a?h,b?k)?f(a,b)),则称点P(a,b)为函数f(x,y)的

极大点(极小点),极大点(极小点)的函数值f(a,b)称为函数f(x,y)的极大值(极小值)。极大点与极小点统称为极值点,极大值与极小值统称为极值。 2.二元函数极值存在的必要条件

若二元函数f(x,y)在点P(a,b)存在两个偏导数,且P(a,b)是函数f(x,y)的极值点,

''则fx(a,b)?0与fy(a,b)?0。

'??fx(a,b)?0而由方程组?'确定的解(坐标平面上的某些点)称为函数f(x,y)的稳

??fy(a,b)?0定点。需要指出的是二元函数的极值点一定是稳定点,但稳定点不一定是极值点。 3.二元函数极值存在的充分条件

设二元函数f(x,y)有稳定点P(a,b),且在点P(a,b)的邻域G内存在二阶连续偏

''''2导数,令A?fxx(a,b),B?fxy(a,b),C?fyy(a,b).??B?AC .

''1) 若??0,则点P(a,b)是函数f(x,y)的极值点: i)A?0(或C?0),点P(a,b)是函数f(x,y)的极小点; ii)A?0(或C?0),点P(a,b)是函数f(x,y)的极大点。 2) 若??0,则点P(a,b)不是函数f(x,y)的极值点。 3) 若??0,需作进一步的讨论。

证明:已知点P(a,b)是函数f(x,y)的稳定点,则有

fx'(a,b)?0与fy'(a,b)?0

当h与k充分小时,讨论f(a?h,b?k)?f(a,b)的符号,由二元函数泰勒公式

3

1??1??(h?k)f(a,b)?(h?k)2f(a,b)?…+1!?x?y2!?x?y

1??1??(h?k)nf(a,b)?(h?k)n?1f(a??h,b??k),(0???1)n!?x?y(n?1)!?x?yf(a?h,b?k)?f(a,b)?当n?1时,有

1''f(a?h,b?k)?f(a,b)?fx'(a,b)h?fy'(a,b)k?[fxx(a??h,b??k)h2?2

''''2fxy(a??h,b??k)hk?fyy(a??h,b??k)k2],0???1''由本题中的fx(a,b)?fy(a,b)?0,则

1''''f(a?h,b?k)?f(a,b)?[fxx(a??h,b??k)h2?2fxy(a??h,b??k)hk?2

''fyy(a??h,b??k)k2],0???1又已知二阶偏导数在点P(a,b)连续,当h?0与k?0时,有

''''fxx(a??h,b??k)?fxx(a,b)???A??,??0 ''''fxy(a??h,b??k)?fxy(a,b)???B??,??0 ''''fyy(a??h,b??k)?fyy(a,b)???C??,??0

于是

11f(a?h,b?k)?f(a,b)?(Ah2?2Bhk?Ck2)?(?h2?2?hk??k2)

2222222其中?h?2?hk??k比?(??h?k)是高阶无穷小,因此当h与k充分小时,

f(a?h,b?k)?f(a,b)的符号由Ah2?2Bhk?Ck2决定。因为h和k不能同时为零,不妨设k?0(当k?0,h?0时,可得得到相同的结论)

hhAh2?2Bhk?Ck2=k2[A()2?2B?C]

kkh(b,)的符号由D?At2?2Bt?C的符号决定。由一令?t,则f(a?h,b?k)?fak元二次方程根的判别式,有

1) 若判别式??(2B)2?4AC?B2?AC?0,对任意实数t,D与A(或C)有相同的符号,即点P(a,b)是函数f(x,y)的极值点:

4

i)A?0(或C?0),有f(a?h,b?k)?f(a,b)?0恒成立,即点P(a,b)是函数

f(x,y)的极小点;

ii)A?0(或C?0),有f(a?h,b?k)?f(a,b)?0恒成立,即点P(a,b)是函数

f(x,y)的极大点。

2) 若判别式??B2?AC?0,方程D?0有两个不同的实根t1与t2,设t1?t2,D在区间(t1,t2)内与在(t1,t2)外有相反的符号,即点P(a,b)不是函数f(x,y)的极值点。

B23) 若判别式??B?AC?0,不妨设A?0,则C?,得

A2B2BB2B2D?At?Bt??A(t?t?2)?A(t?)2

AAAA22a,b)?0恒成立,即点P(a,b)是函数f(x,y)的极I)A?0,有f(a?h,b?k)?f(小点;

b?k)?fa(b,)?0ii)A?0,有f(a?h,大点;

恒成立,即点P(a,b)是函数f(x,y)的极

III)A=0,由判别式??B2?AC?0知B?0,则D?At2?Bt?C?C,需对

C进一步讨论:

⑴C?0,有f(a?h,b?k)?f(a,b)?0恒成立,即点P(a,b)是函数f(x,y)的极小点;

⑵C?0,有f(a?h,b?k)?f(a,b)?0恒成立,即点P(a,b)是函数f(x,y)的极大点;

⑶C?0,有A?B?C?0,此时可令二元函数泰勒公式中的n?2,得

f(a?h,b?k)?f(a,b)?1??1??(h?k)f(a,b)?(h?k)2f(a,b)?…+1!?x?y2!?x?y1??(h?k)3f(a??h,b??k),(0???1)3!?x?y''由fx(a,b)?0,fy(a,b)?0及A?B?C?0,上式可化为

5

13?3?32f(a?h,b?k)?f(a,b)?[hf(a??h,b??k)?3hk2f(a??h,b??k)?33!?x?x?y3?33?3hkf(a??h,b??k)?kf(a??h,b??k)],0???123?x?y?y2可仿照n?1时的证明方法开展下去,作再进一步的讨论。 4.二元函数极值的几何意义

二元函数z?f(x,y)在三维空间坐标系中表示的是一张曲面,而函数f(x,y)在点P(a,b)邻域内的曲面可以看成是过点P(a,b)的所有平行于z轴的平面与在点P(a,b)邻域内的曲面z?f(x,y)相交产生的平面曲线的集合,所以曲面

z?f(x,y)在点P(a,b)邻域内的点也可以看成是在点P(a,b)邻域内的生成的平面曲线上的点。至于函数f(x,y)在点P(a,b)能否取得极值,是由点P(a,b)与其邻域内的点的函数值相比较而决定的。

I)当所有过点P(a,b)的生成平面曲线(可看成一元函数)在点P(a,b)都取得极大值时,则函数f(x,y)在点P(a,b)取得极大值;

II)当所有过点P(a,b)的生成平面曲线在点P(a,b)都取得极小值时,则函数f(x,y)在点P(a,b)取得极小值;

III)当所有过点P(a,b)的生成平面曲线中,有的在点P(a,b)取得极大值,有的在点P(a,b)取得极小值,或在点P(a,b)不取极值时,则函数f(x,y)在点P(a,b)不取极值。

可以得出用该方法求二元函数f(x,y)极值的步骤:

'?f?x(x,y)?01)由?'求出驻点或偏导不存在的点(xi,yi),i?0,1,2…;

??fy(x,y)?0?x?X?xi?2)作坐标平移变换?y?Y?yi,其中(X,Y,Z)为新坐标系中的点,新坐标系中的

?z?Z?原点为原坐标系中的点(xi,yi,0),记为O,则原二元函数变为Z?f(X?xi,Y?yi); 3)设Y?kX(k为任意常数),此方程在原坐标系中表示经过点(xi,yi,0)且平行

6

于z轴的平面簇,而在新坐标系中表示过z轴的平面簇,进而得到平面簇的函数表达式:

?Z?f(X?xi,Y?yi)得Z?f(X?xi,kX?yi),即自变量为X的一元函数,利用一?Y?kX?元函数求极值的方法求出极值,由于在坐标平移中z?Z,即得出原函数的极值。

二、多元函数极值

1. 多元函数极值的定义

设函数f:E??定义在集合E??m上,如果对于E的内点x0,存在邻域

U(x0)?E,对于任意x?U(x0)时,有f(x)?f(x0)(f(x)?f(x0)),则称函数f在E的内点x0有局部极大值(局部极小值)。

如果对于任意x?U(x0)\\x0有严格不等式f(x)?f(x0)(f(x)?f(x0)),则称函数

f在点x0有严格局部极大值(严格局部极小值)。

函数的局部极大值与局部极小值统称为函数的极值。 2.多元函数极值存在的必要条件

1m设函数f:U(x0)??定义在点x0?(x0,?,x0)的邻域U(x0)??m上,并且它

在点x0关于每个变量x0,?,x0存在偏导数。如果函数f在点x0有局部极值,则有

??f(x)?0,?,f(x0)?0 01m?x?x112m证明:考虑仅一个变量的函数?(x)?f(x,x0,?,x0),由定理条件知,它在

1m实轴上的点x0上的某个邻域内有定义,并且在点x0上有局部极值,因此

1?'(x0)?11?12mf(x0,x0,?,x0)?01?x

类似地可以证明其余等式。

称向量(?1f(x0),?,?mf(x0))为函数f在点x0的梯度,记为gradf(x0),

?x?x若该点的梯度为零(gradf(x0)?0)则点x0为函数f的稳定点。

需要指出的是函数的极值点一定是稳定点,但稳定点不一定是极值点。

3. 多元函数极值存在的充分条件

我们首先说明一下多元函数的泰勒公式,如果函数f:U(x)??在点x??m7

xxh?]Ux?()的邻域U(x)??m上有定义,并且属于函数类C(n?1)(U(x);?),而[,则有

f(x?h,?,x?h)?f(x,?,x)??11mm1m,

11??(h1???hmm)kf(x1,?,xm)??x?xk?1k!n1??(h11???hmm)n?1f(x1??h1,?,xm??hm),0???1(n?1)!?x?x

证明:从单变量函数的泰勒公式入手,考虑辅助函数?(t)?f(x?th),由已知条件知其定义在闭区间0?t?1上并且属于C(n?1)[0,1],则其在t?0点的泰勒公式为

?(t)??(0)???(k)(0)?1k?1k!n1?(n?1)(?t),0???1 (n?1)!又由归纳法可知?(n)(t)?(h1?m?n???h)f(x?th) 1m?x?x?x则令t?0时得?(n)(0)?(h1?1???hm?m)nf(x1,?,xm)

?x11?(n?1)(?),0???1 令t?1时,得?(1)?f(x?h)??(0)???(k)(0)?(n?1)!k?1k!将函数?(t)用函数f(x?th)替换即可得证。

1m再来设f:U(x0)??是定义在点x0?(x0,?,x0)的邻域U(x0)??m上且属于

nC(2)(U(x0);?)的函数,点x0是函数f的稳定点,称矩阵

?fx1x1,fx1x2,?,fx1xm???mmf,f,?,f???x2x1x2x2x2xm?H????ijf(x0)???为函数f在点x0的Hesse矩阵,???i?1j?1?x?x?????????fxmx1,fxmx2,?,fxmxm??x0则

1) 当H为正定矩阵时,点x0是函数f的局部极小值点; 2) 当H为负定矩阵时,点x0是函数f的局部极大值点; 3) 当H为不定矩阵时,需进一步讨论。

证明:设h?(h1,h2,?,hm)?0且x0?h?U(x0),讨论f(x0?h)?f(x0)的符号,

8

由多元函数的泰勒公式

f(x?h,?,x?h)?f(x,?,x)??11mm1m11??(h1???hmm)kf(x1,?,xm)??x?xk?1k!n1??(h11???hmm)n?1f(x1??h1,?,xm??hm),0???1(n?1)!?x?x当n?1时

1m1mf(x0?h1,?,x0?hm)?f(x0,?,x0)?(h1

?m?1m???h)f(x,?,x00)?1m?x?x11??11(h1???hmm)2f(x0??h1,?,x0??hm),0???12!?x?x

又知点x0是函数f的稳定点,则gradf(x0)?0,即

h1?1mm?1mf(x,?,x)??=hf(x0,?,x0)=0 001m?x?x可得

1m1mf(x0?h1,?,x0?hm)?f(x0,?,x0)?11??1m(h1???hmm)2f(x0??h1,?,x10??h)2!?x?x1mmij?2111m=??hhf(x??h,?,x??h),0???100ij2!i?1j?1?x?x又知二阶偏导数在点x0连续,则

1mmij?22f(x?h,?,x?h)?f(x,?,x)=??hhf(x)?o(h)02!i?1j?1?xi?xj101m0m10m0??12?hh?h?f(x)?o(1),limo(1)?0???0ij??h?02!?i?1j?1hh?x?x?mmij2mm

可看出当h?0时,f(x0?h)?f(x0)符号完全由二次型??i?1j?1hihj?2f(x0)hh?xi?xj的符号决定,我们对它进行研究

mmhh1hmhihj?2f(x0),它是定义在单位球面 令函数g()?g(,?,)???ijhhhh?x?xi?1j?1hS(0;1)??x??m|x?1?上的连续有界函数,又因为球面S是?m中的有界闭集,

于是函数g(x)上可以取得最小值m和最大值M。

1)如果H为正定矩阵,那么有0?m?M,即g(x)恒为正,f(x0?h)?f(x0)?0恒成立,点x0是函数f的局部极小值点;

9

2)如果H为负定矩阵,那么有m?M?0,即g(x)恒为负,f(x0?h)?f(x0)?0恒成立,点x0是函数f的局部极大值点; 3)如果H为不定矩阵,不妨设H?0

I)当有m?0?M时,设em,eM是单位球面上的点,g(em)?m,g(eM)?M。令

h?t1em,其中t1?0充分小,使得x0?h?U(x0),从而

f(x0?h)?f(x0)?112t1em(g(em)?o(1))?t12(m?o(1)) 2!2其中,当t1?0时,h?0,则o(1)?0,于是f(x0?h)?f(x0)的符号与m的符号相同,为负;类似地,亦可令h?t2eM,其中t2?0充分小,使得x0?h?U(x0),从而f(x0?h)?f(x0)?1t2eM2!21(g(eM)?o(1))?t22(M?o(1))

2其中,当t2?0时,h?0,则o(1)?0,于是f(x0?h)?f(x0)的符号与M的符号相同,为正。即函数f在点x0的任意小邻域内既可以找到函数值大于f(x0)的点,又可以找到函数值小于f(x0)的点,故点x0不是函数f的局部极值点。 II)当有m?0=M,设e?是单位球面上的任意点,g(e?)???0。令h?te?,其中t?0充分小,使得x0?h?U(x0),从而

f(x0?h)?f(x0)?1te?2!2(g(e?)?o(1))?12t(??o(1)) 2其中,当t1?0时,h?0,则o(1)?0,于是f(x0?h)?f(x0)的符号与?的符号相同,为非正,即f(x0?h)?f(x0)?0恒成立,点x0是函数f的局部极大值点;

III)当有m?0?M,设e?是单位球面上的任意点,g(e?)???0。令h?te?,其中t?0充分小,使得x0?h?U(x0),从而

1f(x0?h)?f(x0)?te?2!21(g(e?)?o(1))?t2(??o(1))

210

其中,当t1?0时,h?0,则o(1)?0,于是f(x0?h)?f(x0)的符号与?的符号相同,为非负,即f(x0?h)?f(x0)?0恒成立,点x0是函数f的局部极小值点;

g(x)?0,IV)当有m?0?M时,即H=0。再次考虑多元函数的泰勒公式,当n?2时,有

?11?m?1m???h)f(x,?,x)?(h1?001m?x?x2!?x?1??1m11??hmm)2f(x0,?,x0)?(h11???hmm)3f(x0??h1,?,x0??hm),0???1?x3!?x?x1m1mf(x0?h1,?,x0?hm)?f(x0,?,x0)?(h1即为

?1mmij?2f(x?h)?f(x)??kf(x0)???hhf(x0)?ij2!i?1j?1?x?xk?1?xm???hihjhki?1j?1k?1mmm?f(x??h),0???1ijk?x?x?x3

又知gradf(x0)?0,及H=0得

?3f(x?h)?f(x)????hhhf(x??h),0???1 ijk?x?x?xi?1j?1k?1mmmijk可仿照n?1的证明方法开展下去,作进一步的讨论。 4. 多元函数极值的几何意义

首先说明一下曲面的第二基本形式,设曲面S:r?r(u,v),在点P(u,v)的切平面为Tp,单位法向量为

n。现在我们计算曲面上点P(u,v)附近一点

Q(u??u,v??v)到Tp的有向距离?

??????PQ?n?[r(u??u,v??v)?r(u,v)]?n

由向量函数的泰勒公式

1??1??(?u??v)kr(u.,v)?(?u??v)n?1?u?v(n?1)!?u?vk?1k!r(u???u,v???v),(0???1)r(u??u,v??v)?r(u,v)??当n?2时

n11

22??1?22?2?r(u??u,v??v)?r(u,v)?(?u??v)r(u,v)?(?u?2?u?v??v2)2?u?v2!?u?u?v?vr(u???u,v???v),(0???1)可知

22??????1?22?2???PQ?n?[(?u??v)r(u,v)?(?u?2?u?v??v)22?u?v2!?u?u?v?v

12r(u???u,v???v)]?n=(ruu?n?u2?2ruv?n?u?v?rvv?n?v2)?o(r),2令II=ruu?n?u2?2ruv?n?u?v?rvv?n?v2,则近似的可有2?=II,即给定点的曲面的第二基本形式近似地等于曲面上该点的邻域内的点到该点的切平面的有向距离的两倍。

为了探究函数z?z(x1,x2,?,xm)的极值问题,考虑?m?1中超曲面

r(x1,x2,?,xm)??x1,x2,?,xm,z(x1,x2,?,xm)?的第二基本形式 II?n?(?x1rx1??x2rx2????xmrxm)2

其中n?rx1?rx2???rxmrx1?rx2???rxm,rxi?0,0,?,1,?,0,zxi

??e1e2?emem?110?0rx1?rx2???rxm=01?0??zx1zx2?(?1)m?1{zx1,zx2,?,zxm,?1} ?00?1zxm其中e1,e2,?,em,em?1是?m?1中的一组标准正交基 则n?11??zxii?1m(?1)m?1zx1,zx2,?,zxm,?1,又知rxixj?0,0,?,0,zxixj

????则

II=n????xi?xjrxixj?i?1j?1mm11??zxii?1m(?1)m?1zx1,zx2,?,zxm,?1?????z?1?z??(?1)m??dxidxj?0,0,?,0,?dxidxj???m?x?x?x?xi?1j?1?i?1j?1ij?ij??1??zximm2mm2i?1

12

00,?,xm)是函数z(x1,x2,?,xm)的稳定点,即有 考虑点p0(x10,x2zx1?zx2???zxm?0,

,0,1)则n?(?1)m?1?0,0,?,0,?1?,与em?1?(0,0,?共线,即超曲面r(x1,x2,?,xm)过

00点P0?x10,x2,?,xm,z(p0)?的超切面平行于超曲面Ox1x2?xm。

可以令n?em?1,并规定em?1的方向为正方向,即超曲面r(x1,x2,?,xm)上点

0000P0?x10,x2,?,xm,z(p0)?附近点与过P0?x10,x2,?,xm,z(p0)?的超切面的有向距离

在超曲面r(x1,x2,?,xm)向em?1正侧弯曲时为正,反之为负。

00则在点P0?x10,x2,?,xm,z(p0)?处超曲面r(x1,x2,?,xm)的第二基本形式为

?2zIIP0?em?1????xi?xjrxirxj???dxidxj

?x?xi?1j?1i?1j?1ijmmmm00由曲面第二基本形式的几何意义可知,超曲面在点P0?x10,x2,?,xm,z(p0)?邻域内

1000的点到过P0?x1,x2,?,xm,z(p0)?的超切面的距离为??IIP,可对函数z在点

20?zx1x1,zx1x2,?,zx1xm????mm??zx2x1,zx2x2,?,zx2xm??p0的Hesse矩阵H????ijz(p0)???进行讨论 ??i?1j?1?x?x?????????zxmx1,zxmx2,?,zxmxm??p01)当H?0且为半正定时,IIP0?0,即存在点P0的某个邻域U(P0)使超曲面

r(x1,x2,?,xm)在过点P0的超切面的上方,即超曲面r(x1,x2,?,xm)在点P0取得极小值,点p0亦是函数z的极小值点;

2)当H?0且为半负定时,IIP0?0,即存在点P0的某个邻域U(P0)使超曲面

r(x1,x2,?,xm)在过点P0的超切面的下方,即超曲面r(x1,x2,?,xm)在点P0取得极大值,点p0亦是函数z的极大值点;

3)当H为不定时,IIP0的符号亦不定,即在点P0的任意小邻域U(P0)内,超曲面r(x1,x2,?,xm)有一部分点在过点P0的超切面的上方,有一部分点在过点P013

的超切面的下方,即超曲面r(x1,x2,?,xm)在点P0不取极值,则点p0亦不是函数z的极值点;

24)当H?0时,即超曲面r(x1,x2,?,xm)在点P0有n(?x1rx1??x2rx2????xmrxm)?0,

此时可取超曲面r(x1,x2,?,xm)的第二基本形式为

II?n(?x1rx1??x2rx2????xmrxm)?n????xi?xj?xkrxirxjrxk3i?1j?1k?1mmm?11??zxii?1m?3z(?1)???dxidxjdxk?x?x?xi?1j?1k?1ijkmmmm

而??12IIP0,可仿照II?n(?x1rx1??x2rx2????xmrxm)的方法作进一步的讨论。 3!三、有约束条件下的多元函数极值问题

1. 条件极值的定义

n设f:D??是定义在开集D??上且属于C(2)(D;?)类的函数,S是用变

?F1(x0)?0?i(2)量方程组?????表示的D中的约束条件,其中F?C(D;?)(i?1,?,m),

?Fm(x)?00?如果存在D上满足变量方程组S的约束条件下的内点x0的任意小邻域,即

US(x0)?S?U(x0)(其中U(x0)是x0在D??n中的任意小邻域),如果对于任意x?US(x0)时有f(x)?f(x0)(f(x)?f(x0)),则称函数f在D的内点x0有满足约束条件S的局部极大值(局部极小值);如果对于任意x?US(x0)\\x0有严格不等式f(x)?f(x0)(f(x)?f(x0)),则称函数f在点x0有满足约束条件S的严格局部极大值(严格局部极小值)。

从几何观点来看就是函数f在曲面S上的极值,更精确些说,就是函数f在曲面S的限制下的函数fS的极值。

2. 条件极值的必要条件

n(1)首先说明一个定理,设f:D??是定义在开集D??上且属于C(D;?)类

14

的函数,S是D中的光滑曲面且x0?S是f的非极值点,如果x0是函数fS的

局部极值点,则有TSx0?TNx0,其中TSx0是曲面S在x0的切空间,而TNx0是曲面

N??x?Df(x)?f(x0)?在x0的切空间。

证明:取任意向量??TSx0及曲面S上的一条光滑曲线x?x(t)且满足

x0?x(0)和dx(0)??。如果x0是函数fdtS的极值点,则光滑函数f(x(t))当t?0时

应当有极值,由极值必要条件知它在t?0时的导数为零,即满足条件f'(x0)???0,

?f?f?1n??(?,?,?),由于x0是函数f的非极值点,上其中f'(x0)??,,?,(x)0?0n??x???x式即为切空间TNx0的方程,可知??TNx0,得证TSx0?TNx0。

?F1(x0)?0?如果曲面S在点x0的邻域内用方程组S:?????来表示,那么空间TSx0

?Fm(x)?00???F1?F11n??x1(x0)?????xn(x0)??0??可以用线性方程组?????来表示,而空间TNx0可以用方

??Fmm?F1?1(x0)????n(x0)?n?0??x??x?fm?fm1n程1(x0)????n(x0)??0来表示,则与关系式TSx0?TNx0等价的解析写法?x?xi是:向量gradf(x0)是向量gradF(x0)(i?1,?,m)的线性组合,即

mgradf(x0)???igradFi(x0),该公式即为函数fi?1S在点x0取极值的必要条件。

1n拉格朗日在寻求条件极值时,引入了n?m个变量(x,?)?(x,?,x,?1,?,?m)i的辅助函数L(x,?)?f(x)???iF(x),把求函数fi?1mS极值的必要条件转化为了

对函数L(x,?)求极值的必要条件

15

m??L?f?Fi(x,?)?j(x)???i(x)?0(j?1,?,n)?j??xj?x?xi?1 ???L(x,?)?Fi(x)?0(i?1,?,m)????ii当向量组gradF(x),(i?1,?,m)在任意的点x?S上均线性无关且函数fS的极值

1n点为x0?(x0,?,x0)时,由上述方程可知变量?=(?1,?,?m)的值唯一确定,即得

求条件极值的拉格朗日乘数法。 3.条件极值的充分条件

S是用方程组设f:D??是定义在开集D??n上且属于C(2)(D;?)类的函数,

?F1(x0)?0?i(2)?????表示的D中的曲面,其中F?C(D;?)(i?1,?,m)且函数组?Fm(x)?00??F,?,F?在区域D中的任意一点的秩等于m。设拉格朗日函数

1mL(x)?L(x,?)?f(x,?,x)???iFi(x1,?,xm)

1ni?1m其中参数?1,?,?m已根据函数fnnS在点x0?S取极值的必要条件而选定。

?2Lij1n令H???ij??,其中??(?,?,?)?TSx0

i?1j?1?x?x1)如果H对任意向量??TSx0是半正定的,则点x0是函数f2)如果H对任意向量??TSx0是半负定的,则点x0是函数f3)如果H对任意向量??TSx0是不定的,则点x0不是函数f4)如果H?0,需作进一步讨论

S的局部极小值点; 的局部极大值点;

SS的局部极值点;

证明:首先注意到对于x?S,L(x)?f(x),因此要证明点x0?S是函数f值点,需证明点x0?S是函数LSS的极

的极值点。由于函数fS在点x0?S满足取极

1n值的必要条件,即有gradL(x0)?0,这意味着函数L(x)在点x0?(x0,?,x0)邻域内的泰勒公式为

1nn?2L22iL(x)?L(x0)???ij(x0)(xi?x0)(xj?x0j)?o(x?x0),(limo(x?x0)?0)

x?x02!i?1j?1?x?x16

又由空间?n中曲面理论知存在光滑映射

(t1,?,tk)?t?x?(x1,?,xn)其中(t1,?,tk)??k,(x1,?,xn)??n(k?n?m) 可以将该映射写为x?x(t),它把点0?(0,?,0)??k的邻域双方单值地映成点

1nx0?(x0,?,x0)?S??n的某个邻域且x0?x(0),则有关系式

x(t)?x(0)?x'(0)t?o(t),(limo(t)?0)

t?0k?xi?xi?xi??等价于x(t)?x(0)??(0)t?o(t)其中i?1,?,n,?(0)t??j(0)tj

?t?tj?1?tii则有

L(x(t))?L(x(0))?122?ijL(x(0))??xi(0)??xj(0)t?t??o(t),limo(t)?0

t?02!'而对于向量??TSx0,可设?=x(0)t,由此知向量?在点x0与S相切,记

1k?=(?1,?,?n),x(t)?(x1,?,xn)(t),t?(t,?,t)

jj?ii?则????x(0)t,????x(0)t

?2Lij可知二次型?ijL(x0)??x(0)??x(0)tt=??ij(x0)???H

i?1j?1?x?xij??nn1)如果H?0对任意向量??TSx0是半正定的,则L(x(t))?L(x(0))?0恒成立,点

t?0是函数L(x(t))的局部极小值点,由于映射t?x(t)把点t?(0,?,0)??k的某

nn个邻域变到曲面S上点x(0)?x0?(x10,?,x0)??的某个邻域,可知点x0是函数

LS的局部极小值点,进而是函数fS的局部极小值点;

2)如果H?0对任意向量??TSx0是半负定的,则L(x(t))?L(x(0))?0恒成立,点

t?0是函数L(x(t))的局部极大值点,同理可知点x0是函数LS的局部极大值点,

进而是函数fS的局部极大值点;

的符号无法确定,点t?0不是函数L(x(t))S(())Lx?((0)3)如果H为不定的,则Lxt的局部极值点,同理可知点x0亦不是函数L的局部极值点,进而也不是函数

17

fS的局部极值点;

nn?2L1n4)如果H?0,即??ij(x0)?i?j?0,此时函数L(x)在点x0?(x0,?,x0)邻域

i?1j?1?x?x内的泰勒公式为

1n?3L33iL(x)?L(x0)??ijk(x0)(xi?x0)(xj?x0j)(xk?x0k)?o(x?x0),(limo(x?x0)?0)x?x03!i,j,k?1?x?x?x

?3L可考虑???ijk(x0)?i?j?k的符号,仿照以上证明方法作进一步的讨论。

i?1j?1k?1?x?x?xnnn四、函数极值问题的应用

1. 最小二乘法

二元函数极值理论最经典的应用当属于最小二乘法,我们对最小二乘法予以说明。经过实测得到n个数对(xi,yi),i?1,2,?,n,其中yi是在xi测得的值。在坐标平面上这n个数对对应n个点,设它们大体分布在一条直线附近。求一条直线

y?ax?b,使其在总体上与这n个点的接近程度最好。

将点(xi,yi)的坐标代入直线方程y?ax?b中,设?i?axi?b?yi,称?i是点

(xi,yi)到直线y?ax?b的偏差。易知若点(xi,yi)在直线y?ax?b上,则偏差

??0;若点(xi,yi)不在直线y?ax?b上,则偏差??0。此时?i可能是正数也可能是负数。为了消除符号影响,考虑?i2。于是偏差平方和的大小,即

??i?1n2i??(axi?b?yi)2

i?1n的大小在总体上刻画了这n个点与直线y?ax?b的接近程度。为了使其接近程度最好,也就是求以a与b为自变量的函数

f(a,b)??(axi?b?yi)2

i?1n的最小值。求函数f(a,b)最小值确定a与b(从而确定直线方程y?ax?b)的方法叫做最小二乘法。

解:函数f(a,b)的定义域是?2,解方程组

18

nnn?'?n22?fa(a,b)?2?(axi?bxi?yixi)?0?a?xi?b?xi??xiyi??i?1i?1i?1i?1即 ??nnn?f'(a,b)?2(ax?b?y)?0?ax?bn?yi???biii??i?1i?1??i?1得唯一稳定点(a0,b0):

nnn?n?xiyi?(?xi)(?yi)?i?1i?1?a0?i?1nn?n?xi2?(?xi)2??i?1i?1 ?nnnn?(?xi2)(?yi)?(?xiyi)(?xi)?i?1i?1i?1i?1?b0?nn?n?xi2?(?xi)2?i?1i?1?根据问题的实际意义,二元函数f(a,b)在?2内必存在最小值,又知其只有一个稳定点。因此二元函数f(a,b)必在该稳定点(a0,b0)取得最小值,得欲求直线方程y?a0x?b0。

亦可采用本文已经说明的二元函数极值存在的充分条件理论予以验证:

''(a0,b0)?2n f(a0,b0)?2?x,f(a0,b0)?2?xi,fbb''aan2i''abni?1i?1n?n22??f(a,b)?f(a,b)?f(a,b)?4(x)?nx则?=??00?0000i??0 ??i?i?1?i?1?''ab2''aa''bb''即??0,faa从而,唯一的稳定点(a0,b0)是函数f(a,b)的极小值点。(a0,b0)?0,

于是函数f(a,b)在稳定点(a0,b0)取最小值,即欲求直线方程是y?a0x?b0。 2. 二元函数极值的几何探讨

应用二元函数极值理论求极值的关键是求得这个二元函数的极值点,而针对一些不存在极值点的二元函数,该理论就束手无策了,此时我们可以考虑用本文已经讨论过的求二元函数极值的几何方法,笔者举了一个简单的例子以说明该方法是行之有效的,希望读者可以在具体的求解过程中将此方法应用并推广。

例如求二元函数z?(x?1)2?(y?1)2在?2中的极值 解:解方程组

19

x?1?'z??x22(x?1)?(y?1)? ?y?1?z'?22?y(x?1)?(y?1)?得出偏导不存在的点(1,1),作坐标变换

?x?X?1??y?Y?1则原函数变为Z?X2?Y2,原函数f(x,y,z)?0中的点(1,1,0)变为新?z?Z?函数F(X,Y,Z)?0中的点(0,0,0) 设方程Y?kX(k为任意常数)表示过得

z轴的平面,代入方程Z?X2?Y2中

Z?X2?k2X2?1?k2X 当X?0时,

dZdZ?0;当X?0时,?0 dXdX由一元函数极值判定定理知点X?0是函数Z?1?k2X的局部极小值点,且极小值为0,即函数Z?X2?Y2在点(0,0)取得极小值0,故函数

z?(x?1)2?(y?1)2在点(1,1)取得极小值0。

函数极值的几何意义有很多应用,笔者举一例以说明用它可以求得空间中点到直

线的距离公式。

求三维欧式空间?3的一点(a,b,c)到平面Ax?By?Cz?D?0的距离.

解:设平面上任意一点(x,y,z).此题就是求函数r=(x?a)2?(y?b)2?(z?c)2在约束条件Ax?By?Cz?D?0下的最小值。

由于r和r2的极值点相同,可以讨论函数r2=(x?a)2?(y?b)2?(z?c)2的极值点,根据拉格朗日乘数法,作辅助函数

L?(x?a)2?(y?b)2?(z?c)2??(Ax?By?Cz?D)

20

??L??x???L???y???L??z???L????1?2(x?a)??A?0,即x?a??A21?2(y?b)??B?0,即y=b??B2 1?2(z?c)??C?0,即z=c??C2?Ax?By?Cz?D?0解得?=2(Aa?Bb?Cc?D) 222A?B?C于是(x,y,z)只有唯一一组解(x0,y0,z0),其中

A(Aa?Bb?Cc?D)?x?a??0A2?B2?C2?B(Aa?Bb?Cc?D)?y?b? ?0222A?B?C?C(Aa?Bb?Cc?D)?z?c??0A2?B2?C2?显然这个问题存在最小值。因此函数r2在点(x0,y0,z0)必取最小值,将此点的坐标带入r2中,得最小值

r2最小(Aa?Bb?Cc?D)2 ?222A?B?C于是点(a,b,c)到平面Ax?By?Cz?D?0的距离是

r最小?Aa?Bb?Cc?DA?B?C222

3. 多元函数极值问题的实际求解

我们首先来看函数f(x,y,z)?x2?y2?z2在由关系式

x2y2z2F(x,y,z)?2?2?2?1?0,(0?a?b?c)定义在椭球面S上的极值。

abc解:写出拉格朗日函数

x2y2z2L(x,y,z,?)?(x?y?z)??(2?2?2?1),根据极值必要条件求出方程

abc22221

dL?0,亦即

?L?L?L?L????0的解 ?x?y?z??(x,y,z,?)?(?a,0,0,a2),(0,?b,0,b2),(0,0,?c,c2) 二次型

122???122232dL??(1?2)????(1?2)????(1?2)??? 2abc对于每个稳定点在相应的切平面上分别有

a222a232b212b232c212c222(1?2)(?)?(1?2)(?),(1?2)(?)?(1?2)(?),(1?2)(?)?(1?2)(?)

bcacab因为(0?a?b?c),根据给出条件极值存在性和不存在性的充分条件定理可知,在点(?a,0,0)和(0,0,?c)分别有minf函数fSS?a2和maxfS?c2,而在点(0,?b,0)?S,

没有极值。

由此题我们可以知道在应用多元函数条件极值存在的充分条件时,应当充分利用条件??TSx,写出带有?的TSx解析式,并把向量??(?1,?2,?,?n)的m个坐标

00?2L用其余的k个独立坐标线性表示出来,最后带入二次型ij(x0)?i?j,利用西尔

?x?x维斯特准则得到它的正定性,进而可以判定函数在该点是极大值点,极小值点,抑或无极值点。

再来看惠更斯问题,即在a和b两正数间插入n个数x1,x2,?,xn,使得分数

u?x1x2?xn的值是最大。

(a?x1)(x1?x2)?(xn?b)解:记??xxxx1bb设y1?2,y2?3,?,yn?,?(a?x1)(1?2)(1?3)?(1?),

ux1x2xnx1x2xn并记A?y1y2?yn,则有x1?bbb?,??(a?)(1?y1)(1?y2)?(1?yn).

Ay1y2?ynAnnby??bndykbdyk又记m?a?,则有d???, dyk????(k?)?mAk?1ykmAykAk?11?ykk?11?yk令

y??b(k?1,2,?,n),解之得稳定点P0(y1,y2,?,yn),其?0得方程组k?1?ykmA?yk22

bn1中y1?y2???yn?()?1?y0.

a在点P0,有

ybdyk???d(k?)1?ymAykk?1knd2?P?P0P?P0ydy???d(k)(k)1?yky0k?1nP?P0??dyk?1????d??ayk?10?1?A??b?nP?P0nn???(P0)n2?(P0)aA?dy??dy(dy)?k??kk?a2?y0(1?y0)2k?1k?1?k?1byk?P?P0y0(1?A)P?P0bnn?(P0)?n22?2?dy?(dy)?0,(当dy?0时)???kkk?2?y0(1?y0)?k?1k?1k?1?

故函数?在点P0取得极小值,从而函数u在

bbb??nn?1?nx????ay?ay?y?ay01000n?Ay0a?2?x2?x1y1?ay0??3 ?x3?x2y2?ay0?????bb?1?n?1?1nx??ny?aay0?ay0y0?ay0n???b?即数a,x1,x2,?,xn,b构成有公比y0????a?1n?1的几何级数时,其值最大,并且u的

111n?1n?1?(n?1)?(a?b)最大值为u?.

a(1?y0)n?1本题中为了进一步确定点P0是否函数?的极值点,利用了d2?P?P0的解析式,并

判定了它的符号为正,进而得出点P0是函数?的极小值点,由多元函数微分形式的不变性可知,这种方法与本文已经讨论的多元函数条件极值的充分条件的判定方法实质上是等价的。 4. 一些著名不等式的证明

考虑证明赫尔德不等式和哈达玛不等式。

i?1,2,?n,,证明赫尔德不等式?aibi?(?a)(?bi),其中ai?0,bi?0,i?1i?1i?1nn1qqin1pp23

q?1,而

11??1. pqn证明:可以考虑函数f(x1,?,xn)??aixi在约束条件x1p?x2p???xnp?1下的

i?1最大值,用拉格朗日乘数法

L(x1,?,xn,?)??aixi??(?xip?1)

i?1i?1nn??L??x?i???L????1?1nqq??=(?ai)p?1pi?1?ai??pxi?0?1?解得 ?p?1nai?xi???xip?1?01n?qpi?1(?ai)?i?1?nnn而dL???p(p?1)?x2i?1p?2idx?0,(当?dx?0时),从而知f(x1,?,xn)??aixi2i2ii?1i?1在点(ani?11p?111qpi,?,ani?11p?1n1qpi)取得极大值,极大值为

(?a)(?a)f(x1,x2,?,xn)max?(?aixi)max??aii?1i?1nnaini?11p?11p??ai?1ni?1nnqi1p(?aiq)(?aiq)?(?a)

i?1n1qqi亦即?aixi?(?a),可令xi?i?1i?1nn1qqibi(?bip)i?1n1p,代入得?aii?1bi(?bip)i?1n1p?(?a),

i?1n1qqi亦即?aibi?(?a)(?bi),则赫尔德不等式得证。

i?1i?1i?12证明哈达玛不等式,对于n阶行列式A?aij有A??(?aij).

2i?1j?1nnnn1qqin1pp2证明:令?aij=Si?0,i?1,2,?,n,考虑行列式A?aij,i,j?1,2,?,n在约束

j?1n24

2条件?aij=Si下的极值,由拉格朗日乘数法

j?1n2L(aij,?i)?A???i(?a?Si)??aijAij???i(?aij?Si)

2iji?1j?1j?1i?1j?1nnnnn??L??x?ij???L????iAij?a??ij2?i??Aij?2?iaij?01?n?2?2? 解得?n??Aij?2?1??aij?Si?0?i??j?1??j?12?Si????????nn1?则当m?n时,有?amjanj??amj2?n2?nj?1j?1Anj?aj?1nmjAnj?0,即矩阵(aij)的任意两

S10?0行正交,则有(aij)(aij)='0S2?0???000Sn??Si

i?1n?2?A??ij?nnj?122'2??0,因而Amax??Si,带此时有A?(aij)(aij)??Si,而dL??2?i????Si?i?1i?1????2入得证哈达玛不等式A??(?aij)。

2i?1j?1nnn12由以上两个著名不等式的证明过程我们可以发现,用多元函数的条件极值问题求解方法有时可以另辟蹊径,化繁为简,创造性地完成证明过程。

总结

多元函数极值问题在现实的社会科学、工程技术和工农业生产中涉及最优化问题时也有很广泛的应用,例如在一定的消费水平下,消费者如何在不同的商品之间选择使自己得到的效用最大;在给定的各种原材料价格给定的情况下,施工队如何合理运用各种原材料修建一条公路而使造价最少,在一定的人力物力条件下,生厂商如何安排几种商品的生产才能使利润达到最大化等等,所有这些问题其实质就是多个变量在一定约束条件下实现目标最优化的运筹问题,其实质就是多元函数极值问题。

多元函数极值问题是多元函数微分学的重要组成部分,对于它的探究可以在多元函数微分学这个高等数学分支上进行有益的理论尝试和创新,本文从二元函数的极值理论入手,结合高等代数,微分几何的相关内容探究了多元函数极值及

25

多元函数条件极值理论,并针对临界条件下的情况给予了进一步讨论的方法,遗憾的是,限于篇幅和笔者水平,本文并未进行下一步的实质性讨论,但笔者坚信随着多元函数极值问题被越来越多的人关注和研究,它的理论必将更加完善,在实际中的应用也必将更加广泛。

参考文献

[1]刘玉莲,傅沛仁,林玎,苑德馨,刘宁编. 数学分析讲义(第五版). 下册[M]. 北京:高等教育出版社,2008.5:199-203,239-247.

[2]柴文祥,邵小兵,薛军风. 二元函数极值判别的一点注记[J].牡丹江师范学院学报(自然科学版). 2011(4):3-4.

[3]康铁仁,石业娇. 二元函数z?f(x,y)极值求解的探索[J]. 数学学习与研究(大连海洋大学职业技术学院). 2012(19):78.

[4]苏步青,华宣积等.实用微分几何引论[M].北京:科学出版社,2010.8:77-78 [5]宋鸿藻,陈欣高,冯秀峰,贾兴琴. 微分几何及其应用[M]. 开封:河南大学出版社,1993.8:101-102

[6]阿吉木·优勒达希. 利用曲面基本形式Ⅱ对多元函数极值问题的讨论[J]. 喀什师范学院学报. 2006.5(3/27):23-26

[7]黄玉民,李成章编. 数学分析(下册)(第二版) [M].北京:科学出版社,2007.1:475-491

[8]B.A.卓里奇著. 蒋铎等译. 数学分析(第一卷)(第四版)[M]. 北京:高等教育出版社,2006.6:409-413,467-474

[9]费定晖,周学圣编演;郭大钧,邵品琮主审. 吉米多维奇数学分析习题集题解[M]. 济南:山东科学技术出版,2004.1:402-404,431-434.

[10]沈燮昌,邵品琮.数学分析纵横谈[M].北京:北京大学出版社,1991.5:130-140. [11]阿波斯托尔(Apostol, T.M.)著. 邢富冲,邢辰,李松洁,贾婉丽译. 数学分析(原书第二版) [M].北京:机械工业出版社,2006.3:307-314.

26

本文来源:https://www.bwwdw.com/article/8qa3.html

Top