数据的n次拟合多项式

更新时间:2024-06-15 05:17:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数据的n次拟合多项式

第一章 绪论

1.1课题国内外研究动态,课题研究背景及意义 1.2国内外的研究现状 1.3发展趋势

第二章 数据拟合的基本理论

2.1 最小二乘曲线拟合 2.2 线性拟合函数 2.3 二次拟合函数 2.4多项式拟合函数 2.5 小结

第三章 数据拟合的应用实例

3.1 数据拟合在物理实验中的应用 3.2 数据拟合在经济监控中的应用 3.3 模型评价

参考文献

附录

第一章 绪论

1.1 课题国内外研究动态,课题研究背景及意义

数学分有很多学科,而它主要的学科大致产生于商业计算的需要、了解数字间的关系、测量土地及预测天文事件。而在科技飞速发展的今天数学也早已成为众多研究的基础学科。尤其是在这个信息量巨大的时代,实际问题中得到的离散数据的处理也成为数学研究和应用领域中的重要的课题。

在解决实际工程问题和科学实验的过程中,经常需要通过研究某些变量之间的函数关系,帮我们去认识事物内在的规律和本质属性,这些变量间的未知的关系一般隐含在从观测、试验而得到的一组离散的数据之中。所以,是否能够根据一组试验观测数据来找到变量之间的相对准确的函数关系成为了解决工程实际问题的关键。

在实际问题中,通过观测数据能否正确揭示某些变量之间的关系,进而正确认识事物的内在规律与本质属性,往往取决于两方面因素。其一是观测数据的准确性或准确程度,这是因为在获取观测数据的过程中一般存在随机测量误差,导致所讨论的变量成为随机变量。其二是对观测数据处理方法的选择,即到底是采用插值方法还是用拟合方法[1-3],插值方法之中、拟合方法之中又选用哪一种插值或拟合技巧来处理观测数据。插值问题忽略了观测误差的影响,而拟合问题则考虑了观测误差的影响。但由于观测数据客观上总是存在观测误差,而拟合函数大多数情况下是通过经验公式获得的,因此要正确揭示事物的内在规律,往往需要对大量的观测数据进行分析,尤为重要的是进行统计分析。统计分析的方法有许多,如方差分析、回归分析等。数据拟合虽然较有效地克服了随机观测误差的影响,但从数理统计的角度看,根据一个样本计算出来的拟合函数(系数),只是拟合问题的一个点估计,还不能完全说明其整体性质。因此,还应该对拟合函数作区间估计或假设检验,如果置信区间太大或包含零点,则由计算得到的拟合函数系数的估计值就毫无意义。

所以,据科学和工程问题可以通过比如采样、实验等方法而得到若干的离散的数据,根据这些离散的数据,我们往往希望能得到一个连续函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。也就是说,如果数据不能满足某一个特定的函数的时候,而要求我们所要求的逼近函数“最优的” 靠近那些数据点,按照误差最小的原则为最优标准来构造出函数。我们称这个函数为拟合函数。

现在,对数据点进行函数拟合以获得信息模型是许多工程应用领域的一个核

心问题。而为了适应这个多元化的世界中,为了能够满足各种各样的应用领域的要求,针对他们而对各种拟合方法的改进和研究也从未停止过。

1.1.1 国内外的研究现状

在通过对国内外有关的学术刊物(如《计算机科学》、《宇航学报》、《中原工学院学报》等)、国际国内有关学术会议和网站的论文进行分析。数据拟合的研究和应用主要是面对各种工程问题,有着系统的研究和很大的发展。通过研究发展使得数据拟合有着一定的理论研究基础。尤其是关于数据拟合基本的方法最小二乘法[4-9]的研究有着各种研究成果。

但是,由于现实问题的复杂性,数据拟合还拥有很好的研究空间,还有很多能够优化和创新的问题需要去研究和探索。各种算法的改进和应用以及如何得到合适的模型一直是一个比较热门的研究领域。

例如,国内外文献里提出了很多基于形状的描述方法,比如傅氏描述子法、多边形法、累积角法等, 其中以二次曲线和超二次曲线来拟合物体的边界形状并进行物体的描述已获得广泛应用。现在,我们应用高次隐式多项式曲线来作为物体的几何模型受到广泛的重视。应用高次隐式多项式曲线和曲面[10-15]为各个领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势,在数据点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有着精确的表达能力,隐式多项式曲线的参数完全取决于它的次数和系数,解析式明确,操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。

所以说,在现在这个各个工程领域飞速发展的今天,数据拟合在实际应用与研究中仍然有着不小的发展空间

1.2 发展趋势

应用高次隐式多项式曲线和曲面为各个领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势,在数据点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有着精确的表达能力,隐式多项式曲线的参数完全取决于它的次数和系数,解析式明确,操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。

隐式多项式曲线的信息建模近年有了很大的发展。对隐式多项式曲线进行分析看出,MinMax算法十分精确地拟合了数据点的形状,并且非常的稳定,只需要对3L集合的权值参数调整问题做进一步的研究,MinMax等隐式多项式曲线的拟合算法抛弃了需要迭代的优化算法,只需要求解一个线性方程组就能够确定

隐式多项式曲线方程的系数,可以说已经趋于成熟。我们可以预见,把这种建模思想应用到各种数据点集合之中必将带来很大的发展空间。

随着计算机的广泛应用,利用计算机相关软件解数据拟合问题也已经成为了不可缺少的步骤。

第二章 数据拟合的基本理论

科学和工程问题可以通过比如采样、实验等方法而得到若干的离散的数据,根据这些离散的数据,我们往往希望能得到一个连续函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。也就是说,如果数据不能满足某一个特定的函数的时候,而要求我们所要求的逼近函数最优的靠近那些数据点,按照误差最小的原则为最优的标准来构造出函数。

在科学计算中经常要建立实验数据的数学模型。给定函数的实验数据,需要用比较简单和合适的函数来逼近(或拟合)实验数据。这种逼近的特点是:

(1) 是需要适度的精度的; (2) 实验数据有一些小的误差;

(3) 对于一些问题,可能有一些特殊的信息能够用来选择实验数据的数学模型。

逼近离散数据的基本方法就是曲线拟合,常采用最小二乘拟合。

曲线拟合问题的数学描述是,已知一组(二维)数据(xi,yi),i = 1,2,…,n(即平面上的n个点(xi,yi),i = 1,2,…,n),xi互不相同,寻找一个函数(曲线)y = f(x),使得f(x)在某种准则下与所有的数据点最接近,即曲线拟合得最好。

2.1 最小二乘法的基本原理

从整体上考虑近似函数p(x)同所给数据点(xi,yi)(i=0,1,?,m)误差

ri?p(xi)?yiri?p(xi)?yi(i=0,1,?,m)的大小,常用的方法有以下三种:一是误差(i=0,1,?,m)绝对值的最大值0?i?mTmaxri,即误差 向量

mr?(r0,r1,?rm)的∞—范数;二是误差绝对值的和i?0m?ri,即误差向量r的1—

范数;三是误差平方和i?0?r2i的算术平方根,即误差向量r的2—范数;前两种

方法简单、自然,但不便于微分运算 ,后一种方法相当于考虑 2—范数的平方,

m因此在曲线拟合中常采用误差平方和i?0体大小。

?r2i来 度量误差ri(i=0,1,?,m)的整

数据拟合的具体作法是:对给定数据 (xi,yi) (i=0,1,?,m),在取定的函数类?中,求p(x)??,使误差ri?p(xi)?yi(i=0,1,?,m)的平方和最小,即

m i?0?r2i??p(x i?0mi)?yi??min2

从几何意义上讲,就是寻求与给定点(xi,yi)(i=0,1,?,m)的距离平方和为最小的曲线y?p(x)(图6-1)。函数p(x)称为拟合函数或最小二乘解,求拟合函数p(x)的方法称为曲线拟合的最小二乘法。 在曲线拟合中,函数类?可有不同的选取方法.

6—1

2.2线性拟合函数原理

给定一组数据,做拟合直线,均方误差为

(6.2)

是二元函数,的极小值要满足

整理得到拟合曲线满足的方程:

(6.3)

称式(6.3)为拟合曲线的法方程。用消元法或克莱姆法则解出方程:

a=

=

2.3 二次拟合函数

给定数据序列,用二次多项式函数拟合这组数据。

设,作出拟合函数与数据序列的均方误差:

(6.4)

由多元函数的极值原理,的极小值满足

整理得二次多项式函数拟合的法方程:

(6.5)

解此方程得到在均方误差最小意义下的拟合函数的法方程,法方程的系数矩阵是对称的。当拟保多项式阶

。方程组(6.5)称为多项式拟合

时,法方程的系数矩阵是病

态的,在计算中要用双精度或一些特殊算法以保护解的准确性。

2.4 多次拟合函数

假设给定数据点(xi,yi)(i=0,1,?,m),?为所有次数不超过n(n?m)的多项式构

n成的函数类,现求一

I?pn(x)??ak?0kx??k,使得

m2??pi?0mn(xi)?yi?2?n?k????akxi?yi??mini?0?k?0? (1)

当拟合函数为多项式时,称为多项式拟合,满足式(1)的pn(x)称为最小二乘拟合多项式。特别地,当n=1时,称为线性拟合或直线拟合。 显然

mnkI??(?ai?0k?0xi?yi)k2

为a0,a1,?an的多元函数,因此上述问题即为求I?I(a0,a1,?an)的极值 问题。由多元函数求极值的必要条件,得

?I?ajmnkj?2?(?akxi?yi)xi?0,i?0k?0j?0,1,?,n (2)

nmj?kimk?0?(?xi?0)ak??xi?0jiyi,j?0,1,?,n (3)

(3)是关于a0,a1,?an的线性方程组,用矩阵表示为

??m?1?m?xi??i?0???mn?xi???i?0m?xi?0mi???xi?02i?m?xi?0n?1i???m?y?x??i??ai?0??i?00???m??mn?1???xi??a1????xiyi??i?0i?0???????????a?m?mn2n??n???xiyi??xi????i?0?i?0?nim (4)

式(3)或式(4)称为正规方程组或法方程组。

可以证明,方程组(4)的系数矩阵是一个对称正定矩阵,故存在唯一解。从式(4)中解出ak(k=0,1,?,n),从而可得多项式

npn(x)??ak?0kxk (5)

可以证明,式(5)中的pn(x)满足式(1),即pn(x)为所求的拟合多项式。我

们把i?0??pn(xi)?myi?2称为最小二乘拟合多项式pn(x)的平方误差,记作

r22???pi?0mn(xi)?yi?2

由式(2)可得

r22mnmkki??i?0y?2i?a(?xk?0i?0yi) (6)

多项式拟合的一般方法可归纳为以下几步:

(1) 由已知数据画出函数粗略的图形——散点图,确定拟合多项式的次数n;

mmji(2) 列表计算 i?0?x(j?0,1,?,2n)和i?0?xjiyi(j?0,1,?,2n);

(3) 写出正规方程组,求出 a0,a1,?an;

n(4) 写出拟合多项式

pn(x)??ak?0kxk。

2.5 本章小结

本章阐述了数据拟合的基本理论及其方法。用最小二乘法论理引出了线性以及二次曲线拟合的方法,并推广至多元拟合。分别详细介绍了各种方法的理论及其公式。并分别对曲线拟合以及多元拟合的求解的基本步骤做出了归纳。通过本章可以掌握数据拟合的基本方法以及理论基础。

第三章 MATLAB解应用问题实例

3.1 数据拟合在物理实验中的应用

现在有一为了测量线性电阻元件伏安特性的物理实验。实验数据见表3-1。

表3-1 测量线性电阻元件伏安特性的实验数据

i 1 2 3 4 5 Ii Ui/V i 6 7 8 9 10 Ii/A Ui/V 0 0.009 0.020 0.030 0.039 0 1 2 3 4 0.049 O.061 0.073 0.082 0.092 5 6 7 8 9 由于试验的目的是研究关于线性电阻的伏安特性,所以设拟合多项式为

U/V?a0?a1I/A (3-1)

将数据表代入数据拟合的基本公式里,得此实验的正则方程组

?10a0?0.455a1?45 0.455a0?0.0295a1=2.9010

它的解为a0= 0.1062 ,a1= 96.5662 因此这一组数据的最小二乘法拟合为

U/V=0.1062+96.5662I/A

n=1时,其各拟合图像为:

利用最最小二乘法来分析物理实验里所测得的实验数据,我们可以根据测得的数据拟合出近似函数,并得到比较精确的解。总之,在实际的实验中,我们应当采用尽可能多的方法去分析数据,使得实验更有意义。

3.2 数据拟合在经济监测中的应用

根据1995年到2003年中国GDP增长率变化情况,建立回归方程,具体数据如下:

表3.3.1 1995年到2003年中国GDP增长率变化

年份 1 2 3 4 5 6 7 8 9 GDP 10.5 9.6 8.8 7.8 7.1 8 7.3 8 9.1

数据来源:中国商业部GDP报表(GDP为百分比)

为了研究的方便,年份从1995年到2003年分别用1到9这9个数字代替.由表3.1可以看出GDP的增长率先减后增,如果采用线性回归,由于拟合误差太大,严重影响了预测的效果.观察其变化规律采用抛物线回归的方法是比较合适的,令拟合多项式为

n E(x)??ak?0k x (3.1)

k我们采用的是抛物线的形式,故n=2,即

(3.2) e(x)?a0?a1x?a2x

根据“最小二乘法原理”对于n对数据(xi,yi)i?1,2,?,n;(其中N=9)应使[3]

N2F??[yi?1i2?F(xi)]=最小值

当n=2时,则(3.2)中的系数满足方程组:

?2?a0?a1x??a2x?y???2?3?? (3.3) ax?ax?ax?(xy)??012?2?3?4?2?a0x?a1x?a2x?(xy)??式子中的a0,a1,a2是未知数,系数xk??1NN?i?1kxi,常数项

(xy)??k1NN?xi?1kiyi.?k=0,1,2,3,4?

按照上面的过程,对表中的数据进行拟合,我们首先对方程组的系数和常数项作如下的处理:为了让数据精确表达我们想要的结果,对不能除尽的系数,小数点后保留6位;对常数项则保留小数点后4位.这样得到的增广矩阵如下:

?9 45 285 76.2000???45 285 2025 367.8000 (3.4) ????285 2025 15333 2.3252e+003??

经过计算,最后得到的回归方程如下:

y?12.197-1.6547x?0.1435x2 (3.5)

当n=2时,拟合图像为:

表3.3.2 数据拟合下的误差表

年份 实际值 拟合值 误差 1 10.5 10.6858 0.1858 2 9.6 9.462 -0.1384

3 8.8 8.5244 -0.2756 4 7.8 7.874 0.0742 5 7.1 7.511 0.411 6 8 7.435 -0.5652 7 7.3 7.6456 0.3456 8 8 8.1434 0.1434 9 9.1 8.9282 -0.1718

初步计算其中的最大误差为-0.57, 误差范围相对较小,拟合曲线与元数据基本重合,因此该拟合曲线可以较为准确的预测GDP的发展趋势。 3.3 模型评价

该方法具有如下优点:

(1)计算结果惟一,计算量小,便于在PLC、单片机等硬件设备上实现; (2)可精确、方便地实现多年份的GDP增长变化进行实时监测;

(3)当所需要的检测数据改变时,只需调整对应多项式的系数,不必改动其它程序设定,能真正的做到拟合用途多元化;

(4)保留了原有数据的发展趋势,又增加了数据的拟合发展趋势,让经济学家能够更直观的发现经济中的发展态势,对国家的经济政策作出调整提供了有力的依据。

参考文献

1 李庆扬. 数值分析. 武汉:华中科技大学出版社,2006,64~69 2 程毛林. 数据拟合函数的最小二乘积分法. 大学数学,2006,22(1):70~74 3 张韵华,奚梅成,陈效群 数值计算方法与算法(第二版) 科学出版社

2006,70~80

4 曾长雄. 离散数据的最小二乘曲线拟合及应用分析. 岳阳职业技术学院

报,2010,25(3):96~99

5 周宏,谷浩. 数据拟合回归方法的探讨. 财经问题研究,2003,第9期(总第238

期):85~87

6 单长吉,杨训钢,吴德兰,李林,任德华. 数据拟合的最小二乘法在物理实

验中的应用. 昭通师范高等专科学校学报,2008,30(5):8~9,36 7 周宏,谷浩.数据拟合回归方法的探讨[J].东北财经大学学报,2003,9(9):1 8 程正兴.数据拟合[M].西安:西安交通大学出版社.1986.

9 赵林明,习华勇.数据拟合方法程序设计及其应用[M].石家庄:河北科学技术出版社.2000.

附录

源程序:

clc clear all

load X2.txt %实验数据 load Y2.txt %实验数据 X2 Y2

n=input('请输入拟合多项式次数n=') a=zeros(n+1,n+1); m=length(X2); for i=1:n+1 for j=1:n+1 for k=1:m

a(i,j)=a(i,j)+X2(k)^(i+j-2); end end end a

b=zeros(n+1,1) for i=1:n+1 for k=1:m

b(i,1)=b(i,1)+X2(k)^(i-1)*Y2(k); end end

p2=polyfit(X2,Y2,n); p2

p3=polyfit(X2,Y2,n+1); p3

y2=polyval(p2,X2); y3=polyval(p3,X2); subplot(2,2,1) plot(X2,Y2) legend('原始数据') subplot(2,2,2) plot(X2,y2) legend('n次拟合') subplot(2,2,3) plot(X2,y3) legend('n+1次拟合') hold on

本文来源:https://www.bwwdw.com/article/xec3.html

Top