概率论与数理统计课程设计

更新时间:2023-05-22 05:09:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

用matlab儿童的体重与体积的回归分析

课程设计(论文)

题目 概率论数理统计课程设计

儿童的体重与体积的回归分析

学院 专业 班级 学生姓名 指导教师

理学院 xxxxxx xxxxxx xxxxxx xxxxxx

2010年7月3日

用matlab儿童的体重与体积的回归分析

课程设计(论文)任务书

用matlab儿童的体重与体积的回归分析

数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位。对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。但实际问题中常常碰到非正态总体,而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究的问题。本文利用概率论与数理统计基本原理对小样本常用分布参数置信区间和假设检验问题 ,进行了深入研究,提出了小样本常用分布参数的置信区间与假设检验的解决方法。

本文利用小样本情形的统计量法解决离散型的0-1分布、二项分布以及连续型的指数分布参数的置信区间与假设检验,对于泊松分布的参数的置信区间与假设检验则采用数学方法进行分析。对于均匀分布,利用两个参数的最大似然估计求出联合概率密度进行求解。

关键词:统计量法;置信区间;假设检验;线性关系;回归分析

用matlab儿童的体重与体积的回归分析

1 设计目的…………………………………………………………………………1 2 回归分析原理与回归系数的置信区间…………………………………………2 3 设计方法…………………………………………………………………………5

3.1输入数据,观察X与Y的线性关系……………………………………...5 3.2作回归分析与检验…………………………………………………………6 3.3残差分析……………………………………………………………………8 3.4点预测与作图………………………………………………………………9 3.5 用Excel实现……………………………………………………………...10 4 设计总结………………………………………………………………………...14 5 设计心得………………………………………………………………………...14 致谢………………………………………………………………………………….15 参考文献…………………………………………………………………………….16

用matlab儿童的体重与体积的回归分析

儿童的体重与体积的回归分析

1.设计目的

了解一元回归方程,回归系数的检验方法及应用一元回归方程进行预测的方法;学会应用MATLAB软件进行一元回归实验的分析方法。 2.设计原理

在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线型),而是非线性的(即曲线型)。设其中有两个变量X与Y,我们可以用一个确定函数关系式:y=u(x)

大致的描述Y与X之间的相关关系,函数u(x)称为Y关于X的回归函数,方程y=u(x)

成为Y关于X的回归方程。

一元线性回归处理的是两个变量x与y之间的线性关系,可以设想y的值由两部分构成:一部分由自变量x 的线性影响所致,表示x的线性函数 a+bx;另一部分则由众多其他因素,包括随机因素的影响所致,这一部分可以视为随机误差项,记为ε。可得一元线性回归模型

y=a+bx+ε(1)

式中,自变量x是可以控制的随机变量,成为回归变量;固定的未知参数a,b成为回归系数;y称为响应变量或因变量。由于ε是随机误差,根据中心极限定理,通常假定ε~N(0,σ²),σ²是未知参数。

确定Y与X之间的关系前,可根据专业知识或散点图,选择适当的曲线回归方程,而这些方程往往可以化为线性方程或者就是线性方程,因此我们可以用线性方程:y=a+bx

大致描述变量Y与X之间的关系; 1)模型回归系数的估计

为了估计回归系数,假定试验得到两个变量x 与y 的n 个数据对(xi,yi), i=1,2,3, .,n我们将这n 对观测值代入式(1),得 y =a+bxi+ε

i

n

,i=1 .,n

这里ε

1

,ε

2

, ,ε

n

互独立的随机变量,军服从正态分布,即ε~N(0,σ

用matlab儿童的体重与体积的回归分析

²),i=1,2, .n

回归系数估计的方法有多种,其中使用最广泛的是最小二乘法,即要求选取的a b, 的值使得述随机误差ε 的平方和达到最小,即求使得函数

Q(a,b)= i²= (yi a bxi)2

i 1

i 1

n

n

取得最小值的a ,b 。

由于Q(a,b)是a,b的二元函数,利用微积分中的函数存在极值的必要条件,分别对Q(a,b)求a,b偏导数,并令其为0,构成二元一次方程组

(y

i 0

n

i

a bxi)=0,

(y

i 1

i 0

i

a bxi)xi=0,

化简后得到如下正规方程组 na+b xi)= yi,

i 1

i 1

n

n

a xi)+b x

i 1

i 1

nn

2

i

)= xiyi

i 1

n

解方程组得到总体参数a,b估计量

1a=n

^

1b- yin

^

xi,b=

^

nxiyi xiyinx (xi)

2

i

2

这里,xi 和yi(i=1,2, ,n)均已有的观测数据。 由此得到回归方程

y=a+bx

^

^

^

带入观测xi,得到值yi称为回归预测值。方程的直线称为回归直线。 2)回归方程显著性检验

用matlab儿童的体重与体积的回归分析

建立一元线性回归方程当且仅当变量之间存在线性相关关系时才是有意义的,因此必须对变量之间的线性相关的显著性进行检验,即对建立的回归模型进行显著性检验。

我们首先引入几个概念:

n

_

(1) SST= (yi-y)2,称为SST总偏差平方和,它表示观测值yi总

i 1

的分散程度;

n

_

(2) SSR= (yi-y)2,称SSR为回归平方和,它是由回归变量x的

i 1

^

变化引起的,放映了回归变量x对变量y线性关系的密切程度;

n

(3) SSE= (yi-yi)2,称SSE为残差(剩余)平方和,它是由观测

i 1

^

误差等其他因素起误差,它的值越小说明回归方程与原数据拟合越好。

可以证明下列关系成立

SST= SSR+ SSE

n

_

i 1

(yi-y)= SSR= (yi-y)+ SSE= (yi-yi)2

2

2

n

^

_n

^

i 1i 1

我们主要考虑回归平方和在总偏差和中所占的比重,记R2=

SSR

。(0<=R<=1 SST

),称R为复相关系数,用R的大小来评价模型的有效性,R越大,则反映回归变量与相应变量之间的线性函数关系越密切。引入F统计量。 定义F=

SSRSSE

n 2)

,可知F~F(1,n-2).对于给定的显著水平a(一般这里取

用matlab儿童的体重与体积的回归分析

0.05或0.01),查表可得临界值Fa(1,n-2)

如果F> F (1,n-2),则认为y与x之间的线性关系显著;如果F<= F (1,n-2),则认为y与x之间的线性关系不显著,或者不存在线性关系,在实际应用中也可以通过F对应的概率P< 来说明y与x之间的线性相关性显著。 3)回归系数的置信区间

^

^

回归方程(1)的回归系统a,b是一个点估计值,给定置信水平1- 后,可得到他们对应的置信区间,并且回归区间越短越好,如果摸个回归系数的置信区间包含0点,则说明该回归变量的影响不显著,需要进一步地修改回归方程,尽量是每个回归系数的置信区间都不包含0点。 4)利用模型预测

在对所建立的回归模型进行相关程度检验与分析之后,如果预测变量y与相关变量x的每一个给定值x0,带入回归模型,就可以求得一个相对应的回归预测值y0,y0称为模型的点估计值。

^

^

用matlab儿童的体重与体积的回归分析

3.设计方法 题目:

列出了18个5~8岁儿童的重量(这是容易测得的)和体积(这是难以测得的)。统计数据如表7。2所示,求y与x的回归方程,并画出参差及回归方程的图形。

解 (1)输入数据,观察与的线性关系 在命令窗口输入:

X=[10.3 10.9 11.2 11.6 12.1 12.3 13.4 14.3 14.9 15.6 15.6 15.7 15.6 15.8 17.2 17.7 18.1 18.8]';

Y=[11.3 12.8 13.2 14.2 15.2 15.6 17.8 19.6 20.8 22.2 22.2 22.7 22.2 22.4 25.4 26.4 27.2 28.6]'; plot(X,Y,'*')

生成图(1),可以看出x和y大体成线性关系。

用matlab儿童的体重与体积的回归分析

图<1>散点图 (2)作回归分析与检验 在命令窗口输入: X=[ones(18,1) X];

[b,bint,r,rint,stats]=regress(Y,X) b =

-9.2716 2.0172 bint =

-9.6063 -8.9368 1.9945 2.0399

用matlab儿童的体重与体积的回归分析

r =

-0.2055 0.0842 -0.1210 0.0722 0.0636 0.0601 0.0412 0.0258 0.0154 0.0034 0.0034 0.3017 0.0034 -0.2000 -0.0241 -0.0327 -0.0396 -0.0516 rint =

-0.4025 -0.0085 -0.1437 0.3121 -0.3464 0.1045 -0.1624 0.3067

用matlab儿童的体重与体积的回归分析

-0.1748 0.3019 -0.1796 0.2998 -0.2038 0.2862 -0.2212 0.2727 -0.2317 0.2625 -0.2427 0.2495 -0.2427 0.2495 0.1196 0.4838 -0.2427 0.2495 -0.4198 0.0198 -0.2629 0.2147 -0.2678 0.2024 -0.2711 0.1920 -0.2758 0.1726 stats =

1.0e+004 *

0.0001 3.5403 0

得到回归系数为-9.2716,2.0172,其置信区间分别为【-9.6063 ,-8.9368】,【1.9945,2.0399】,且两个置信区间都不包含0;负相关系数R²=0.0001,F= 3.5403,对应的概率P=0<0.05,可知回归方程 =-9.2716+ 2.0172x 线性相关关系显著。 (3)残差分析 在命令窗口输入: rcoplot(r,rint) 出现图2.

从残差图可以看出,数据的残差离零点较近,且残差的置信区间均包含零点,这

用matlab儿童的体重与体积的回归分析

说明回归模型 =-9.2716+ 2.0172x能很好的符合原始数据。

图<2>残差图 (4)点预测及作图 在命令窗口输入: Z=b(1)+b(2)*X; plot(X,Y,'K+',X,Z,'r') 出现图3

用matlab儿童的体重与体积的回归分析

图(3)点预测图

(5)下面用Excel“分析工具库”提供的“回归”工具,找出线性回归方程,并检验其显著性。 解:1、具体步骤如下:

1>在【工具】菜单中选中【数据分析】,则会弹出【数据分析】对话框,然后“分析工具”中选择“回归”选项,如图二所示。单击【确定】后,则弹出【回归】对话框,如图<5>所示。

2>填写【回归】对话框。如图<6>所示,该对话框的内容较多,可以根据需要,选择相关项目。

在“X值输入区域”内输入队因变量数据区域的引用,该区域必须有单列数据组成,如本题中组分B;在“Y只输入区域”输入对自变量数据区域的引用,如本题中组分C。

“标志” :如果输入区域的第一行中包含标志项,则选中此复选框,本题中的输入区域包含标志项;如果在输入区域中没有标志项,则应清楚此复选框,Excel将在输出表中生成合适的数据标志。

“置信度” :如果需要在汇总输出表中包含附件的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。Excel默认的置信度为95%,

用matlab儿童的体重与体积的回归分析

相当于显著性水平a=0.05。

“常数为零” :如果要强制回归线通过原点,则选中此复选框。

“输出选项” :选择“输出区域”,在此输出对输出表左上角单元格的引用。

3>“残差” :如果需要以残差输出表形式查看残差,则选中此复选框。 “标准残差” :如果需要在残差输出表中包含标准残差,则选中此复选框。 “残差图” :如果需要生成一张图表,绘制每个自变量及其残差,则选中此复选框。

“线性拟合图” :如果需要为预测值和观察值生成和观测值生车一个图表,则选中此复选框。

“正态概率图” :如果需要绘制正态概率图,则选中此复选框。

图<4>散点图

图<5>Excel数据分析工具

用matlab儿童的体重与体积的回归分析

图<6>回归分析工具界面

图<7>在Excel中的数据图

用matlab儿童的体重与体积的回归分析

图<8>在Excel中的出回归分析

图<9>在Excel残差值图

用matlab儿童的体重与体积的回归分析

图<10>参差图

用matlab儿童的体重与体积的回归分析

4.设计总结

回归分析是数理统计中研究变量之间相关关系的一种有效方法我们可以利用MATLAB软件分析其离散程度,进而解决实际问题。随机数在解决实际问题中有很重要的意义,有些实际问题无法取得数据,就可以利用此程序来产生所需要的随机数,利用这些随机数来对分布函数中的参数进行参数估计。通过本次课程设计,了解了关于回归分析和软件MATLAB的应用,丰富自己的阅历,增长自己的知识。

5.设计心得

终于自己独立完成了课程设计,感觉非常有成就感,当初在做之前感觉又要找题目,还得编出来感觉很难,在编完之后,才感觉万事开头难,开了头后面的就好做都了。以前感觉学的都用不到,尤其是数学软件,现在才软件知识的用途真大,那么难的数学题,只需要简单的几步就可以做出来,现在通过自己实践,才知道是多么重要。因此我建议,以后多组织一些这方面的实验,有一个挑战自己的机会。

用matlab儿童的体重与体积的回归分析

致 谢

本论文是张玉春老师指导下完成的。她严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。帮助我在回归分析的知识方面进一步认识和理解,在此,我向张老师致以诚挚的谢意和崇高的敬意。

同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助,和我一起解决难题,我不仅得到了新的知识,跟得到了更深厚的友谊。我还要感谢我的论文中被我引用或参考的文献的作者。

用matlab儿童的体重与体积的回归分析

参考文献

[1] 沈恒范.概率论与数理统计教程[M].第四版.高等教育出版社,2003.4:140-196 [2] 潘承毅,何迎辉.数理统计的原理与方法[M].同济大学出版社,1993 [3] 陈希孺.数理统计引论[M].科学出版社,1981:96-97 [4] 复立. 数学实验.科学出版社,1981:96-97

[5] 李秀珍,庞常词. 数学实验. 机械工业出版社,1981:96-97

本文来源:https://www.bwwdw.com/article/yxj4.html

Top