计算12个气象观测站的若干统计量

更新时间:2024-03-26 22:16:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

淮阴工学学院

数理学院 数学建模与实验课程 实验报告

实验名称 十二、数理统计实验 实验地点 26#114 日期 2012-05-15 姓名 白永前 班级 金融1091 学号 1094104101 成绩

【实验目的及意义】 1、掌握用数学软件包求解统计问题 2、掌握用数学软件求解回归分析问题

【实验内容】

用数学软件求解回归分析问题

【实验要求与任务】

根据实验内容和步骤,完成以下实验,要求写出实验报告(实验目的→问题→数学模型→算法与编程→计算结果→分析、检验和结论)

某市有12个县,每个县有一个气象观测站,每个气象观测站测得的年降水量即为该县的年降水量。10年来各观测站测得的年降水量如下表。

表1 年降水量表 地点 年份 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 1 276.2 251.6 192.7 246.2 291.7 466.5 258.6 453.4 158.5 324.8 2 324.5 287.3 433.2 232.4 311 158.9 327.4 365.5 271 406.5 3 158.6 349.5 289.9 243.7 502.4 223.5 432.1 357.6 410.2 235.7 4 412.5 297.4 366.3 372.5 254 425.1 403.9 258.1 344.2 288.8 5 292.8 227.8 466.2 460.4 245.6 251.4 256.6 278.8 250 192.6 6 258.4 453.6 239.1 158.9 324.8 321 282.9 467.2 360.7 284.9 7 334.1 321.5 357.4 298.7 401 315.4 389.7 355.2 376.4 290.5 8 303.2 451 219.7 314.5 266.5 317.4 413.2 228.5 179.4 343.7 9 292.9 466.2 245.7 256.6 251.3 246.2 466.5 453.6 159.2 283.4 10 243.2 307.5 411.1 327 289.9 277.5 199.3 315.6 342.4 281.2 11 159.7 421.1 357 296.5 255.4 304.2 282.1 456.3 331.2 243.7 12 331.2 455.1 353.2 423 362.1 410.7 387.6 407.2 377.7 411.1 为了节省开支,预计至少减少3个气象观测站,问题是减少哪些观测站既可以节省开支,又可以使得该市年降水量的信息量损失较小。试着回答下面问题。

(1) 计算出12个气象观测站的年降水量的均值、标准差、极差、偏度、峰度,画出直方图。 (2) 计算出12个气象观测站之间的相关系数。

(3) 分析(1)(2)的计算结果、那些气象观测站点可以考虑被删除?(提示:①标准差越大的站点,其个性特征就越明显,因而包含的信息就越多,在同等条件下应该优先考虑删除标准差小的站点;②相关系数比较大的变量应该优先考虑被删除) (4)根据线性回归分析,选出被删除气象观测站点最佳的组合。

(5)分析你的结果,当删除(4)中你得到气象观测站点,计算降水信息损失了多少?你的结果是否令你满意?(提示:定义信息损失比率为:?i?标准差,yi为该站点10年降水量的平均值)

第- 1 -页 共5页

?iyi,其中?i为(4)中相应回归方程的剩余

一、计算12个气象观测站的若干统计量

利用Matlab计算出12个气象观测站的年降水的均值、标准差、极差、偏度、峰度,结果如下表,并画出直方图如下:

相关统计量表 气象站点 1 2 3 4 5 6 7 8 9 10 11 12 直方图

均值 292.02 311.77 320.32 342.28 292.22 315.15 343.99 303.71 312.16 299.47 310.72 391.89 标准差 100.1964 80.927 108.2444 63.9747 94.1034 94.2002 38.0479 85.0735 109.3962 57.2472 86.5136 36.8299 极差 308 274.3 343.8 171.1 273.6 308.3 110.5 271.6 307.3 211.8 296.6 123.9 偏度 0.697005 -0.29905 0.186071 -0.15125 1.191118 0.247471 0.07869 0.301474 0.498651 0.184093 0.107924 -0.02539 峰度 2.486248 2.576963 1.961893 1.548742 2.903457 2.427092 1.732416 2.214252 1.845185 3.108002 2.540548 2.271473 二、相关系数

利用Matlab求解12个气象观测站点任意两者之间的相关系数,结果如下表: 1 2 3 4 5 6 7 8 9 10 11 1 1 -0.2-0.2-0.1-0.30.34-0.20.080.29-0.30.15第- 2 -页 共5页

12 0.27 2 3 4 5 6 7 8 9 10 11 12 平均值 -0.24132 -0.22061 -0.1082 -0.33116 0.348149 -0.26223 0.083643 0.29279 -0.30981 0.158706 0.278585 0.3029 4132 2061 0.081 0481 0.081 0481 -0.4-0.50319 0312 0.09-0.2694 6763 0.010.405999 766 0.170.816907 2612 -0.1-0.06471 8583 0.200.190543 1453 0.23-0.01279 1752 0.050.323247 7761 -0.30.014242 1078 0.250.3206 71 082 -0.40319 -0.50312 1 0.315779 -0.55674 -0.1523 0.138442 -0.20294 -0.25011 -0.42014 -0.25973 0.3592 3116 0.09694 -0.26763 0.315779 1 -0.61357 -0.09775 -0.31561 -0.25239 0.581704 0.08441 -0.20366 0.3467 8149 0.015999 0.40766 -0.55674 -0.61357 1 0.223573 0.041685 0.491808 -0.01062 0.654449 0.363125 0.3939 6223 0.176907 0.812612 -0.1523 -0.09775 0.223573 1 -0.3241 0.053089 -0.06737 0.063486 -0.51517 0.3124 3643 -0.16471 -0.08583 0.138442 -0.31561 0.041685 -0.3241 1 0.634776 -0.59459 -0.07618 0.539169 0.3332 279 0.200543 0.191453 -0.20294 -0.25239 0.491808 0.053089 0.634776 1 -0.42254 0.427236 0.425859 0.3830 0981 0.231279 -0.01752 -0.25011 0.581704 -0.01062 -0.06737 -0.59459 -0.42254 1 8706 0.053247 0.327761 -0.42014 0.08441 0.654449 0.063486 -0.07618 0.427236 0.496936 0.491 6936 0.000.561 2554 5216 0.330.360.3721 06 55 8585 -0.34242 0.011078 -0.25973 -0.20366 0.363125 -0.51517 0.539169 0.425859 0.002554 0.565216 三、考虑可以删除的气象站

通过比较12个气象观测点的标准差和相关系数,我们认为气象站点6、7、10、12可以考虑删除。

四、线性回归

将四个考虑删除站点的数据,分别用剩余站点的信息表示。通过比较相关系数,发现第六个站点与站点4,5,9,11的相关系数较高,因此依次建立站点6与站点4,5,9,11的线性回归方程,方程如下:

x6?302.8544?0.1004x4?0.6409x5?0.0273x9?0.7255x11(F=9.3856)

剩余标准差为99.552;

站点7与站点3和站点8的相关系数较高,因此依次建立站点7与站点3,8的线性回归方程,方程如下:

x7?289.7782?0.2779x3?0.1146x8(F=9.2513)

剩余标准差为61.1639;

站点10与站点5,8,9,11的的相关系数较高,因此依次建立站点10与站点5,8,9,11的线性

第- 3 -页 共5页

回归方程,方程如下:

x10?194.5092?0.2142x5?0.0188x8?0.3295x9?0.4858x11(F=7.2074)

剩余标准为65.9213;

站点12与站点8,9,11的的相关系数较高,因此依次建立站点10与站点8,9,11的线性回归方程,方程如下:

x12?208.2868?0.4158x8?0.1881x9?0.3734x11(F=6.918)

剩余标准差为44.4075。

五、结果分析

分别计算站点6、7、10、12的信息损失比率。.信息损失比率为:?i??iyi,其中?i为(4)

中相应回归方程的剩余标准差,yi为该站点10年降水量的平均值,计算得删除四点的信息损失比率分别为:3.16,1.78,2.2,1.13 。可以看出结果比较满意。

六、程序代码

X=xlsread('data.xls'); mean_0=zeros(12,1); std_0=zeros(12,1);

skewness_0=zeros(12,1); kurtosis_0=zeros(12,1); jicha_0=zeros(12,1); for i=1:12

mean_0(i)=mean(X(:,i)); std_0(i)=std(X(:,i));

skewness_0(i)=skewness(X(:,i)); kurtosis_0(i)=kurtosis(X(:,i));

jicha_0(i)=max(X(:,i))-min(X(:,i)); end

hist(X,12)

corr_0=zeros(12,12); for i=1:12

for j=1:12

corr_0(i,j)=corr(X(:,i),X(:,j)); end end

mean_1=zeros(12,1); for k=1:12

mean_1(k)=mean(abs(corr_0(k,:))); end

X1=[X(:,1:4) X(:,5) X(:,8:9) X(:,11)]; Y=[X(:,6) X(:,7) X(:,10) X(:,12)];

第- 4 -页 共5页

for i=1:4

y=Y(:,i);

stepwise(X1,y) end

X6=[ones(10,1) X(:,4:5) X(:,9) X(:,11)]; y6=X(:,6);

[b6,bint6,r6,rint6,s6]=regress(y6,X6) X7=[ones(10,1) X(:,3) X(:,8) ]; y7=X(:,7);

[b7,bint7,r7,rint7,s7]=regress(y7,X7)

X10=[ones(10,1) X(:,5) X(:,8) X(:,9) X(:,11) ]; y10=X(:,10);

[b10,bint10,r10,rint10,s10]=regress(y10,X10) X10=[ones(10,1) X(:,5) X(:,8) X(:,9) X(:,11) ]; y10=X(:,10);

[b10,bint10,r10,rint10,s10]=regress(y10,X10) X12=[ones(10,1) X(:,8) X(:,9) X(:,11) ]; y12=X(:,12);

[b12,bint12,r12,rint12,s12]=regress(y12,X12)

第- 5 -页

共5页

本文来源:https://www.bwwdw.com/article/fz9r.html

Top