Excel回归分析结果的详细阐释

更新时间：2024-04-30 13:45:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

Excel回归分析结果推荐度：
相关推荐

Excel回归分析结果的详细阐释

利用Excel的数据分析进行回归，可以得到一系列的统计参量。下面以连续10年积雪深度和灌溉面积序列（图1）为例给予详细的说明。

图1 连续10年的最大积雪深度与灌溉面积（1971－1980）

回归结果摘要（Summary Output）如下（图2）：

图2 利用数据分析工具得到的回归结果

第一部分：回归统计表

这一部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目如下（表1）：

表1 回归统计表

逐行说明如下：

Multiple对应的数据是相关系数(correlation coefficient)，即R=0.989416。

R Square对应的数值为测定系数(determination coefficient)，或称拟合优度(goodness of fit)，它是相关系数的平方，即有R2=0.9894162=0.978944。

Adjusted对应的是校正测定系数(adjusted determination coefficient)，计算公式为

(n?1)(1?R2)Ra?1?

n?m?1式中n为样本数，m为变量数，R2为测定系数。对于本例，n=10，m=1，R2=0.978944，代入上式得

Ra?1?(10?1)(1?0.978944)?0.976312

10?1?1标准误差（standard error）对应的即所谓标准误差，计算公式为

s?1SSe

n?m?1这里SSe为剩余平方和，可以从下面的方差分析表中读出，即有SSe=16.10676，代入上式可得

s?1*16.10676?1.418924

10?1?1最后一行的观测值对应的是样本数目，即有n=10。

第二部分，方差分析表

方差分析部分包括自由度、误差平方和、均方差、F值、P值等（表2）。

表2 方差分析表（ANOVA）

逐列、分行说明如下：

第一列df对应的是自由度（degree of freedom），第一行是回归自由度dfr，等于变量数目，即dfr=m；第二行为残差自由度dfe，等于样本数目减去变量数目再减1，即有dfe=n-m-1；第三行为总自由度dft，等于样本数目减1，即有dft=n-1。对于本例，m=1，n=10，因此，

dfr=1，dfe=n-m-1=8，dft=n-1=9。

第二列SS对应的是误差平方和，或称变差。第一行为回归平方和或称回归变差SSr，即有

?i?yi)2?748.8542 SSr??(yi?1n它表征的是因变量的预测值对其平均值的总偏差。

第二行为剩余平方和（也称残差平方和）或称剩余变差SSe，即有

?i)2?16.10676 SSe??(yi?yi?1n它表征的是因变量对其预测值的总偏差，这个数值越大，意味着拟合的效果越差。上述的y

的标准误差即由SSe给出。

第三行为总平方和或

n称总变差SSt，即有

SSr?(yi?yi)2?764.961 i?1?

它表示的是因变量对其平均值的总偏差。容易验证748.8542+16.10676=764.961，即有

SSr?SSe?SSt

而测定系数就是回归平方和在总平方和中所占的比重，即有

R2?SSr748.8542??0.978944 SSt764.961显然这个数值越大，拟合的效果也就越好。

第四列MS对应的是均方差，它是误差平方和除以相应的自由度得到的商。第一行为回归均方差MSr，即有

MSr?第二行为剩余均方差MSe，即有

SSr748.8542??748.8542 dfr1SSe16.10676??2.013345 dfe8MSe?显然这个数值越小，拟合的效果也就越好。

第四列对应的是F值，用于线性关系的判定。对于一元线性回归，F值的计算公式为

F?R21(1?R2)n?m?1dfeR2? 21?R式中R2=0.978944，dfe=10-1-1=8，因此

F?8*0.978944?371.9453

1?0.978944第五列Significance F对应的是在显著性水平下的Fα临界值，其实等于P值，即弃真概率。所谓“弃真概率”即模型为假的概率，显然1-P便是模型为真的概率。可见，P值越小越好。对于本例，P=0.0000000542<0.0001，故置信度达到99.99%以上。

第三部分，回归参数表

回归参数表包括回归模型的截距、斜率及其有关的检验参数（表3）。

表3 回归参数表

第一列Coefficients对应的模型的回归系数，包括截距a=2.356437929和斜率b=1.812921065，由此可以建立回归模型

?i?2.3564?1.8129xi y或

yi?2.3564?1.8129xi??i

?a或s?b表示）第二列为回归系数的标准误差（用s，误差值越小，表明参数的精确度越高。

这个参数较少使用，只是在一些特别的场合出现。例如L. Benguigui等人在When and where is a city fractal?一文中将斜率对应的标准误差值作为分形演化的标准，建议采用0.04作为分维判定的统计指标（参见EPB2000）。

不常使用标准误差的原因在于：其统计信息已经包含在后述的t检验中。

第三列t Stat对应的是统计量t值，用于对模型参数的检验，需要查表才能决定。t值是回归系数与其标准误差的比值，即有

ta?根据表3中的数据容易算出：

ab，tb?

??sasbta?2.3564381.812921?1.289167，tb??19.28588

1.8278760.094002对于一元线性回归，t值可用相关系数或测定系数计算，公式如下

t?R1?Rn?m?12

将R=0.989416、n=10、m=1代入上式得到

t?0.9894161?0.98941610?1?12?19.28588

对于一元线性回归，F值与t值都与相关系数R等价，因此，相关系数检验就已包含了这部分信息。但是，对于多元线性回归，t检验就不可缺省了。

第四列P value对应的是参数的P值（双侧）。当P<0.05时，可以认为模型在α=0.05的水平上显著，或者置信度达到95%；当P<0.01时，可以认为模型在α=0.01的水平上显著，

或者置信度达到99%；当P<0.001时，可以认为模型在α=0.001的水平上显著，或者置信度达到99.9%。对于本例，P=0.0000000542<0.0001，故可认为在α=0.0001的水平上显著，或者置信度达到99.99%。P值检验与t值检验是等价的，但P值不用查表，显然要方便得多。

最后几列给出的回归系数以95%为置信区间的上限和下限。可以看出，在α=0.05的显著水平上，截距的变化上限和下限为-1.85865和6.57153，即有

?1.85865?a?6.57153

斜率的变化极限则为1.59615和2.02969，即有

1.59615?b?2.02969

第四部分，残差输出结果

这一部分为选择输出内容，如果在“回归”分析选项框中没有选中有关内容，则输出结果不会给出这部分结果。

?i表残差输出中包括观测值序号（第一列，用i表示），因变量的预测值（第二列，用y示），残差（residuals，第三列，用ei表示）以及标准残差（表4）。

表4 残差输出结果

预测值是用回归模型

?i?2.3564?1.8129xi y计算的结果，式中xi即原始数据的中的自变量。从图1可见，x1=15.2，代入上式，得

?1?2.3564?1.8129x1?2.3564?1.8129*15.2?29.91284 y其余依此类推。

残差ei的计算公式为

?i ei?yi?y从图1可见，y1=28.6，代入上式，得到

?1?28.6?29.91284??1.31284 e1?y1?y其余依此类推。

标准残差即残差的数据标准化结果，借助均值命令average和标准差命令stdev容易验证，残差的算术平均值为0，标准差为1.337774。利用求平均值命令standardize(残差的单元格范围，均值，标准差)立即算出表4中的结果。当然，也可以利用数据标准化公式

zi*?zi?zvar(zi)n?zi?z?i

逐一计算。将残差平方再求和，便得到残差平方和即剩余平方和，即有

?i)2?16.10676 SSe??e??(yi?y2ii?1i?1n利用Excel的求平方和命令sumsq容易验证上述结果。

以最大积雪深度xi为自变量，以残差ei为因变量，作散点图，可得残差图（图3）。残差点列的分布越是没有趋势（没有规则，即越是随机），回归的结果就越是可靠。

?i为因变量，作散点图，可得用最大积雪深度xi为自变量，用灌溉面积yi及其预测值y线性拟合图（图4）。

最大积雪深度x(米) Residual Plot321残差0-1-2-3最大积雪深度x(米)

图3 残差图

051015202530最大积雪深度x(米) Line Fit Plot60灌溉面积y(千亩)5040302010001020最大积雪深度x(米)30

图4 线性拟合图

灌溉面积y(千亩)预测灌溉面积y(千亩) 6

第五部分，概率输出结果

在选项输出中，还有一个概率输出（Probability Output）表（表5）。第一列是按等差数列设计的百分比排位，第二列则是原始数据因变量的自下而上排序（即从小到大）——选中图1中的第三列（C列）数据，用鼠标点击自下而上排序按钮列数值。当然，也可以沿着主菜单的“数据(D)→

，立即得到表5中的第二

排序(S)”路径，打开数据排序选项框，

进行数据排序。

用表5中的数据作散点图，可以得到Excel所谓的正态概率图（图5）。

表5 概率输出表

Normal Probability Plot60灌溉面积y(千亩)504030201000204060Sample Percentile图5 正态概率图

80100

【几点说明】

第一，多元线性回归与一元线性回归结果相似，只是变量数目m≠1，F值和t值

等统计量与R值也不再等价,因而不能直接从相关系数计算出来。

第二，利用SPSS给出的结果与Excel也大同小异。当然，SPSS可以给出更多的统

计量，如DW值。在表示方法上，SPSS也有一些不同，例如P Value（P值）用 Sig.（显著性）表征，因为二者等价。只要能够读懂Excel的回归摘要，就可以读懂SPSS回归输出结果的大部分内容。

本文来源：https://www.bwwdw.com/article/o8ng.html

相关文章：

正在阅读：

Excel回归分析结果的详细阐释04-30

专项整治检查表 - 图文01-16

2018校长三八妇女节讲话稿与2018校长中考百日誓师大会讲话稿汇编03-20

梦想日记范文精选10-29

桥梁基础安全风险告知书06-16

酶学研究领域中的诺贝尔奖获得者及其成果12-19

深入浅出Oracle之Forms开发指南04-08

最新全过程咨询管理合同资料04-16

重读《共产党宣言》有感02-23

第4章广告作品的设计艺术(3)06-10

上一篇：上学期期末统考试卷讲评下一篇：义务教育课标版一年级上册写字配套教案