应用回归分析上机指导

更新时间:2023-09-19 05:40:01 阅读量: 小学教育 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

试验一 一元线性回归分析

试验目的:通过上机试验,使学生掌握一元线性回归分析的基本原理,熟悉软件操作过程,能对软件输出结果进行分析。

试验数据:

例一.一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周时间,收集了每周加班工作时间的数据和签发的新保单数目,x为每周签发的新保单数目,y为每周加班工作时间(小时)。见表1.1

表1 1

周序号 X y

1 2 3 1070 4.0 4 550 2.0 5 480 1.0 6 920 3.0 7 1350 4.5 8 325 1.5 9 670 3.0 10 1215 5.0 825 215 3.5 1.0 问Y与X之间是否存在显著的线性结果分析,用最小二乘估计求出回归方程,并作相应分析。

软件实现步骤: 1.在SPSS的数据编辑窗口中输入表1.1中的数据。在“Analyze”菜单中选择“Regression”中的Linear命令。

2.在弹出的Linear Regression对话框中,从对话框左侧的变量列表中选择Y变量,单击Dependent框旁的箭头按钮,使之添加到Dependent框中,表示该变量是因变量,选择X变量,单击Inderndent(s)框旁的箭头按钮,使之添加到Inderndent(s)框中,表示其为自变量。

3.单击OK按钮,即可得到SPSS回归分析的结果。 软件输出结果:

bVariables Entered/RemovedVariablesVariablesModelEnteredRemovedMethoda1X.Entera. All requested variables entered.b. Dependent Variable: Y

1

CoefficientsaUnstandardizedCoefficientsModelBStd. Error1(Constant).118.355X.004.000a. Dependent Variable: YStandardizedCoefficientsBeta.949t.3338.509Sig..748.000 结果分析:

1.输出结果文件中的第一个表格输出的是被引入或从回归方程中被剔除的各变量。

这部分结果说明在对编号为1的模型(Model)进行线性回归分析时所采用的方法是全部引入法:Enter。

2.输出的结果文件中第二个表格输出的是常用统计量。

从这部分结果看出相关系数R=0.949,判定系数R2=0.900,调整的判定系数R2=0.888,回归估计的标准误差S=0.48002。说明样本回归方程的代表性强。

3.输出的结果文件中第三表格是方差分析表。

从这部分结果看出:统计量F=72.396;相伴概率值p<0.001。说明自变量x与因变量y之间确有线性回归关系。另外,Sum of Squares一栏中分别代表回归平方和(16.682)、残差平方和(1.843)以及总平方和(18.525),Df为自由度。

4.输出的结果文件中第四个表格是回归系数分析。其中,Unstandadized Coefficients为非标准化系数,Standadized Coefficients为标准化系数,t为回归系数检验统计量,Sig为相伴概率值。

从表格中可以看出估计值及其检验结果,常数项B0=0.118,回归系数B1=0.003585,回归系数检验统计量t=8.509,相伴概率值 p<0.001。说明回归系数与0有显著差别,该回归方程有意义:

Y=0.118+0.003585X

试验二 多元线性回归分析

试验目的:通过上机试验,使学生掌握多元线性回归分析的基本原理,熟悉软件操作过程,能对软件输出结果进行分析。

试验数据:

例二:研究货运总量y(万吨)与工业总产值x1(亿元)、农业总

2

产值x2 (亿元)、居民非商品支出 x3(亿元)的关系。数据见表2.1

表 2.1

编号 货运总量 工 业总产值x1(亿元) 70 75 65 74 72 68 78 66 70 65 农业总产值x2 居民非商品支出 (亿元) 35 40 40 42 38 45 42 36 44 42 x3(亿元) 1.0 2.4 2.0 3.0 1.2 1.5 4.0 2.0 3.2 3.0 y(万吨) 1 2 3 4 5 6 7 8 9 10

160 260 210 265 240 220 275 160 275 250 问Y与X之间是否存在显著的线性结果分析,用最小二乘估计

求出回归方程,并作相应分析。

软件实现步骤: 1.在SPSS的数据编辑窗口中输入表2.1中的数据。在“Analyze”菜单中选择“Regression”中的Linear命令。

2.在弹出的Linear Regression对话框中,从对话框左侧的变量列表中选择Y变量,单击Dependent框旁的箭头按钮,使之添加到Dependent框中,表示该变量是因变量,选择X1,X2、,X3变量,单击Inderndent(s)框旁的箭头按钮,使之添加到Inderndent(s)框中,表示其为自变量。

3.单击Linear Regression对话框中的Statistics按钮,Statistics对话框,用来选择输出哪些统计量,本试验中,我们选择如下几项:

Estimates:SPSS默认的输出项.输出与回归系数相关统计量。如回归系数、回归系数的标准误差、标准回归系数、t统计师长相应的相伴概率值(sig)、各自变量的容忍度等。

Confidence intervals:输出每一个非标准化回归系数95%的可信区间。

Model fit:输出判定系数、调整的判定系数、回归方程的标准误差,F检验的ANOVA方差分析表。该选项为默认选项。

3

Descriptives:输出自变量和因变量的均值、标准差相关系数矩阵用单侧检验概率。

单击Continue按钮回到Linear Regression对话框。

4.单击Linear Regression对话框中的Save按钮,打开Save对话框,Predicted Values(即预测值栏)中选择Unstandardized(即保存均值的预测区间)和Indiviual(即保存单个新值的预测区间)。然后单击Continue按钮回到Linear Regression对话框。

5.单击OK按钮,即可得到SPSS分析的结果。 软件部分输出结果:

bVariables Entered/RemovedVariablesVariablesModelEnteredRemovedMethoda1X3, X1, X2.Entera. All requested variables entered.b. Dependent Variable: Y Model SummarybAdjusted RModelRR SquareSquarea1.898.806.708a. Predictors: (Constant), X3, X1, X2b. Dependent Variable: YStd. Error ofthe Estimate23.44188 ANOVAbModel1Sum ofSquaresdfRegression13655.3703Residual3297.1306Total16952.5009a. Predictors: (Constant), X3, X1, X2b. Dependent Variable: YMean Square4551.790549.522F8.283Sig..015a CoefficientsaUnstandardizedCoefficientsModelBStd. Error1(Constant)-348.280176.459X13.7541.933X27.1012.880X312.44710.569a. Dependent Variable: YStandardizedCoefficientsBeta.385.535.277t-1.9741.9422.4651.178Sig..096.100.049.28495% Confidence Intervalfor BLower BoundUpper Bound-780.06083.500-.9778.485.05314.149-13.41538.310 4

bVariables Entered/RemovedVariablesVariablesModelEnteredRemovedMethoda1X2, X1.Entera. All requested variables entered.b. Dependent Variable: Y Model SummarybAdjusted RModelRR SquareSquarea1.872.761.692a. Predictors: (Constant), X2, X1b. Dependent Variable: YStd. Error ofthe Estimate24.08112 ANOVAbSum ofModelSquaresdf1Regression12893.199Residual4059.301Total16952.500a. Predictors: (Constant), X2, X1b. Dependent Variable: YMean Square6446.600579.900F11.117Sig..007a279 CoefficientsaUnstandardizedCoefficientsModelBStd. Error1(Constant)-459.624153.058X14.6761.816X28.9712.468a. Dependent Variable: YStandardizedCoefficientsBeta.479.676t-3.0032.5753.634Sig..020.037.00895% Confidence Intervalfor BLower BoundUpper Bound-821.547-97.700.3818.9703.13414.808结果分析:

1、回归方程为Y=-348.280+3.754X1+7.101X2+12.447X3 2.决定系数R2=0.806修正后的决定系数为R=0.708 由决定系数看回归方程拟合效果还可以。

3.方差分析表,D=8.283,P值=0.015 表明回归方程较显著,说明X1、X2、X3整体上对Y有效显著的线性影响。

4.回归系数的显著性检验:t1=1.942,P1=0.100, t2=2.465,P2=0.049 ,表明X1,X2对Y有效显著影响(取a=0.1),t3=1.178,P3=0.284>0.1,表明X3对Y没有显著影响,可以考虑从回归方程中剔除X3,仅以X1,X2为自变量,重新对Y作回归方程,具体软件操作步骤同前。

从而得到新的回归方程为Y=-459.3624+4.676X1+8.971X2;标准化方程为Y=0.479X1+0.676X2

5

本文来源:https://www.bwwdw.com/article/nkrh.html

Top