SPSS人大薛微 第三版 课后习题

更新时间:2024-06-09 13:08:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

5.2

Independent Samples Test

Levene's Test for Equality of Variances t-test for Equality of Means ?ò Equal variances assumed Equal variances not assumed

257.985 .000 F 9.640 9.815 Sig. 381 345.536 t .000 .000 df .41978 .41978 Sig. (2-tailed) .04354 .04277 Mean Difference .33416 .33566 Std. ErDifferen.5054.5039

第六章 P179-181 1. ANOVA 推销额t Between Groups Within Groups Total Sum of Squares 405.534 269.737 675.271 df 4 30 34 Mean Square 101.384 8.991 F 11.276 Sig. .000 有单因素方差分析结果可知,观测变量推销额的总离差平方和为675.271,不同推销方式可解释的变差为405.534,抽样误差引起的变差为269.727,它们的方差分别为101.384和8.991,相处所得的F统计量的观测值为11.276,对应的概率P值为0。如果显著性水平为0.05,由于P小于0.05,所以应拒绝原假设,即不同的推销方式对销售额的影响效应为0.

Multiple Comparisons 推销额 LSD (I) 推销方式 第一组 (J) 推销方式 第二组 第三组 第四组 第五组 第二组 第一组 Mean Difference (I-J) -3.30000 .72857 3.05714 -6.70000 3.30000 *** 95% Confidence Interval Std. Error 1.60279 1.60279 1.60279 1.60279 1.60279 Sig. .048 .653 .066 .000 .048 Lower Bound -6.5733 -2.5448 -.2162 -9.9733 .0267 Upper Bound -.0267 4.0019 6.3305 -3.4267 6.5733 第三组 第四组 第五组 第三组 第一组 第二组 第四组 第五组 第四组 第一组 第二组 第三组 第五组 第五组 第一组 第二组 第三组 第四组 4.02857 6.35714 -3.40000 -.72857 -4.02857 2.32857 -7.42857 -3.05714 -6.35714 -2.32857 -9.75714 6.70000 3.40000 7.42857 9.75714 ***********1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 .018 .000 .042 .653 .018 .157 .000 .066 .000 .157 .000 .000 .042 .000 .000 .7552 3.0838 -6.6733 -4.0019 -7.3019 -.9448 -10.7019 -6.3305 -9.6305 -5.6019 -13.0305 3.4267 .1267 4.1552 6.4838 7.3019 9.6305 -.1267 2.5448 -.7552 5.6019 -4.1552 .2162 -3.0838 .9448 -6.4838 9.9733 6.6733 10.7019 13.0305

*. The mean difference is significant at the 0.05 level. 均值对比图如上图所示。由LSD方法得出的多重检验结果可知,如果显著性水平为0.05,则第一组和第三组没有显著差异,第三组和第四组差异不显著,但其他组两两之间差异非常显著。

2,(1)由方差齐性检验表格中的数据可知:如果显著性水平为0.05,由于概率P值小于显著性水平,因此应拒绝原假设,认为不同类高血压患者的血压差的总体方差有显著差异,不满足方差分析的前提要求。 (2)由单因素方差分析结果可知,如果显著性水平为0.05,由于概率P值为0,所以应拒绝原假设,即认为该降压药对不同组患者的降压效果存在显著差异。

(3)由LSD方法进行的多重检验结果可知,该降压药更适合第一组患者。 3 Between-Subjects Factors 地区 1 2 3 Value Label 地区一 地区二 地区三 周一至周三 周四至周五 周末 N 9 9 8 9 9 8 日期 1 2 3

Tests of Between-Subjects Effects Dependent Variable:销售量 Type III Sum of Source Corrected Model Intercept x2 x3 x2 * x3 Error Total Corrected Total Squares 6.585E7 8.267E8 2016666.667 2988888.889 6.055E7 1.250E7 8.870E8 7.835E7 a df 8 1 2 2 4 17 Mean Square 8230769.231 8.267E8 1008333.333 1494444.444 1.514E7 F 11.194 1.124E3 1.371 2.032 20.587 Sig. .000 .000 .280 .162 .000 735294.118 26 25 a. R Squared = .840 (Adjusted R Squared = .765) 由多因素方差分析结果可知,Fx,Fx2,Fx1*x2的概率P值分别为0.28,0.162,和0.00,如果显著性水平为0.05,则Fx2,Fx3的概率P值大于显著性水平,所以应接受原假设,即认为不同地区、不同日期下的销售额总体均值不存在显著差异,对销售额的效应同时为0.同时,由于Fx1*x2的概率P值小于显著性水平0.05,所以应拒绝原假设,即认为不同地区和日期对销售额产生了显著的交互作用。 4. Report Method 旧方法 Mean N Std. Deviation 新方法 Mean N Std. Deviation Total Mean Score add 10.6111 9 1.67290 12.5556 9 2.60342 11.5833 Month 3.5000 9 1.54110 4.0000 9 2.09165 3.7500 N Std. Deviation 18 2.34678 18 1.80074 由上表可知,加盟时间和评分增加量的平均数分别为10.6111和12.5556. Between-Subjects Factors Method 1 2 Value Label 旧方法 新方法 N 9 9 Tests of Between-Subjects Effects Dependent Variable:Score add Type III Sum of Source Corrected Model Intercept x3 x2 Error Total Corrected Total Squares 67.571 200.270 50.557 9.405 26.054 2508.750 93.625 a df 2 1 1 1 15 Mean Square 33.785 200.270 50.557 9.405 F 19.451 115.299 29.106 5.415 Sig. .000 .000 .000 .034 1.737 18 17 a. R Squared = .722 (Adjusted R Squared = .685) Contrast Results (K Matrix) Dependent Variable Method Simple Contrast Level 1 vs. Level 2 Contrast Estimate Hypothesized Value Difference (Estimate - Hypothesized) Std. Error Sig. aScore add -1.461 0 -1.461 .628 .034

95% Confidence Interval for Lower Bound Difference a. Reference category = 2 Upper Bound -2.799 -.123 Test Results Dependent Variable:Score add Source Contrast Error Sum of Squares 9.405 26.054 df 1 15 Mean Square 9.405 F 5.415 Sig. .034 1.737 由上表可知,在剔除加盟时间影响的前提下,新方法比旧方法评分多增加1.461,如果显著性水平是0.05,由于概率P值小于0.05,所以应拒绝原假设,即认为两种培训方式的效果存在显著差别。

第七章 P226-227 1. Jonckheere-Terpstra Test a Number of Levels in nld N Observed J-T Statistic Mean J-T Statistic Std. Deviation of J-T Statistic Std. J-T Statistic Asymp. Sig. (2-tailed) a. Grouping Variable: nld mycd 3 2043 6.752E5 6.812E5 1.285E4 -.466 .641 由J-T检验结果可知,观测的J-T值为6752000,J-T平均值为681200。如果显著性水平为0.05,由于概率P值大于显著性水平,所以应接受原假设,即认为不同年龄段人群对该商品满意程度的分布状况无显著差异。 2. One-Sample Kolmogorov-Smirnov Test N Normal Parameters a 存(取)款金额 282 Mean Std. Deviation 4738.09 10945.569 .333 .292 -.333 5.585 Most Extreme Differences Absolute Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. .000 由单样本K-S检验结果可知,数据的均值为4738.09,标准差为10945.569,如果显著性水平为0.05,由于概率P值小于显著性水平,因此应拒绝原假设,即认为本次存款的总体分布与正态分布存在显著差异。 3. Ranks 存(取)款金额 户口 城镇户口 农村户口 Total N 200 82 282 Mean Rank 149.64 121.63 Sum of Ranks 29929.00 9974.00 Test Statistics a Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed) 存(取)款金额 6571.000 9974.000 -2.627 .009 a. Grouping Variable: 户口 由两样本曼-特惠尼U检验的结果可知,从城镇户口和农村户口中分别抽调了200个和82个样本,两组的秩总和分别为29929和9974,W统计量应取农村户口的秩总和。如果显著性水平为0.05,由于概率P值小于显著性水平,所以应拒绝原假设,即认为不同居住地人群本次存款金额的总体分布存在显著性差异。 4. Ranks 存(取)款种类 收入水平 300元以下 300~800元 800~1500元 1500元以上 Total N 50 164 50 18 282 Mean Rank 144.41 136.19 151.04 155.28 Test Statistics a,b Chi-Square df Asymp. Sig. 存(取)款种类 2.242 3 .524 a. Kruskal Wallis Test b. Grouping Variable: 收入水平 由多独立样本的K-W检验结果可知,四种不同收入人群的平均秩分别为144.41,136.19,151.04,155.28,K-W统计量为2.242,概率P值为0.524,如果显著性水平为0.05,由于概率P值大于显著性水平,因此应接受原假设,即认为不同收入人群本次存款金额的总体分布不存在显著差异。 5. Ranks var001 var002 var003 var004 var005 var006 var007 var008 var009 var010 var011 var012 var013 var014 var015 var016 var017 var018 var019 var020 var021 var022 var023 var024 var025 Mean Rank 22.44 17.50 21.38 18.69 8.44 10.62 29.50 19.31 14.00 21.88 20.44 2.50 2.19 28.25 7.31 11.25 17.69 3.81 15.38 25.00 18.88 35.31 24.44 34.69 26.62 var026 var027 var028 var029 var030 var031 var032 var033 var034 var035 var036 var037 var038 11.12 27.50 12.12 31.94 36.56 33.88 20.19 25.00 4.75 9.38 33.19 4.56 33.31 Test Statistics N Kendall's W Chi-Square df Asymp. Sig. a8 .854 252.782 37 .000 a. Kendall's Coefficient of Concordance 由多配对样本的Kendall协同系数检验结果可知,Friedman检验统计量的观测值为252.782,对应的概率P值为0,。如果显著性水平为0.05,由于概率P值小于显著性水平,因此应拒绝原假设,即认为各运动员得分的平均秩存在显著差异。W协同洗漱为0.854,,接近1,说明不同裁判对运动员的打分标准是一致的。 6. Ranks 品牌1 品牌2 品牌3 Mean Rank 2.33 2.00 1.67 Test Statistics N Chi-Square 6 1.333 adf Asymp. Sig. a. Friedman Test 2 .513 由多配对样本Friedman检验结果可知,品牌1、品牌2和品牌3销售额的平均秩分别为2.33,2.00和1.67。Friedman检验统计量的观测值为1.333,对应的概率P值为0.512.如果显著性水平为0.05,由于概率P值大于显著性水平,因此应接受原假设,即认为大众对三种牛奶品牌的偏好具有显著差异。

第八章 P245-246 1.

Correlations

客户满意度得分 Pearson Correlation Sig. (2-tailed) N 客户满意度得分 综合竞争力得分 1 .773 .001 15 .773 .001 15 15 **** 15 1 综合竞争力得分 Pearson Correlation Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). 由上述散点图可知,企业的客户满意度与综合竞争力存在较强的正相关关系。

由上述表格可知,Pearson相关系数为0.773,所以客户的满意度与其综合竞争力之间存在较强的正相关关

系。 2.

. Correlations

消耗量 1950年每百万男1930年人均香烟子中死于肺癌的人数 1 .737 .010 11 .737 .010 11 11 ****1930年人均香烟消耗量 Pearson Correlation Sig. (2-tailed) N 11 1 1950年每百万男子中死于肺癌的人数 Pearson Correlation Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). 散点图如上图所示。

由上表可知,Pearson相关系数为0.737,说明香烟消耗量与肺癌死亡率之间存在显著的相关关系。 3.

Correlations Control Variables 家庭收入(元) 销售额(万元) Correlation Significance (2-tailed) df 销售价格(元) Correlation Significance (2-tailed) df 销售额(万元) 销售价格(元) 1.000 . 0 -.728 .026 7 -.728 .026 7 1.000 . 0

散点图如上图所示。

如果所绘的图形不能较清晰地展示变量之间的关系,则应先对数据进行调整,剔除极端值,再绘图。 由上述销售额与销售价格之间相关关系的表格可知,在家庭收入作为控制变量的条件下,销售额与销售

价格间的偏相关系数为-0.728,呈较强的线性相关关系。

第十一章

i?12.(1)从变量共同度的计算公式可以看出,除了国家预算内基金和国内贷款共同度较低(0.196、0.769),

其余变量的变量共同度都比较高(都大于0.8,分别为0.821、0.920、0.821)。可见,所提取的因子能够反映原有变量的大部分信息,仅有少部分信息丢失,因子分析效果一般。

s??ai12215(2)利用因子方差贡献的计算公式,可以计算出因子1的方差贡献率为0.7054。可见因子1方差贡献率一般,说明因子的重要性也不高。 (3)

3.(1)根据因子载荷矩阵提出的数据,计算出身高、坐高、体重、胸围、肩宽、骨盆宽的变量共同度分别为:0.915、0.885、0.871、0.453、0.681、0.754。可见,胸围、肩宽的变量共同度较低,其余变量的共同度相对较高1.说明所提取的因子能够反映原有变量的大部分信息,仅有少部分信息丢失,因子分析效果较好。

(2)计算得出,因子1、2的因子方差贡献率分别为:0.529、0.749, (3)?

(4)从旋转后的因子载荷矩阵可以看出,身高、坐高、体重、胸围在第一个因子上有较高的载荷,第一个因子主要解释了这几个变量,可解释为,肩宽、盆骨宽在第二个因子上有较高的载荷,第二个因子主要解释了这几个变量,可解释为

4. 因子分析的变量共同度(一) Communalities ffff 国家预算内资金 国内贷款 利用外资 自筹资金 其他投资 Initial 1.000 1.000 1.000 1.000 1.000 Extraction .196 .769 .820 .920 .821 Extraction Method: Principal Component Analysis. 从结果可知,利用外资、自筹资金、其他投资等变量的绝大多数信息(大于82%)可被因子解释,这些变量的信息丢失较少;但国内贷款这个变量的变量共同度仅为0.769,不是很高,而国家预算内资金这个变量的信息丢失较严重。因此,此次因子提取的总体效果并不理想。 (若重新指定两个因子,则因子载荷矩阵为 因子分析的变量共同度(二) Communalities 国家预算内资金 国内贷款 利用外资 自筹资金 其他投资 Initial 1.000 1.000 1.000 1.000 1.000 Extraction .975 .795 .860 .937 .882 Communalities 国家预算内资金 国内贷款 利用外资 自筹资金 其他投资 Initial 1.000 1.000 1.000 1.000 1.000 Extraction .975 .795 .860 .937 .882 Extraction Method: Principal Component Analysis. 当指定提取2个特征值时,此时的变量共同度都较高,各个变量的信息丢失都较少,因此,本次因子提取效果较理想。 (2) Component Matrix a 自筹资金 其他投资 利用外资 国内贷款 国家预算内资金 Component 1 .959 .906 .906 .877 .443 2 -.132 -.247 -.199 .160 .882 Extraction Method: Principal Component Analysis. a. 2 components extracted. Rotated Component Matrix a 自筹资金 其他投资 利用外资 国内贷款 国家预算内资金 Component 1 .949 .937 .921 .775 .128 2 .190 .064 .110 .440 .979 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations. 从因子载荷矩阵可见,等四个变量在第一个因子上的载荷都很高,意味着它们与第一个因子的相关程度高,第一个因子很重要;第二个因子与自筹资金、其他投资、利用外资、国内贷款等四个变量的相关性均较小,只与国家预算资金的相关性较大,第二个因子对于国家预算资金很重要。旋转后的因子载荷矩阵也有这个特点 第十章

1.(1)第1步:1号样本(广西瑶族)和三号样本(广西侗族)聚成一小类,它们的个体距离是3.722,这个小类将在

下面第2步用到;

第2步:8号样本(贵州苗族)和第1步聚成的小类又聚成一类它们的距离是9.97,这个小类将在下面的第4步

用到;

第3步: 5号样本(崩龙族)和7号样本(白族)聚成一小类,它们的个体距离是11.556,这个小类将在下面

第5步用到;

第4步: 6号样本(基诺族)和第2步聚成的小类又聚成一类,它们的个体距离是18.607,这个小类将在下面

第6步用到;

第5步: 4号样本(土家族)和第3步聚成的小类又聚成一类,它们的个体距离是20.337,这个小类将在下面

第6步用到;

第6步: 第4步聚成的小类和第5步聚成的小类又聚成一类,它们的个体间距离是22.262,这个小类将在下面

第7步用到;

第7步: 2号样本(湖南侗族)和第6步聚成的小类又聚成一类,它们的个体间距离是31.020。

(3) 从冰挂图可见,如果分成三类,第1类是:湖南侗族;第2类是:白族、崩龙族、土家族;第3类是:基诺族、

贵州苗族、广西侗族、广西瑶族。

碎石图353025201510500.002.(1)

系列1B0.501.00A1.502.002.50从碎石图可以看出,随着

类的不断凝聚,类数目的不断减少,类间的距离在逐渐增大,在聚成4类之前,类间距离增大的幅度较小,形成“极为陡峭的山峰”,但到4类后,类间的距离迅速增大,形成“平坦的碎石”。根据类间距离小形成类的相似性大,距离大形成类的相似性小的原理,在本例中,可以聚成4类或者5类。

(2)根据树形图可见,如果聚成4类,则第一类为北京;第二类为江苏;第三类为上海、广东、湖北、辽宁、浙江、

湖南、山东;其余为第四类。

如果聚成5类,则第一类为北京;第二类为江苏;第三类为上海、广东、湖北;第四类为辽宁、

浙江、湖南、山东;其余为第四类。

(3) (4) 第九章

5、从结果可知,利用向后筛选策略共经过两步完成回归方程的建立,最终模型为第二个模型。从方程建立的过程看,

剔除的变量是粮食播种面积。如果显著性水平?为0.05,可以看到被剔除变量的偏F检验的概率P-值大于显著性水平,因此不能拒绝检验的原假设,这个变量的偏回归系数与零无显著差异,它对被解释变量的线性解释没有显著贡献,不因该保留在方程中。最终保留在方程中的变量是农业劳动者人数、总播种面积、风灾面积比例、施用化肥量。选用这个模型后,由于回归方程和各回归系数的显著性检验的概率P-值小于显著性水平?=0.05,因此被解释变量与所有解释变量之间的线性关系显著,以及被解释变量与各个解释变量之间的线性关系显著。方程的DW检验值为1.284,残差存在一定程度的正相关,但是标准化残差的非参数检验结果表明标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。所以影响粮食总产量的主要因素是农业劳动者人数、总播种面积、风灾面积比例、施用化肥量。

7.利用spss曲线估计方法,做出各个模型估计结果,以判定系数为主要依据选择模型,最终选择了三次曲线模型。对

粮食产量进行外推预测,1987、1988、1989年的粮食总产量分别为30630.008、30864.092、31093.650.计算得到平均预测误差为:

5、从结果可知,利用向后筛选策略共经过两步完成回归方程的建立,最终模型为第二个模型。从方程建立的过程看,

剔除的变量是粮食播种面积。如果显著性水平?为0.05,可以看到被剔除变量的偏F检验的概率P-值大于显著性水平,因此不能拒绝检验的原假设,这个变量的偏回归系数与零无显著差异,它对被解释变量的线性解释没有显著贡献,不因该保留在方程中。最终保留在方程中的变量是农业劳动者人数、总播种面积、风灾面积比例、施用化肥量。选用这个模型后,由于回归方程和各回归系数的显著性检验的概率P-值小于显著性水平?=0.05,因此被解释变量与所有解释变量之间的线性关系显著,以及被解释变量与各个解释变量之间的线性关系显著。方程的DW检验值为1.284,残差存在一定程度的正相关,但是标准化残差的非参数检验结果表明标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。所以影响粮食总产量的主要因素是农业劳动者人数、总播种面积、风灾面积比例、施用化肥量。

7.利用spss曲线估计方法,做出各个模型估计结果,以判定系数为主要依据选择模型,最终选择了三次曲线模型。对

粮食产量进行外推预测,1987、1988、1989年的粮食总产量分别为30630.008、30864.092、31093.650.计算得到平均预测误差为:

本文来源:https://www.bwwdw.com/article/roo6.html

Top