SPSS软件上机操作试题

更新时间:2024-03-30 00:58:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

SPSS软件上机操作试题

1、 某种水泥在凝固时放出的热量YI(卡/克)与水泥中的4种化学成分所占的比例有关:XI1

(3CaO·Al2O3)、XI2(3CaO·SiO2)、XI3(4CaO·Al2O3·Fe2O3)、XI4(2CaO·SiO2),现测得数据13组,参见文件“水泥成分.sav”。 (1) 试用全回归法进行多元线性回归。写出多元回归方程式,模型的回归系数,残差向

量。对于自变量的一组新的观测值X TNew=(8,50,17,36),给出YI的预报值。

解: 多元回归方程式为:

YI=62.405+1.551XI1+0.510XI2+0.102XI3-0.144XI4 模型的回归系数为0.991。

残差向量e=(0.00476,1.51120,-1.67094,-1.72710,.25076,3.92544,-1.44867, -3.17499,1.37835,.28155,1.99098,.97299,-2.29433)T。

对于自变量的一组新的观测值X TNew=(8,50,17,36),YI的预报值为: 62.405+1.551·8+0.510·50+0.102·17-0.144·36

(2) 试用逐步回归法进行多元线性回归,采用的准则是:F≥4.000时,对应变量进入方

程式,F≤3.800时,变量被剔除。写出多元回归方程式,模型的回归系数,残差向量。对于自变量的一组新的观测值X TNew=(8,50,17,36),给出YI的预报值。

解: 多元回归方程式为:

YI=52.577+1.468XI1+0.662XI2 模型的回归系数为0.989。

残差向量e=(-1.57400,1.04908,-1.51474,-1.65848,-1.39251,4.04751,-1.30205, -2.07542,1.82451,1.36246,3.26433,.86276,-2.89344)T。

对于自变量的一组新的观测值X TNew=(8,50,17,36),YI的预报值为: 52.577+1.468·8+0.662·50

2、 我国山区某大型化工厂,在附近选取有代表性的区域进行取样,测定其中含有的6种气体

的浓度,参见文件“污染.sav”。对该数据进行主成分分析,要求用4个主成分反映出原始数据的变化,写出4个主成分的表达式和贡献率。 解:4个主成分的表达式为:

F1=-0.975氯 +0.592硫化氢+0.424 SO2 -0.584碳4+ 0.674环氧-0.092环己 F2=0.01631氯+0.654 硫化氢-0.287 SO2+ 0.631碳4+ 0.299环氧+0.891环己 F3=-0.046氯-0.120硫化氢+0.848 SO2+0.199碳4-0.280环氧+0.315环己 F4=-0.00224氯-0.402硫化氢+0.104 SO2+ 0.385碳4+ 0.598环氧-0.144环己 特征值分别为:2.285,1.793,0.954,0.700,0.201,0.06763,和为6。 4个主成分的贡献率分别为:38.084%,29.881%,15.893%,11.659%。

3、 在烟草杂交繁殖的花上搜集了数据,参见文件“花.sav”, 试进行变量两两之间的相关分

析,要求写出变量两两之间的相关系数,在0.01的水平上判断变量之间是否具有相关性。 解: 变量两两之间的相关系数如下:

花瓣长 花枝长 花萼长 花瓣长 1 0.955 0.797 花枝长 0.955 1 0.678

花萼长 0.797 0.678 1

从相关分析成果表中可以看出,双侧检验的显著性概率均小于0.01,因此否定原假设,认为相关系数不为0,变量间具有相关性。

4、 研究某年全国各地区农民家庭收支的分布规律,根据抽样调查资料进行分类处理,抽取28

个省、市、自治区的样品,每个样本有6个指标。先采用系统聚类分析将28个样本分为3类,其中有3个样本(北京、上海、广州)属于孤立样本,未归属于已分的3类中,如下表所示。原始数据(25个样本)参见文件“家庭收支.sav”。 类别 待定 待定 待定 地区 食品 衣着 43.77 38.64 20.52 燃料 9.73 12.53 18.32 住房 60.54 115.65 42.40 生活用品及其他 49.01 50.82 36.97 文化生活服务支出 9.04 5.89 11.68 北京 1 90.33 上海 2 21.11 广州 1 82.55 要求采用费歇尔判别法进行判别分析,写出分类判别函数,并对3个样本进行判别。 解:从费歇尔线性判别函数系数表中得到3个类别的分类判别函数为:

?1=0.478×食品+1.625×衣着+2.492×燃料+0.581×住房+0.954×生活+5.224×文化-117.363

?2=0.471×食品+1.378×衣着+2.233×燃料+0.351×住房+0.534×生活+5.357×文化-89.033

?3=0.427×食品+0.964×衣着+0.832×燃料+0.0732×住房+4.179×生活+4.179×文化-53.373

将3个待判样本的变量数据代入3个函数中,每个样本对应得个函数的值进行比较,其中值最大的那个是第几个函数,则该样本判为第几类。计算后会发现北京、上海和广州3个城市对应的3个函数值都是第一个函数值最大,所以它们都划分为第1类。

5、 为了研究世界各国森林、草原资源的分布规律,共抽取了21个国家的数据,每个国家4

项指标,原始数据见文件名为“资源.sav”。试用该数据对国别进行聚类分析,写出将所有个案分为2类的结果。 解:“前苏联”作为一类,其他国别作为一类。

6、 经两种处理方法处理以后的小麦,分别种在8对地块上,收成如下: 处理A 209 200 177 269 259 269 287 298 处理B 151 168 147 164 166 163 176 188 该数据文件的文件名为“小麦.sav”。 写出观测值的差及其符号秩,并在0.05的水平上用Wilcoxon符号秩检验法检验两种方法是否有差异。

解:从Wilcoxon符号秩检验成果表中得到显著性概率(Sig.)为0.012,小于5%,因此拒绝原假设,即认为以上两种处理方法是有差异的,将导致不同的小麦产量。

本文来源:https://www.bwwdw.com/article/q9qr.html

Top