用SPSS对数据进行分析

更新时间:2023-09-25 03:10:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1.某轮胎厂的质量分析报告中说明,该厂某轮胎的平均寿命在一定的载重负荷与正常行驶条件下会大于25000公里。平均轮胎寿命的公里数近似服从正态分布。现对该厂的这种轮胎抽取一容量为15个的样本如下,能否作出结论:该产品与申报的质量标准是否

相符?

21000,19000,33000,31500,18500,34000,29000,26000,25000,28000,30000,

28500,27500,28000,26000

单个样本统计量 V1 N 15 均值 27000.00 标准差 4636.809 均值的标准误 1197.219 单个样本检验 V1 t 1.671 df 14 检验值 = 25000

差分的 95% 置信区间 Sig.(双侧) .117 均值差值 2000.000 下限 -567.78 上限 4567.78

表一表示有15个变量,平均值为27000,样本数据分布的标准差为4636.809,样本均值分布的标准误差为1197.219.

表二表示即在假设总体轮胎的寿命为25000公里的情况下,计算T统计量为1.671,自由度为14,双侧检验为0.117,样本均值与假设的差为20000,样本均值与原假设的差的95%的置信区间为[-567.78,4567.78]。也就是说,在总体均值为25000公里的情况下, 抽出的样本均值为27000平方米的概率大于等于0.117,

2.某物质在处理前与处理后分别抽样分析其含脂率如下:

处理前:0.19,0.18,0.21,0.30,0.41,0.12,0.27

处理后:0.15,0.13,0.07,0.24,0.19,0.06,0.08,0.12

假定处理前后的含脂率都服从正态分布,且方差相同。问:处理前后的含脂率的是否有显著变化? 组统计量 含脂率 VAR00002 1.00 2.00 N 7 8 均值 .2257 .1300 标准差 .09778 .06234 均值的标准误 .03696 .02204

独立样本检验 假设方差相等 假设方差不相等 方差方程的 Levene 检验 均值方程的 t 检验 F 1.193 Sig. .295 t 2.293 2.224 df 13 9.948 Sig.(双侧) .039 .050 均值差值 .09571 .09571 标准误差值 .04174 .04303 差分的 95% 置信区间 下限 .00553 -.00023 上限 含脂率 .18590 .19166 表1是分1,2进行的描述统计。其内容的解释与单个样本描述统计的解释完全相 同

表2是两组平均数差异的T检验结果。下面对表中各项的内容解释如下: ①等方差假定。 也就是检验的原假设为两总体分布的方差相等。

②方差齐性检验。采用T检验的方法对两个总体的均值差进行检验的前提条件是两个总体分布的方差必须相等。 但如果是大样本, 则对方差齐性不作要求。从该题的检验结果看,F值为1.193,显著性水平为0.295〉0.05,可以接受两总体为等方差的假设。

③均值相等的T检验。从该题的检验结果看,t值为23.293,显著性水平为0.39,远远大于0.05,可以接受两个总体均值相等的假设。两个总体的均值差为0.9571,均值差的标准误差为0.4174,均值差的95%的置信区间为[0.00553,0.18590]。 检验的结论为:处理前后的含脂率的均值差异显著。

3.某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系。将同种属的大白鼠按性别相同、年龄体重相近者配成对,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组。一定时期后,将大白鼠杀死测得其肝中维生素A的含量。结果如下表,问:不同饲料的大白鼠中维生素A含量有无差别? 大白鼠对号 正常饲料组 1 2 3 4 5 6 7 8 3550 2000 3000 3950 3800 3750 3450 3050 维生素A缺乏组 2450 2400 1800 3200 3250 2700 2500 1750

成对样本统计量 对 1 正常饲料组 维生素A缺乏组 均值 3318.7500 2506.2500 N 8 8 标准差 632.42024 555.13029 均值的标准误 223.59432 196.26820 成对样本相关系数 对 1 正常饲料组 & 维生素A缺乏组 N 8 相关系数 .584 Sig. .129 成对样本检验 均值 标准差 成对差分 均值的标准误 差分的 95% 置信区间 t df Sig.(双侧) 812.50000 546.25347 193.12977 生素A缺乏组 下限 上限 4.207 7 .004 对 1 正常饲料组 - 维355.82067 1269.17933

表1是配对样本的描述统计。其内容的解释与单个样本描述统计的解释完全相同

表2是配对样本的相关分析结果。两个变量的相关系数为0.5844,显著性水平为0.129。总体的相关不是很显著的。

表3是配对样本的T检验结果。两个变量差的均值是812.5。标准差为5846.25347。均值标准误为193.12977。差分为95%的置信区间是[355.82067,1269.17933]。T是T统计量的计算结果。Df是自由度。Sig.2-tailed是双为检验的显著性水平。从表中输出的数据看,双侧检验为0.004小于0.05,所以有无维生素A前后,大白鼠的变化是相当显著的。也就是说不同饲料的大白鼠中维生素A含量差别是显著的

4.下表为某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者和非患者进行了

用力肺活量(L)测定。问三组石棉矿工的用力肺活量有无差别? 石棉肺患者 可疑患者 非患者 描述 用力肺活量 1.8 1.4 1.5 2.1 1.9 1.7 1.8 1.9 1.8 1.8 2.0 2.3 2.1 2.1 2.1 2.6 2.5 2.3 2.4 2.4 2.9 3.2 2.7 2.8 2.7 3.0 3.4 3.0 3.4 3.3 3.5 1.00 2.00 3.00 总数 N 11 9 11 31 均值 1.7909 2.3111 3.0818 2.4000 标准差 .20226 .18333 .29264 .60000 标准误 .06098 .06111 .08823 .10776 均值的 95% 置信区间 下限 1.6550 2.1702 2.8852 2.1799 上限 1.9268 2.4520 3.2784 2.6201 极小值 1.40 2.10 2.70 1.40 极大值 2.10 2.60 3.50 3.50 方差齐性检验 用力肺活量 Levene 统计量 2.852 df1 2 df2 28 显著性 .075 ANOVA 用力肺活量 平方和 df 均方 F 显著性 组间 组内 总数 9.266 1.534 10.800 2 28 30 4.633 .055 84.544 .000 表2是方差齐次性检验结果。从表2中可以看出,F值(levene Statistic)为2.852,显著性水平为0.75,两个自由度分别为2和28。由于显著性水平大于0.05, 所以可以接受分析变量在自变量的各个不同影响因素上的分布是等方差的.

表3是方差分析的结果。从表3中可以看出,平均组间平方和为9.266,平均组内平方和为1.534,F值为84.544,显著性水平为0.000。由于显著性水平远远小于0.05,可以认为不同人群的用力肺活量是有显著差异的。

描述统计 描述统计量 V2 有效的 N (列表状态) N 25 25 极小值 3.18 极大值 6.14 均值 4.4752 标准差 .69249 方差 .480

由于变量没有缺失值,所以变量有效数据为25个,有表看出健康男子的血清总胆固醇值最大值为6.14,最小值为3.18,平均血清总胆固醇值为4.4752,健康男子的血清总胆固醇值的标准差和方差分别为0.69249和0.480, 1. 描述性统计量 公路平均速度 公路死亡增长百分比 均值 58.3333 12.4833 标准差 5.66221 6.63350 N 12 12 相关性 公路平均速度 公路平均速度 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N 1 公路死亡增长百分比 .900 .000 371.697 33.791 12 1 ** 352.667 32.061 12 .900 .000 **公路死亡增长百分比 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N **. 在 .01 水平(双侧)上显著相关。 371.697 33.791 12 484.037 44.003 12 表1的内容就是两个变量的平均值、标准差和个案数.

表2是以交叉表的形式表现的相关分析的结果, Pearson Correlation是皮尔逊相关系数。在它右侧“公路平均速度”一列中对应的数据为1.000,这是“公路平均速度”与“公路平均速度”的相关系数。由于使用同一个变量计算相关,数据完全一一对应,所以计算的相关系数为1。在“公路死亡增长百分比”下面对应的数据为0.9,这是“公路平均速度”与“公路死亡增长百分比”的皮尔逊相关系数。

Sig. (2-tailed)是双尾检验的显著性水平。可以看出,相关系数 0.9 的显著性水平 为 0.000,表明总体中两个变量的相关是显著的。

从输出的情况来看,“住房面积”和“家月收入”呈正相关,其相关系数为 0.9,在总体中这个相关系数在 0.01 的水平上是显著的。 2. 输入/移去的变量 模型 1 输入的变量 体重 ab移去的变量 方法 . 输入 a. 已输入所有请求的变量。 b. 因变量: 肺活量 表1表明只有一个自变量“体重” 进入了模型。 模型汇总 模型 1 R .749 abR 方 .562 调整 R 方 标准 估计的误差 Durbin-Watson .518 .28775 2.150 a. 预测变量: (常量), 体重。 b. 因变量: 肺活量 表2“体重”与“肺活量”的相关系数R为0.749,模型的判定系数R Square即R2为0.562,调整以后R2为0.518 ,Durbin-Watson的值是2.150,接近于2,所以认为随机误差项基本上相互独立的,不存在序列相关的问题。 Anova 模型 1 回归 残差 总计 平方和 1.061 .828 1.889 df 1 10 11 均方 1.061 .083 F 12.817 Sig. .005 ab a. 预测变量: (常量), 体重。

Anova 模型 1 回归 残差 总计 平方和 1.061 .828 1.889 df 1 10 11 均方 1.061 .083 F 12.817 Sig. .005 ab a. 预测变量: (常量), 体重。 b. 因变量: 肺活量 表3的内容是对模型的方差分析与F检验的结果。从表中可以看出,平均的回归平方和为1.061,平均的剩余平方和为0.828。F值为12.817,显著性水平为0.005。由于显著性已经达到0.001的水平,说明配合回归直线是有意义的。 系数 非标准化系数 模型 1 (常量) 体重 a. 因变量: 肺活量 B .000 .059 标准 误差 .815 .016 标准系数 试用版 t .001 .749 3.580 Sig. 1.000 .005 a 表4的内容是回归方程的参数及检验结果。从表中可以看出,回归方程的常数项即截距为4×E-4,截距的标准误差为0.815。T检验值为0.001,显著性水平为1.00。回归方程的斜率即回归系数为0.59,回归系数的标准误差为0.16,标准化回归系数为0.749,T检验值为3.58,显著性水平为0.000。可以在0.001的水平上说明这个斜率对总体是有意义的。

残差统计量 a 预测值 残差 标准 预测值 标准 残差 极小值 2.4711 -.41233 -1.389 -1.433 极大值 3.4123 .46828 1.641 1.627 均值 2.9025 .00000 .000 .000 标准 偏差 .31060 .27436 1.000 .953 N 12 12 12 12 a. 因变量: 肺活量 从表5中可以看出,残差的平均值为0。标准化残差的平均值为0。说明残差的分布满足均值为零的假设。

从图1中可以看出,残差的分布基本呈正态。

图2是以标准化预测值为横轴,以标准化残差为纵轴绘制的散点图。可以用于检验

等方差性和奇异值的情况。 如果残差分布具有等方差性, 则图中的散点应该在由原点发出的横线上下的确定的范围内分布。 从图5-37中可以看出, 残差的分布基本满足等方差性的要求。

本文来源:https://www.bwwdw.com/article/ymkd.html

Top