计量地理学实验报告

更新时间:2024-03-16 07:47:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

湖北文理学院

《计量地理学》

实 验 报 告

专业班级: 地科1311 姓 名: 学 号: 2013113130 任课教师:

实验一 描述性统计分析

一. 实验目的

利用spss进行描述性统计分析。要求掌握频数分析(Frequencies过程)、描述性分析(Descriptives过程)、探索分析(Explore过程)。 二. 实验时间、地点

2015年5月11日周一19:00,五栋412 三. 实验内容及步骤 1.实验内容:

下表给出的是1951-1970年实测的由一次降雨导致的土壤侵蚀量。试分析田间小区的土壤侵蚀量分布特征,并绘制频数表、直方图,计算平均值、标准差、变异系数等描述统计量。 年份 日期 土壤侵蚀量(t/km^2) 1951 9.27 4380 1952 8.26 10130 1953 8.28 2750 1954 6.16 5970 1955 8.23 2510 1956 7.14 1600 1957 8.02 7530 1958 9.11 1770 1959 7.21 17 1960 7.05 1523.3 1961 8.04 0.1 1962 8.08 830 1963 8.28 620 1964 6.26 6540 1965 8.15 12670 1966 8.14 90 1967 6.27 12440 1968 7.17 10733 1969 8.19 180 1970 8.24 384 2.实验步骤 (1)打开相关数据文件,选择菜单“Analyze-Descriptives

Statistics-Frequencies”

(2)选择进行频数分析变量。选择“土壤侵蚀量”进入“Variables”列表框,

在该框中将列出所有要分析的变量。

(3)设置输出频数分布表。选中“频数分析”中的“Display frequency tables”,

要求输出变量的频数分布表。

(4)设置输出有关描述统计量。单击“频数分析”对话框下部的“Statistic”按

钮,根据题目要求选择需要输出的描述统计量。

(5)设置有关图形输出,单击“频数分析”对话框下部的“Chart”按钮,选择

有关类型的图形输出。

(6)设置有关输出格式。单击“频数分析”对话框下部的“Format”按钮,选

择升降序问题。

(7)设置完成后,单击“Continue”按钮,单击“OK”按钮,等待输出结果。 3、输出结果 ”

图1 土壤侵蚀量

N Valid 20

Missing 0

Mean 4133.370 Std. Error of Mean 985.2024 Median 2140.000 Mode .1(a) Std. Deviation 4405.959

0

Variance 1941247

5.0401

Skewness .891 Std. Error of Skewness .512 Kurtosis -.639 Std. Error of Kurtosis .992 Range 12669.9 Minimum .1 Maximum 12670.0 Sum 82667.4 Percentiles 10 24.300

20 220.800 25 443.000 30 683.000 40 1553.980 50 2140.000 60 3728.000 70 6369.000 75 7282.500 80 9610.000 90 12269.30

0

a Multiple modes exist. The smallest value is shown

图2 土壤侵蚀量

Valid

Frequency

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 20 7 27

Percent Valid Percent

3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 3.7 5.0 74.1 100.0 25.9 100.0

Cumulative

Percent

5.0 10.0 15.0 20.0 25.0 30.0 35.0 40.0 45.0 50.0 55.0 60.0 65.0 70.0 75.0 80.0 85.0 90.0 95.0 100.0

.1 17.0 90.0 180.0 384.0 620.0 830.0 1523.3 1600.0 1770.0 2510.0 2750.0 4380.0 5970.0 6540.0 7530.0 10130.0 10733.0 12440.0 12670.0 Total

Missing System Total 图3

土壤侵蚀8642FrequencyStd. Dev = 4405.96 Mean = 4133.400.02000.04000.06000.08000.010000.012000.0N = 20.00土壤侵蚀 4、结果分析

(1)从图1可以看出,有效样品数为20个,没有缺失值。1951-1970年黄土

高原某地区的次降水平均土壤侵蚀量为4133.370(t/km^2),标准差为4405.9590(t/km^2),25%、50%、75%百分位数的值分别是443.000、2140.000、7282.500。

(2)图2给出了土壤侵蚀量的频数分布。在该表中从左到右各列分别为有效变

量数值、频数、频数所占总数的百分比、有效数占总数的百分比和累计百分比。

(3)图3是此次降雨土壤侵蚀量的直方图,从图中可以看出次降雨土壤侵蚀量

主要集中在1000(t/km^2)以下,出现次数在6次以上。

实验二 均值比较和T检验

一、实验目的

(1)掌握均值比较,用于计算指定变量的综合描述统计量; (2)掌握独立样本T检验(Independent Samples Test),用于检验两组来自独立总体的样本,企图理综题的均值或中心位置是否一样 二、实验时间和地点

2015年5月18日周一19:00,5栋412 三、实验内容及步骤 1、实验内容

列出某单位的男女职员年薪,从中可以比较该单位不同性别之间的薪水的差异。

2.实验步骤

(1)输入数据 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 性别 男 男 女 女 男 男 男 女 女 女 女 男 男 女 男 男 男 年薪/元 57000 40200 21450 21900 45000 32100 36000 21900 27900 24000 30300 28350 27750 35100 27300 40800 46000

四、实验结果分析

(1)图1给出了一些基本描述性统计量,输出统计量包括各组样品数,均值,标准误、均值95%置信区间、最小值和最大值,如各组参与分析的样品数量均为4,总样品数为16。

(2)图2是方差其次性检验结果。从表可知,输出的相伴概率sig为0.329,远大于显著水平0.05,因此可认为各组总体方差相等。

(3)图3输出的是方差分析表。从表中可知,总离差平方和为460.438,组间离差平方和为308.188,组内离差平方和为152.250,组间离差平方和中能被线性解释部分为103.513,方差检验F=8,097,对应的相伴率为0.03,小于显著性水平0.05,因此认为4组之间至少有一个组与另一个组差异显著,但不能说明是哪两组之间差异显著。

(4)图4输出的是多重比较表。从表中可知,排污口A和排污口C之间,排污口B和排污口D之间的相伴概率都大于显著水平0.05,说明这两组之间的差异不明显,其他各种组合的两组之间的相伴概率都小于0.05,说明两组之间的差异显著。 (5)图5为输出的各组均值折线图,可以看出排污口A和排污口C的均值相对较小。

实验四 相关分析

一、实验目的:

调用此过程可对变量进行相关关系的分析,计算有关的统计指标,以判断变量之间相互关系的密切程度。调用该过程命令时允许同时输入两变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。

实验内容:从某校学生中随机抽出15个学生,调查他们英语、数学、物理和化学等4门功课的考试成绩,数据文件如下图所示。试用二元变量相关分析过程分析各科成绩之间是否存在线性相关关系。 二、实验时间和地点:

2015年5月28日星期四,5栋412 三、实验步骤:

1.打开Bivariate Corrrlations对话框,选择变量“English、math、physics、chemical”移入Variables框中。 输入数据

number english math physics chemical

1 76 75 78 82 2 66 65 60 54 3 65 78 80 75 4 68 86 85 85 5 78 80 90 83 6 65 75 78 78 7 82 85 89 95 8 65 78 73 80 9 68 82 84 85

2.打开options对话框进行相关设置。 3.单机主对话框中的OK提交系统运行。 4.输出结果及分析如下

输出结果

描述统计量表 Descriptive Statistics Std. Mean Deviation N ENGLIS70.33 6.538 9 H MATH 78.22 6.320 9 PHYSICS 79.67 9.206 9 CHEMIC79.67 11.136 9 AL 各课程成绩的相关矩阵表

ENGLISH MATH PHYSICS CHEMICAL Correlations

ENGLIS

PHYSIC

CHEMIC H MATH S

AL

Pearson

Correlation 1 .376

.590 .577 Sig.

(2-tailed) . .318

.095

.104

Sum of

Squares and

Cross-produ342.000 124.333

284.000 336.000 cts

Covariance 42.750 15.542 35.500 42.000

N 9 9

9 9 Pearson

.884(**

Correlation .376 1

) .905(**) Sig.

(2-tailed) .318 .

.002

.001

Sum of

Squares and

Cross-produ124.333 319.556

411.667 509.667 cts

Covariance 15.542 39.944 51.458

63.708

N 9 9

9

9

Pearson .884(**

Correlation .590

) 1 .889(**) Sig.

(2-tailed) .095 .002

.

.001

Sum of

Squares and

Cross-produ284.000 411.667

678.000 729.000 cts

Covariance 35.500 51.458 84.750

91.125

N 9 9

9 9

Pearson .889(**

Correlation .577

.905(**

) ) 1 Sig.

(2-tailed) .104 .001

.001

.

Sum of

Squares and

Cross-produ336.000 509.667

729.000 992.000 cts

Covariance 42.000 63.708

91.125 124.000

N 9 9 9 9 ** Correlation is significant at the 0.01 level (2-tailed).

四、结果分析:

英语成绩与数学、物理、化学成绩之间的相关系数依次为0.376、0.590、0.577,英语成绩与这几门理科课程的成绩虽有一定的正相关关系,但是相关系数普遍较低,说明文理科之间的差异。数学与物理、化学成绩的相关系数分别为0.884、0.905,物理与化学的相关系数为0.889,都反映了理科各科课程之间具有高度的正相关关系。

实验五 回归分析

一、 实验目的

掌握线性回归分析的基本思想和具体操作,能够读懂分析结果,并能够写出回归方程,对回归方程进行各种统计检验。 二、 实验时间及地点

2014年6月1日周一19:00,5栋412 三、 实验内容及步骤 1、 实验内容:

表为全国以及各地的供水情况,给出了供水管道长度(公里)和全年供水总量(万立方米)。试采用一元回归分析方法,根据供水管道长度变化,来分析全年供水总量的变化情况。 2.实验步骤: (1)输入相关数据

地区 全国 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北

供水管道长度(公里)

333288.8 15896 6822 10771.2 5669.3 5635.5 21999 6384.9 9065.9 22098.8 36632.4 24126.9 7389.4 6270.4 5094.7 26073.9 11405.6 15668.6

全年供水总量(万立方米)

4752548 128823 64537 160132 77525 59276 280510 159570 153387 308309 380395 235535 204128 118512 143240 259782 185092 257787

湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 9341.8 35728.8 6923.1 1726.7 6082.7 12251.3 3275.3 5208.5 364.9 4270 5010 893 1538.2 3670.2 262691 568949 134412 20241 71077 165632 45198 52742 5363 73580 62127 14390 22921 76685

(2)选择“Analyze—Regression--Linear”,弹出“线性回归”对话框。

(3)设置参与回归分析的变量。将“供水总量”设为因变量,“供水管长”设为自变量。

(4)回归分析结果的描述统计量输出设置。

(5)回归分析结果的有关图形输出设置

(6)回归分析结果有关表格文件输出设置。 (7)表格设置完成后单击“确认”。 (8)结果输出 图1

输入/移去的变量 模型 1 输入的变量 供水管长 ba

图2 移去的变量 方法 . 输入 a. 因变量: 供水总量 b. 已输入所有请求的变量。 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 1 .998 ab.995 .995 58314.742 a. 预测变量: (常量), 供水管长。 b. 因变量: 全年供水总量 图3 Anova 模型 回归 1 残差 总计 a. 因变量:全年供水总量 平方和 208E+13 1.02E+11 2.01E+13 df 1 30 31 均方 2.805E+13 3400609170.353 F 6130.970 Sig. .000 ba b. 预测变量: (常量), 供水管长。 图4

系数 模型 非标准化系数 B 1 供水管长 14.188 .181 .998 78.301 .000 13.818 14.558 a. 因变量: 全年供水总量 (常量) 1486.758 标准 误差 10977.983 标准系数 试用版 .135 .893 t Sig. B 的 95.0% 置信区间 下限 -20933.273 上限 23906.790 a图5 残差统计量 预测值 残差 标准 预测值 标准 残差 极小值 6664.02 -140838.516 -.354 -2.415 极大值 4730245.00 128661.188 5.406 2.206 均值 297034.25 .000 .000 .000 标准 偏差 820091.102 57366.472 1.000 .984 N 32 32 32 32 aa. 因变量: 全年供水总量 图6

图7

图8

四、实验结果分析

(1)图1为回归分析过程变量进入/退出模型的情况。

(2)图2反映的是一元线性回归模型拟合情况,相关系数R为0.998,决定系数R^2为0.995,而调整决定系数为0.995,可见,模型拟合效果很理想。

(3)图3为一元回归的方差分析表。从表中看出离差平方和为2.01E+13,残差平方和为1.02E+11,而回归平方和为2.08E+13。回归方程的显著性检验中,统计量为F=6130.968,对应的置信水平为0.000,远比常用的置信水平0.05要小,因此可以认为方程是极显著的。

(4)图4是回归方程系数以及对回归方程系数的检验结果,系数显著性检验采用t检验。未标准化回归方程的常数项为1486.892,自变量系数为14.188。对回归方程的检验结果,常数项检验对应的置信水平位0.893,远比常用的0.05要大,常数项不显著,可以考虑去除常数项的回归方程;自变量系数检验对应的置信水平为0.000,远比常用的置信水平0.05要小,因此可以认为该系数是显著的,不等于0.

(5)图5是有关残差的统计结果表。

(6)图6为标准化残差的直方图,用来表示残差的分布情况。

(7)图7为正态分布图,该图是用来观察标准化残差的分布是否符合正态发布,如果是,则图中散点应该近似为一条直线,且与对角线近似重叠。

(8)因变量、预测值间的散点图,用来反映因变量和预测值的关系,图中可见,因变量和预测值间的散点图散落集中。

实验六 聚类分析

一、 实验目的

聚类分析,它是研究多要素事物分类问题的数量方法,它是根据本身的属性,用数学方法按照某种相似性或者差异性指标,定量确定样本之间的亲疏关系,并按照这种亲疏关系程度对样本进行聚类。通过spss,了解聚类分析的步骤与应用

二、 实验时间及地点

2015年6月4日周四5栋412 三、 实验内容和步骤 1.实验内容:

下表给出了2003年我国各省市的土地利用情况(单位),依据给出的数据对全国各省市的土地利用结构进行分类。

地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江

园地 11.92 3.68 57.54 28.56 7.33 60.7 11.59 6.04 1.08 29.57 56.82

牧草地 0.2 0.06 81.5 65.44 6622.21 36.99 104.74 228.08 0 0.51 0.15

居民点及工矿用地 交通用地 水利设施

25.74 2.48 2.62 23.53 1.46 6.42 146.98 10.03 12.13 73.88 5.66 3.21 116.9 13.71 8.96 110.43 8.03 14.2 82.6 6.14 15.47 114.13 11.33 20.76 20.74 1.75 0.19 144.48 10.17 19.8 66.7 6.34 14.38

安徽 副建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 34.31 61.34 26.99 102.38 32.08 42.57 50.25 84.95 47.01 53.02 21 69.52 11.32 78.12 0.17 65.1 19.38 0.77 3.38 29.58 3.77 0.27 0.38 4.14 1.45 5.46 10.51 2.82 73.83 1.94 23.84 1373.43 162.18 78.48 6444.58 315.99 1264.78 4038.57 233.39 5131.49 128.37 44.17 62.37 193.6 183.25 96.92 104.11 133.34 65.56 21.74 45.66 131.18 43.8 58.52 3.8 69.07 87.12 23.95 16.66 96.12 8.62 6.32 6.17 14.93 11.04 7.79 8.81 10.82 7.31 3.93 12.35 5.22 8.85 2.09 5.84 6.07 2.69 2.69 1.52 5.76 22.88 5.93 20.35 25.03 18.16 29.73 19.31 21.1 14.79 6.02 4.4 9.81 3.5 7.54 0.09 3.92 2.82 4.39 0.51 18.08

2.实验步骤

(1)选择“分析—分类—系统聚类”,弹出“系统聚类”的对话框。

(2)将“园林、牧草地、居民点及工矿用地、交通用地、水利设施用地”选入“变量”,将“地区”选入“标注个案”中。

(3)系统聚类分析的有关参数设置。 (4)系统聚类的统计量输出。 (5)系统聚类的统计图输出。

3.实验结果

图1聚类

案例处理汇总 案例 有效 N 31 百分比 100.0 N 0 缺失 百分比 .0 N 31 总计 百分比 100.0 aa. 平均联结(组之间) 图2 聚类表 阶 群集组合 群集 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 2 1 17 10 13 4 11 6 1 11 4 6 6 1 4 15 24 3 3 1 8 1 23 8 5 1 29 1 5 群集 2 9 2 18 12 21 20 14 17 22 13 25 10 19 11 7 16 30 6 15 4 24 3 28 27 26 8 31 23 29 53.445 118.633 245.798 304.516 580.836 616.836 944.301 1311.826 1444.270 1743.621 2006.243 2070.099 2694.080 2921.318 3445.402 5118.778 5933.156 6801.189 7489.825 8968.789 9831.513 13384.627 16315.387 18055.149 44535.906 55309.013 1200709.492 1607362.732 4107643.979 系数 首次出现阶群集 群集 1 0 0 0 0 0 0 0 0 2 7 6 8 12 9 11 0 0 0 18 14 0 20 0 21 0 22 0 26 25 群集 2 0 1 0 0 0 0 0 3 0 5 0 4 0 10 0 0 0 13 16 15 17 19 0 0 0 24 0 23 27 2 9 8 12 10 11 10 12 14 14 15 13 18 20 20 19 21 19 22 22 24 26 28 26 29 28 29 30 30 下一阶 30 1 5 30475588.662 28 29 0 图3

群集成员

案例 1:北京 2:天津 3:河北 4:山西 5:内蒙古 6:辽宁 7:吉林 8:黑龙江 9:上海 10:江苏 11:浙江 12:安徽 13:副建 14:江西 15:山东 16:河南 17:湖北 18:湖南 19:广东 20:广西 21:海南 22:重庆 23:四川 24:贵州 25:云南 26:西藏 27:陕西 28:甘肃 29:青海 30:宁夏 31:新疆

5 群集

1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3 1 1 2 1 3 4 1 5 图4

平均联结(组之间)

图5 聚类表 阶 群集组合 群集 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 2 1 17 10 13 4 11 6 1 11 4 6 6 1 4 15 24 3 3 1 8 群集 2 9 2 18 12 21 20 14 17 22 13 25 10 19 11 7 16 30 6 15 4 24 53.445 118.633 245.798 304.516 580.836 616.836 944.301 1311.826 1444.270 1743.621 2006.243 2070.099 2694.080 2921.318 3445.402 5118.778 5933.156 6801.189 7489.825 8968.789 9831.513 系数 首次出现阶群集 群集 1 0 0 0 0 0 0 0 0 2 7 6 8 12 9 11 0 0 0 18 14 0 群集 2 0 1 0 0 0 0 0 3 0 5 0 4 0 10 0 0 0 13 16 15 17

下一阶 2 9 8 12 10 11 10 12 14 14 15 13 18 20 20 19 21 19 22 22 24 22 23 24 25 26 27 28 29 30

1 23 8 5 1 29 1 5 1 3 28 27 26 8 31 23 29 5 13384.627 16315.387 18055.149 44535.906 55309.013 1200709.492 1607362.732 4107643.979 30475588.662 20 0 21 0 22 0 26 25 28 19 0 0 0 24 0 23 27 29 26 28 26 29 28 29 30 30 0

四、

实验结果分析

(1) 图1给出了参加系统聚类分析的6个变量的记录数统计结果。共31个有效数据

参加了分析,无缺失值,总记录数为31个。

(2) 图2为聚类过程的凝聚过程表,首先样品2和样品9合成一类:距离系数为59.488;合并两项是第一次出现,所以聚类群为0,;合并结果取小序号,即归为第二类,该步合并结果在第二步出现。其余的以此类推。

(3) 图3给出了分类结果的类成员。根据前面的设置要求,本例输出划分了4-7类时,每一个样品属于某一类别的结果。如黑龙江划分成4类或5类时,属于同一类,划分成6或7类,属于第3类。

(4) 图4是分类结果的垂直冰柱图。在途中,第一列阶表示分多少类,因系统聚类聚合法,所以从聚类过程看该表应该从下往上看。

(5) 图5为聚类分析树状图,直观地显示了样品逐步合并的过程。

实验七 因子分析

一、 实验目的

理解主成分(因子)分析的基本原理,熟悉掌握SPSS中主成分(因子)分析方法及其主要应用。 二、 实验时间及地点

2015年6月8日周一19:00,5栋412 三、 实验内容及步骤 1. 实验内容:

利用下表的数据对我国8个省的经济发展状况做因子分析。

地区生产

地区 总产值 北京 3663.1 天津 2447.66 河北 7098.56 山西 2654.59 辽宁 6002.54 黑龙江 4430 上海 6250.81 新疆 1877.61

居民消

费水平 10584 7836 3452 2934 5159 4645 15866 3237

基本建设职工平居民消费投资 均工资 价格指数 558.7801 25312 100.2 501.3698 18648 101 845.8997 11189 102.2 498.2473 10729 101.8 683.1553 13008 101.07 593.0769 11038 100.9 899.2687 27304 100.1 621.5878 13255 100.4113

商品零售价格 98.2251 97.3546 100.2415 100.3497 98.8954 99.7056 99.0407 99.2355

货物周转量 462.5 6521.1 3223.2 1259.1 2385.2 991.4 8492.3 636.6

工业总产值 1032.03 1136.24 3212.96 1192.74 2556.82 2248.59 2865.85 571

2.实验步骤:

(1) 选择菜单“分析—降维—因子分析”,进入“因子分析”对话框。

(2) 选择参与因子分析的变量,即将地区以外的其他七项选入右边的变量框。 (3) 设置因子分析的有关控制参数设置,点击“抽取”进入抽取菜单栏。 (4) 继续在“因子分析”对话框中单击“旋转”,系统弹出“因子旋转”对话框。

(5) 单击“描述”,设置输出描述统计量和初始分析结果。 (6) 单击“得分”,设置有关因子得分的选项。 (7) 单击“选项”,设置相关有关输出的选择项。 3.实验结果

图1 描述统计量 均值 4303.108750 6714.125000 650.173200 16310.375000 100.960163 99.131013 2996.425000 1852.028750 标准差 1962.6954983 4531.0397242 150.7595020 6684.4456750 .7443858 1.0070777 2978.0379954 985.2053248 分析 N 8 8 8 8 8 8 8 8 地区生产总值 居民消费水平 基本建设投资 职工平均工资 居民消费价格指数 商品零售价格 货物周转量 工业总产值 图2

相关矩阵 地区生居民消基本建职工平产总值 费水平 设投资 均工资 地区生产总值 居民消费水平 基本建设投资 相职工平均工资 1.000 .256 .838 .389 .080 .955 .240 居民消费价格指数 .228 商品零货物周售价格 .305 转量 .335 .673 .492 .532 工业总产值 .966 .189 .806 -.037 .314 .368 .408 1.000 a,b.256 1.000 .838 .080 -.683 -.493 -.016 .295 .389 1.000 .955 .240 1.000 -.735 -.602 1.000 关 居民消费价格指数 商品零售价格 货物周转量 工业总产值 a. 行列式 = .000 b. 此矩阵不是正定矩阵。 .228 -.683 -.016 -.735 .305 -.493 .335 .966 .673 .189 .295 -.602 .492 .532 .568 -.160 .568 1.000 -.361 -.160 -.361 1.000 .314 .368 .408 .806 -.037 图3 公因子方差 地区生产总值 居民消费水平 基本建设投资 职工平均工资 居民消费价格指数 商品零售价格 货物周转量 工业总产值 提取方法:主成份分析。 初始 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 提取 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 图4

图5

四、实验结果分析

(1)图1是描述统计表,显示了各个变量的均值,标准误差和参与计算的样品数 (2)图2为相关系数矩阵的逆矩阵。

(3)图3显示了公共因子方差。初始为初始因子方差,表示因子提取前各个变量的

全部公共因子的载荷系数平方和,公共因子数等于变量数,所以初始公共因子方差均为1。提取对应的是提取公共因子方差,对应的是根据某种原则提取的公共因子,公共因子数小于等于变量数。

(4)图4是因子分析结果的碎石图。碎石图的Y轴为特征值,X轴为特征值序号,特征值岸大小进行了排序。典型的碎石图会有一个明显的拐点,该点之前是与大因子连接的陡峭的折线,之后是与小因子连接的缓坡折线。分析本例碎石图,明显拐点为3,可以保留前3个因子将能概况大部分信息。

(5)图5是旋转后的三维因子载荷散点图。分别以第1、第2、第3主因子为X轴、Y轴和Z轴,根据旋转后的因子载荷矩阵作图。从图中可以看出各成分的变量的分布集中程度。

实验八 判别分析

一、

实验目的

利用SPSS软件实现判别分析及其应用。判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。 二、 三、

实验时间及地点 实验内容及步骤

2015年6月15日周一19:00,5栋412 1. 实验内容:

下表给出华北地区及长江中下游地区一些观测站记录到的六月降水天数和八月降水天数以及八月和六月降水量之比的数据资料,同时给出两地区中间地带的一些观测数据,试用判别分析功能判别这些中间地带的降水变化的类型。

id 1 2 3 4 5 6 7 8 9 10

site 北京 天津 保定 石家庄 太原 大同 张家口 榆林 兴县 五台山

rainday6 9.7 8.9 9 8.5 10.6 11.6 11.4 7.8 10.1 16.4

rainday8 14.3 12.1 12.5 13 13.3 12.7 12.7 12.5 13.3 18.1

ratio 3.46 2.45 3.26 3.39 2.13 2.05 2.05 1.82 3.01 1.8

region 1 1 1 1 1 1 1 1 1 1

11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 上海 南京 合肥 汉口 九江 安庆 芜湖 溧阳 黄石 东山 青岛 兖州 临沂 徐州 阜阳 13.1 10.9 10.3 11.7 13.6 12.3 10.5 11.3 14 12.5 13.7 10.5 10 8.3 8.6 10 11.5 10.1 8.05 9.4 9.5 10.9 12.2 10.4 11.7 11.6 13.7 12 11.1 10.9 0.74 0.87 1.18 0.61 0.61 0.44 0.76 0.75 0.64 1.01 1.68 1.75 1.65 1.48 1.07

2 2 2 2 2 2 2 2 2 2

“1”代表华东地区,“2”代表长江中下游地区

2.实验步骤

(1)点击“分析—分类—判别”,进入“判别分析”主菜单栏; (2)选择相应的自变量,分组变量;

(3)分别点击“统计量”“方法”“分类”“保存”等按钮,设置相关的需要输出的要求;

(4)设置完成后点击“确定”,等待结果。 3.实验结果 图1 分析案例处理摘要 未加权案例 有效 缺失或越界组代码 至少一个缺失判别变量 排除的 缺失或越界组代码还有至少一个缺失判别变量 合计 合计 N 20 5 0 0 5 25 百分比 80.0 20.0 .0 .0 20.0 100.0 图2 组统计量 region 均值 标准差 有效的 N(列表状态) 未加权的 rainday6 1.00 rainday8 ratio 10.4000 13.4500 2.5420 2.44131 1.74308 .66921 10 10 10 已加权的 10.000 10.000 10.000 rainday6

2.00

rainday8 ratio rainday6

合计

rainday8 ratio

12.0200 10.3750 .7610 11.2100 11.9125 1.6515 1.29254 1.24571 .21429 2.07489 2.15931 1.03374 10 10 10 20 20 20 10.000 10.000 10.000 20.000 20.000 20.000 图3 汇聚的组内矩阵 rainday6 协方差 rainday8 ratio rainday6 相关性 rainday8 ratio rainday6 3.815 1.594 -.459 1.000 .539 -.473 rainday8 1.594 2.295 -.061 .539 1.000 -.081 ratio -.459 -.061 .247 -.473 -.081 1.000 aa. 协方差矩阵的自由度为 18。 图4 检验结果

箱的 M

近似。

F

df2 Sig.

58320.000 .009 df1

13.180 3.865 3 对相等总体协方差矩阵的零假设进行检验。

图5

分类函数系数

region 1.00

rainday8 ratio (常量)

6.173 11.815 -57.224 2.00 4.632 4.222 -26.330 Fisher 的线性判别式函数

图6 分类结果 初始 计数 1.00 2.00 region 预测组成员 1.00 10 0 2.00 0 10 10 10 合计 a未分组的案例 1.00 % 2.00 未分组的案例 2 100.0 .0 40.0 3 .0 100.0 60.0 5 100.0 100.0 100.0 a. 已对初始分组案例中的 100.0% 个进行了正确分类。 四、 实验结果分析

(1) 图1为判别计算结果图,参加判别分析的总数为25,而有效测量数为20,占80%:包含缺失值或分类变量范围之外的观测数为5,占20%。

(2) 图2给出各自变量按照区划类别以及全部观测量计算的均值、标准值等。 (3) 图3的上半部分为自变量间合并的协方差矩阵,下半部为自变量间相关系数矩阵。协方差矩阵的自由度为18,。从相关系数值可知,各自变量的线性相关关系不协调。

(4) 图4列出检验协方差矩阵相等的统计值为23.509>0.05,从而在显著性水平0.05下认为各类协方差矩阵相等;F检验的显著性概率Sig=0.04<0.05,从而认为判别分析是显著的,说明错判率将很小 (5) 图5中给出了分类函数系数

区划1 q1=2.760*rainday6+4.535*rainday8+15.526*ratio-65.094 区划2 q2=3.158*rainday6+2.702*rainday8+9.152*ratio-37.233

(6) 图6给出最后的分类结果,对于原始数据中分别属于区划类1,区划类2的各10个观测量仍然归于原类,全部判对;待判的5个测量值有2个归入区划1,3个归入区划类2.

未分组的案例 1.00 % 2.00 未分组的案例 2 100.0 .0 40.0 3 .0 100.0 60.0 5 100.0 100.0 100.0 a. 已对初始分组案例中的 100.0% 个进行了正确分类。 四、 实验结果分析

(1) 图1为判别计算结果图,参加判别分析的总数为25,而有效测量数为20,占80%:包含缺失值或分类变量范围之外的观测数为5,占20%。

(2) 图2给出各自变量按照区划类别以及全部观测量计算的均值、标准值等。 (3) 图3的上半部分为自变量间合并的协方差矩阵,下半部为自变量间相关系数矩阵。协方差矩阵的自由度为18,。从相关系数值可知,各自变量的线性相关关系不协调。

(4) 图4列出检验协方差矩阵相等的统计值为23.509>0.05,从而在显著性水平0.05下认为各类协方差矩阵相等;F检验的显著性概率Sig=0.04<0.05,从而认为判别分析是显著的,说明错判率将很小 (5) 图5中给出了分类函数系数

区划1 q1=2.760*rainday6+4.535*rainday8+15.526*ratio-65.094 区划2 q2=3.158*rainday6+2.702*rainday8+9.152*ratio-37.233

(6) 图6给出最后的分类结果,对于原始数据中分别属于区划类1,区划类2的各10个观测量仍然归于原类,全部判对;待判的5个测量值有2个归入区划1,3个归入区划类2.

本文来源:https://www.bwwdw.com/article/1mj8.html

Top