计量地理学实验报告

更新时间:2023-10-30 06:16:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

计量地理学实验报告

《计量地理学》实验报告

学 院: 班 级: 学 号: 姓 名: 指导老师: 实验地点:

计量地理学实验报告

计量地理学实验报告

目 录

一、第一次实验

(1)多元线性回归分析··3 (2)逐步回归分析··6

二、第二次实验

(1)主成分回归分析··10 (2)方差分析··13

三、第三次实验

(1)非线性回归分析··17 (2)聚类分析··20

四、第四次实验

趋势面分析··22

3

计量地理学实验报告

第一次实验

1.实验名称:多元线性回归分析

实验目的:通过探讨自变量与因变量之间变动的比例关系,建立模型,揭示地理要素之间的线性相关关系。

实验内容:以《贵州省遵义市海龙坝水源地供水水文地质详查报告》中的数据资料为例,对该地区地下水流量进行预测。从详查报告可以看出,该区地下水流量的动态变化主要受降雨量及人工开采两个因素的影响,因此主要通过研究区降雨量及人工开采用水资料来预测地下水各观测孔流量的变化,而不考虑其它因素的影响,则模型可简化为:

y??0??1x1??2x2

式中,y为观测孔地下水流量的变化;x1,x2分别为降雨量和人工开采量。

年份 降雨量x/mm 1人工开采量x/m 32观测孔流量y/(L/s) 1990 1991 1992 1993 1994 1995 1996 954 1389.5 864 1193.2 841 1378.4 1686.9 658.8 723.1 701.9 689.5 734.6 699.2 685.4 51.54 63.71 54.44 56.78 53.45 65.92 67.58

4

计量地理学实验报告

1997 1998

实验步骤:

1592.1 1956.7 704.7 613.7 64.59 75.31 (1) 在DPS系统中对原始数据进行回归分析,将上表中数据编辑、定义成数据块;

(2) 在“多元分析”菜单下选择“回归分析”中的“线性回归”,系统给出下图界面

点击右下角的“返回编辑”,得到以下数据: 多元线性回归分析结果: 方差来源 平方和 df 均方 F值 p值

5

计量地理学实验报告

r(y,X2) r(y,X3) r(y,X4) r(y,X6) -0.9627 0.3963 0.9466 -0.4452 11.2459 1.3648 9.2877 1.5723 0.0001 0.1996 0.0001 0.1442 相关系数R=0.9989 F值=1101.8360 Df=(4,10) p值=0.0001

样本 1 2 3 4 5 6 7 8 9 10 11 12 13

观测值 2664.9000 2937.1000 3149.4800 3483.3700 4348.9500 5218.1000 6242.2000 7407.9900 8651.1400 9875.9500 11444.0800 13395.2300 16386.0400 拟合值 3044.4788 2741.2696 2795.5669 3794.1878 4440.9622 4812.7524 5978.1287 7546.4224 8828.9307 10033.6036 11570.2564 13797.1601 15852.2476 拟合误差 -379.5788 195.8304 353.9131 -310.8178 -92.0122 405.3476 264.0713 -138.4324 -177.7907 -157.6536 -126.1764 -401.9301 533.7924 11

计量地理学实验报告

14 15 18903.6400 21715.2500 18816.7127 21770.7401 86.9273 -55.4901 Durbin-Watson统计量 d=2.0491598 成果分析:

从相关系数矩阵可以看出,此例还存在多重共线性。对于x1,它与x3具有最大相关系数,为0.999;同理,对于x2,它与x5具有最大相关系数,为0.953;对于x4,它与x1具有最大相关系数,为0.996;对于x6,没有显著相关。因此x1,

x3,x4之间高度相关,具有多重共线性。同样,x2,x5之间高度相关,具有多重共线性。该结论与模型是吻合的。事实上,在模型中,由于x1,x3,x4之间的共线性,x1和x3可由x4来表征;由于x2和x5的共线性,x5可由x2来表征。从实际情况看,工业的发展为建筑业的崛起提供了基础,而建筑业的兴旺又会拉动工业总产值的增长,两者之间是物资交换过程经过社会商品零售总额反映出来。同时,由于我国农业生产力相对落后,农业人口占总人口的比重过大,农业总产值与人口总数有直接关系。这些说明模型有合理的实际意义。

第二次实验

1.实验名称:主成分回归分析

实验目的:在保持原始数据信息损失最少的前提下,通过线性变换将原始自变量

12

计量地理学实验报告

集合由高维空间映射到一个低维空间,从而实现数据的降维。

实验内容:以法国有关进口总额经济分析为例,考虑的因变量Y是法国进口总额,自变量分别是法国国内生产总值X1,存储量X2和总消费量X3.

X1 X2 X3 Y 15.9 16.4 19 19.1 18.8 20.4 22.7 26.5 28.1 27.6 26.8 149.3 161.2 171.5 175.5 180.8 190.7 202.1 212.4 226.1 231.9 239

实验步骤: (1)在DPS系统中,点击“多元分析”

4.2 4.1 3.3 3.1 1.1 2.2 2.1 5.6 5 5.1 0.7 108.1 114.8 123.2 126.9 132.1 137.7 146 154 162.3 164.3 167.6

13

计量地理学实验报告

→“有偏回归分析”→“主成分回归”,界面上出现三个特征根(如右图),按大小依次顺序为?1=199.8185,?2=99.9162,?3=0.2653。第3个特征根较前面两个相比,已是很小,故选择保留两个特征根(主成分个数为2),输出结果如下表: 一般线性回归分析表

变量 x1 x2 x3 y

自变量主成分分析与特征向量(转置) No 1 2 3 z1 z2 z3 方差分析表 方差来源 平方和 df 均方 F值 p-值 特征值 1.9982 0.9992 0.0027 x1 0.7067 -0.0254 0.7070 百分率% 66.6062 33.3054 0.0884 x2 0.0296 0.9995 0.0062 累计百分率% 66.6062 99.9116 100.0000 x3 0.7069 -0.0165 -0.7072 平均值 194.5909 3.3182 139.7273 21.9364 标准差 29.9995 1.6479 20.6275 4.5944 膨胀系数VIF 188.6830 1.0150 188.7524

14

计量地理学实验报告

回 归 剩 余 总 的 209.2834 1.8020 211.0855 3 7 10 69.7611 0.2574 21.1085 270.9885 0.0001 相关系数R=0.995722 决定系数RR=0.991463 调整相关R'=0.993883 变量z 回归系数 标准系数 偏相关 标准误 t值 138.736b0 21.9364 0.1581 2 b1 b2 3.1784 0.8387 0.9779 0.1825 0.9946 0.8727 0.1173 27.0926 0.0001 0.1659 5.0553 0.0007 0.0001 p-值 剩余标准差sse=0.5244 Durbin-Watson d=2.6812 标准化回归方程:

标准化变量系数 2.224988std(x1) 0.932468std(x2) 2.232791std(x3) 主成分回归方程:y=-9.498114+0.074167x1+0.565846x2+0.108244x3

成果分析:

从上述结果可以看出,主成分回归模型统计检查F值270.9885,显著水平P<0.0001,复相关系数R为0.9957,这表明模型拟合良好。对比普通最小二乘

std(xi)的表达式: std(x1)=(x1-194.5909)/29.9995 std(x2)=(x2-3.3182)/1.6479 std(x3)=(x3-139.7273)/20.6275 15

计量地理学实验报告

回归,主成分回归舍弃了一个约等于0的特征值,也就是去掉了了一个复共线性关系(第三个特征量):

0.7070x1+x20.0062-x30.7072?0

这就使得整个回归模型在拟合未来资料时,会表现出较好的稳定性。

从上述分析过程来看,主成分回归的过程是先得到代表原始自变量集合大部分信息的新综合变量,然后使用这些综合变量对因变量进行回归分析。由于得到的新综合变量之间是相互正交的,所以避免了直接利用最小二乘法所遇到的“病态问题”,提高了预测的准确性和可靠性。因为因变量可以表示为新综合变量的线性组合,同时新综合变量又均可以表示为原始变量集合的线性组合,因此,可以将因变量表示为原始自变量集合线性组合的形式。

2.实验名称:单因素方差分析

实验目的:通过试验数据分析测试某一控制变量的不同水平是否给观察变量造成显著差异和变化。

实验内容:以某河流断面浮游植物观测数据为例,针对浮游植物这个指标分析各断面之间是否存在显著差异。 河流断面 样本数 1 2 3 4 10 10 10 10 浮游植物观测值/(104个/m3) 29 28 23 26 26 19 25 29 26 28 17 25 24 19 28 21 20 25 19 24 17 16 21 22 23 18 20 17 25 21 18 20 25 24 16 20 20 17 19 17 对上表中的数据做方差分析,以判断四个断面在浮游植物之间是否存在显著差

16

计量地理学实验报告

异。 实验步骤:

在DPS系统中依次选择“试验统计→完全随机设计→单因素试验统计分析”,在“方差分析参数设置”中选“LSD”法。得出以下数据:

95%置处理 样本数 均值 标准差 标准误 信区间 处理1 10 25.9000 3.0714 0.9713 23.7029 28.0971 处理2 10 22.2000 3.4897 1.1035 19.7036 24.6964 处理3 10 20.0000 2.9439 0.9309 17.8940 22.1060 处理4

10 19.6000 2.9515 0.9333 17.4887 21.7113 方差分析表: 变异来源 处理间 处理内 总变异

平方和 249.8750 350.9000 600.7750 自由度 3 36 39 均 方 83.2917 9.7472 F 值 8.5450 p值 0.0002 17

计量地理学实验报告

LSD多重比较表(下三角为均值差,上三角为显著水平):

5%显著1%显著No. 均值 1 2 3 4 水平 1 2 3 4

水平 A AB B B 25.9000 0.0119 2.2000 2.6000 0.0002 0.1238 0.4000 0.0001 0.0708 0.7761 a b b b 22.2000 3.7000 20.0000 5.9000 19.6000 6.3000 成果处理:

在方差分析中,显著水平P值是推断试验处理间差异程度的指标。由于P值小于0.001(方差分析表中),可以认为存在显著差异。要进一步研究这种差异的具体形式,检验各个处理之间的差异,只有当显著水平P<=0.05时,才能进一步做多重比较分析。首先对四个断面浮游植物的平均值(y)做初步分析,经

i?过计算(LSD法多重比较表),断面1的平均值最大,为25.9;断面3、4的平均值非常接近,分别为20.0和19.6;而断面2的平均值大体介于断面1和断面3、4的中间,为22.2。根据初步分析大致可以认为断面3和4的平均值之间没有显著区别,而断面1的平均值显著地大于断面3、4(因为方差分析结果是显著的)。问题在于2,它可能与断面1有(或没有)显著差别,也可能与断面3、4有(或没有)显著差别。无论何种情况,需要做多重比较检验。

3.实验名称:双因素方差分析

18

计量地理学实验报告

实验目的:对影响总体均值的两个或两个以上的因素进行考虑,,并对它们的联合影响(交互作用)做出估计。

实验内容:对“存在交互作用的双因素方差”进行分析

现有一组土壤、肥料试验数据,A因素为三种肥料处理,B因素为三种土壤处理,每组合包含三次重复。试根据试验结果(小麦产量)分析施肥、土壤以及它们的交互作用对小麦产量的影响。

肥料 A1 A2 A3

土壤 B1 B2 B3 B1 B2 B3 B1 B2 B3 重复 21.4 19.6 17.6 12 13 13.3 12.8 14.2 12 21.2 18.8 16.6 14.2 13.7 14 13.8 13.6 14.6 20.1 16.4 17.5 12.1 12 13.9 13.7 13.3 14

实验步骤:

根据表中数据,在DPS系统中,选择“试验统计→完全随机设计→二因素有重复试验统计分析”。系统提示输入A因素处理(a)和B因素处理数(b),

然后再按提示数据转换方式,最后进行运算分析,并输出结果(如下表)。

方差分析表(随机模型)

19

计量地理学实验报告

变异来源 A因素间 B因素间 AxB 误 差 总变异

平方和 179.3807 3.9607 19.2415 16.7001 219.2830 自由度 2 2 4 18 26 均 方 89.6903 1.9803 4.8104 0.9278 F 值 18.6450 0.4120 5.1850 p值 0.0094 0.6877 0.0059 A因素、B因素多重检验检验结果

A因素处理 1 3 2 均值 18.8000 13.5556 13.1333 5%显著水平 a b b 1%极显著水平 A B B B因素处理 1 2 3 AB因素组合多重检验

处理 1

均值 15.7000 14.9556 14.8333 5%显著水平 a a a 1%极显著水平 A A A 均值 20.9000 5%显著水平 a 1%极显著水平 A 20

计量地理学实验报告

二次剩余 由二次增至 189.018 12-5-1 31.503 36.886/20.73147.545 三次的回归 4 36.886 7=1.779 由表可知,从二次趋势面增加至三次趋势面,F=1.779,在α=0.05下,查F分布表得F0.05=4.12,由于F<F0.05,故将趋势面的拟合次数由二次增至三次无贡献,因此选二次趋势面比较合适。趋势面分析中,若F值显著,则较高次多项式对回归做了新贡献;若F值不显著,则较高次多项式对回归并无新贡献。

31

本文来源:https://www.bwwdw.com/article/ldj2.html

Top