SPSS EXCELE上机操作指导

更新时间:2024-03-07 09:10:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

实验一 数据分布

【运行方法一(spss操作)】

建立或打开数据文件后,进行一维频数分布分析

——按statistics—descriptives——frequencies顺序逐一单击鼠标键,打开frequencies频数分布对话况

——在左侧的源变量框中选择一个或多个变量,单击向右箭头按钮使其进入右恻的Variables框中

——选中Display frequency tables 复选项,将显示频数分布表

(1)单击statistics按钮,打开frequency:statistics对话框,如图所示,在对话框中确定将要在输出结果中出现统计量。可选择的统计量分5组,其中我们主要需要以下统计量:

(2)dispersion离差栏,选择此栏中各复选项计算的统计量如下: ①std.deviation标准差 ②Variance方差

③Range全距,即最大值与最小值之差 ④Minimum最小值 ⑤Maximmum最大值 ⑥S.E.mean均数的标准误 (3)central Tendency 中心趋势栏

① Mean 算术平均数 ② Median中位数 ③ Mode众数 ④ Sun算术和

(4)distribution分布参数栏

●单击Charts按钮,展开Frequency:chart对话框,在对话框中对图形的类型及坐标轴等进行设置。

(1)chart type 栏,选择图形类型

①None选项,不输出图形,这是默认系统。

②Bar charts选项,输出条形图,各高度代表变量各分类的观测量数。频数为0的分类不显示在此图中。

③Pie charts 选项,输出圆图,圆图中各块代表变量各分类的观测频数。

1

频数为0的分类不显示在此图中。

④Histograms选项,要求作直方图,此图仅仅用于连续的数值型变量。如果选择了直方图还可以选择with normal curve 复选项即直方图中带有正态曲线。

(2)chart value 栏,纵轴表达的统计量。只有选择了条形图和圆图栏内的选项才有效。

① Frequencies选项,纵轴表示频数 ② Percentage选项,纵轴表示百分比

【运行方法二(spss操作)】

以课本第19页表2-3数据为例

操作步骤: (1)录入数据

定义变量“降水量”,并按表2-3内容输入数据,见图1-1

图1-1(显示部分数据)

(2)转换数据,生成新变量

①选择“Transform→Recode→Into Different Varibles…”命令,弹出“Recode into Different Variables”对话框,将“降水量”选入“Numeric Variable”框中,并在“Output Variable”中输入新变量的名字“分组”,单击框后的“Change”按钮,如图1-2所示。

2

图1-2

②单击“Old and New Values…”按钮,弹出“Recode into Different Variables:Old and New Values”对话框。

在对话框中左侧第二个“Range”框中输入768.6,然后在“New Value”框中的“Value”后输入1,单击“Add”按钮,右侧的文本框中显示“Lowest thru768.6→1”,表示用1代表768.6以下的降水量值。

在第一个“Range”框中输入“768.7”though“887.6”,然后在“Value”后输入2,单击“Add”按钮加入,即用2代表768.7到887.6之间的降水量值。同样,用3代表887.7到1006.6之间的降水量值,用4代表1006.7到1125.6之间的降水量值,用5代表1125.7到1244.6之间的降水量值,用6代表1244.7到1363.6之间的降水量值,用7代表1363.7到1482.6之间的降水量值,用8代表1482.7到1601.6之间的降水量值。

在第三个“Range”框中输入“1601.7”,然后在“New Value”框中的“Value”后输入9,单击“Add”按钮加入,即用9代表1601.7以上的降水量值。 设置完成后如图1-3所示。

3

图1-3

③单击“Continue”按钮,回到图11的对话框中,单击“OK”按钮,生成新的变量“分组”,界面如图1-4所示。

图1-4(显示部分数据)

(3)统计分析

①选择“Analyze→Descriptive Statistic→Frequencies”命令,弹出“Frequencies”对话框,从左侧选择“分组”,使其进入“Variable(s)”框中,如图1-5所示。

图1-5

②选中“Display frequency tables”复选框,表示显示次数分布表。 ③单击“Statistics”按钮,弹出“Frenquency:Statistics”对话框,视需要进行选择,如图1-6所示。本例中采用默认值,设置完成后单击“Continue”按钮。

4

图1-6

④在图1-5所示的对话框中,单击“Charts”按钮,弹出“Frenquencies:Charts”对话框,如图1-7所示。本例中选择“Histograms”(直方图)和“With normal curve”(带有正态曲线)两项,单击“Continue”按钮。

图1-7

⑤在图1-5所示的对话框中,单击“Format”按钮,弹出“Frenquencies:Format”对话框,如图1-8所示。本例中取默认值,设置完成后单击“Continue”按钮。

5

图1-8

⑥在图1-5所示的对话框中,单击“OK”按钮,提交运行,输出结果如表1-1和图1-9所示。

表1-1 频数分布表

分组302010FrequencyStd. Dev = 1.62 Mean = 4.601.02.03.04.05.06.07.08.09.0N = 100.00分组 图1-9

6

【运行方法三(excel操作)】

以课本第19页表2-3数据为例

(1)录入数据

定义变量“降水量”,并按表2-3内容输入数据,见图1-10

图1-10(显示部分数据)

(2) 录入下限值,调用Frequency函数,生成频数值 用鼠标选择区域

C2

C10,在编辑栏内输入

“=FreQuency(A2:A101,B2:B10)”; 按“Crtl+Shift+Enter”组合键产生数组公式“={FreQuency(C2:C56,B58:B69)}”,这里要注意“{ }”不能手工键入,必须按下“Crtl+Shift+Enter”组合键由系统自动产生。完成后C2:C10将显示如图1-11所示的降水量值分布情况。

图1-11

7

(3)绘制频数分布图

根据频数值计算得出频率值,然后在EXCEL表中录入组中值,并把频数、频率复制到与组中值并列的单元格里,插入图表,图表类型选用双轴线-柱图,然后绘制频数分布图,见图1-12。

图1-12

8

实验二 统计图表、空间罗伦兹曲线

1.学时:6 2.实验目的和要求

掌握地理研究中常用的统计图表的作法,空间罗伦兹曲线的作法 3.实习内容:

运用EXCEL的绘图模块,对理研究中常用的图表进行绘制,重点掌握曲线图、直方图、立方图、双轴曲线图等。

运用EXCEL的计算模块,绘制空间罗伦兹曲线 4.使用仪器:电脑 5.方法步骤:

【(单要素)空间罗伦兹曲线的绘制】

——基本原理:

作一长方形,长方形的水平轴为部门或区域单元,垂直轴为累积百分率。对角线OX表示各部门或区域单元的要素分布是均等的。曲线的上凸程度,表示要素的部门或区域单元集中化程度,上凸程度越大,就表示要素越是集中于某些产业部门。

——主要步骤:

(1)将某地区各产业部门的收入及其占总收入比重表(百分比),从大到小重新排序;

(2)从大到小,逐次计算累计百分;

(3)以自然序号为横坐标(x),累计百分比为纵坐标(y);以(部门代码,累计百分比)为坐标点,连成一个上凸的曲线,即罗伦次曲线见图2-1。

9

图2-1

【(双要素)空间罗伦兹曲线的绘制】

——基本原理:

作一正方形,正方形的水平轴与垂直轴都为累积百分率。对角线OX表示沿两种分布之间是完全相对应的,有相同的百分率和累积百分率。曲线离开对角线的远近就是这两种分布的差异程度的测度。

——主要步骤: (1)确立研究对象

主要是考虑哪两种或几种事物与另外一种事物或现象进行比较。一般来讲,可以考虑人口与GDP、GDP与面积、利用外资与面积等进行比较。

(2)求研究对象的比重

(3)计算r值:R=GDP比重/人口比重

(4)把各地区的R值由大到小的顺序排列,相应的计算出GDP和人口的累积百分比

(5)分别以GDP和人口的累积百分比为纵轴和横轴,把各个地区的数值

10

点在直角坐标系内。若折线越靠近对角线,则表明GDP的分布与人口分布比较一致,越远离对角线,则表示与人口的分布不一致,即GDP的内部差异较大。见图2-2。

10080实际分布收入累计百分比/`40200020406080100人口累计百分比/%均衡分布

图2-2

11

实验三 相关系数、一元回归模型的建立

1.学时:6 2.实验目的和要求

掌握相关分析、回归分析的定义、内涵,重点掌握一般相关系数的计算公式、利用所给数据能够建立一元线性与非线性回归方程,并能够进行检验。

3.实习内容

运用SPSS应用软件中的Correlate模块进行两两要素间的相关分析,并能够进行检验;运用SPSS应用软件中的Regression 模块建立一元线性和非线性方程,并进行检验,利用所给数据进行预测。

4.使用仪器:电脑 5.主要步骤:

【spss计算简单相关系数】

——主要步骤:

(1)打开analyze-correlation-brivarite顺序逐一单击鼠标,展开Brivarite Correlations二元变量相关分析主对话框。

(2)在变量栏中选中所要求的变量,将选择的变量移到Variables矩形框中 (3)从主对话框中选择correlation Coefficient的方法,系统默认的是Pearson,即皮尔逊相关(常用的一种方法)。显著性检验系统默认的是Two-tailed,即双尾T检验,表示相关系数为0的假设检验成立的概率。如果事先不知道相关方向时选用Two-tailed;如果事先知道方向时,选用One-tailed

(4)要求显示实际的显著性水平。“**”相关系数的显著性概率水平为0.01。“*”表示显著性水平为0.05 【spss计算偏相关系数】

——主要步骤:

(1)打开analyze-correlation-Partial顺序逐一单击鼠标,展开Partial Correlations变量偏相关分析主对话框。

12

(2)在变量栏中选中进行偏相关分析的变量,移到Variables矩形框中,把不参与偏相关分析的变量,移到Controlling for矩形框中。

(3)显著性检验系统默认的是Two-tailed,即双尾T检验,表示偏相关系数为0的假设检验成立的概率。如果事先不知道相关方向时选用Two-tailed;如果事先知道方向时,选用One-tailed

(4)要求显示实际的显著性水平。“**”相关系数的显著性概率水平为0.01。“*”表示显著性水平为0.05 ,点“OK”。

【spss建立一元线性模型】

——主要步骤:

(1)建立数据库

(2)作散点图。按Graphy-scatter-simple顺序逐一单击鼠标键,展开simpie scatterplot 对话框,将因变量、自变量依次选入Y Axis、X Axis,单击ok键。观察散点图的分布状况

(3)按anlayze-Rggression-linear顺序逐一单击鼠标键,打开Linear Rgeresstion对话框

(4)在左侧的源变量中,选择一个变量进入Dependent框中作为因变量,选择一个变量进入Independent框中,作为自变量。 自变量和因变量必须是数值型变量

(5)在methord框中选择一种回归分析方法

enter选项,强行进入法,即所选择的变量全部进入回归方程中。该选项是默认方式。

Regression Conefficient 栏,有关回归系数的选择项

Estimates复选项,输出回归系数B、B的标准误、标准回归系数beta、B

的T值以及T的双测检验的显著水平Sig

与模型拟合及其拟合效果有关的选择项

Model fit 复选项,输出引入模型和从模型中剔除的变量,提供复相关系数R,复相关系数平方,及其修正值,估计值的标准误差,方差分析表。

Descriptives复选项,

Part and partial correlation 复选项,输出变量之间的简单相关系数

13

【spss建立一元非线性模型】

——主要步骤: (1)原始数据

下表给出了某地区1971—2000年的人口数据(表3-1)。试用SPSS软件对该地区的人口变化进行曲线拟合,并对今后10年的人口发展情况进行预测。

年份

1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

表3-1 某地区人口变化数据 时间变量t=年份-1970

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

人口y/人 33 815 33 981 34 004 34 165 34 212 34 327 34 344 34 458 34 498 34 476 34 483 34 488 34 513 34 497 34 511 34 520 34 507 34 509 34 521 34 513 34 515 34 517 34 519 34 519 34 521 34 521 34 523 34 525 34 525 34 527

14

根据上表中的数据,做出散点图,见图3-1。

346003450034400343003420034100340003390033800337001970197219741976197819801982198419861988199019921994199619982000人口年份

图3-1 某地区人口随时间变化的散点图

从图3-1可以看出,人口随时间的变化呈非线性过程,而且存在一个与横坐标轴平行的渐近线,近似S曲线。(注:若不能确定什么模型,可以多选择几种模型,最后,选择的拟合效果最好的模型)

下面,我们用SPSS软件进行非线性回归分析拟合计算。 (2)用SPSS进行回归分析拟合计算

在SPSS中可以直接进行非线性拟合,步骤如下:

Analysis->Regression->S,在弹出的对话框(见图3-2)中选择拟合的变量和自变量,本例分别选择y(人口),t(时间变量)为因变量(Dependent)和自变量(Independent)。

15

图4-3

(4)计算XTX的逆矩阵(XTX)-1。

利用矩阵求逆函数 minverse,选定一个3×3的单元格区域——注意逆矩阵的维数与原矩阵一样,输入如下计算公式

“=MINVERSE(B13:D15)”,

同时按下Ctrl+Shift 键,回车,得到 XTX的逆矩阵(图4-4)。

21

图4-4

(5)计算 XTY。

前面的矩阵都是3行3列,接下来的运算3 行1列元素。XT则是3×10 的矩阵,Y是一个10×1的向量,故XTY应该是一个3×1的向量。在工作表中选择一个3×1的区域,根据前面图示的数据分布位置,输入计算公式

“=MMULT(TRANSPOSE(B2:D11),E2:E11)”,

同时按下Ctrl+Shift键,回车,得到 XTY向量(图4-5)。

22

图4-5

(6)计算回归系数向量(XTX)-1XTY。

如前所述,(XTX)-1是一个3×3的矩阵,而XTY则是一个3×1的向量,故(XTX)-1XTY必然是一个3×1的向量。选定一个3×1的单元格区域,根据前面图示的数据分布位置,输入计算公式

“=MMULT(B17:D19,B21:B23)”,

同时按下Ctrl+Shift键,回车,得到(XTX)-1XTY向量(图4-6)。

23

图4-6

至此,模型参数计算完毕。 Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) 国内游客 海外游客 a. Dependent Variable: 旅游总收入 B -13.631 .058 5.533 Std. Error 1.919 .008 1.226 .633 .376 Coefficients Beta t -7.102 7.609 4.512 Sig. .000 .000 .003 a95% ConfidencLower Bound -18.169 .040 2.633

24

实验五 聚类分析

1.学时:6 2.上机目的和要求

通过此次上机分析,重点掌握样本聚类方法的概念、基本思路、数据处理的方式,并能对结果进行分析。

3.实习内容

运用SPSS应用软件中的Classify模块,建立分层聚类的基本概念,掌握数据标准化的方法、统计量的计算方式以及聚类的方法的选择,并根据自动生成的聚类谱系图进行类型的划分。

4.实验工具:电脑 5.主要步骤

(1)在数据窗口中建立数据文件,检查输入的数据有无错误

(2)点击Analyze,展开下拉菜单,选中Classify命令,显示小菜单,在小菜单中选择Hierachical Cluster子命令,展开Hierachical Cluster Analysis分层聚类分析对话框。

(3)在对话框中部的Cluster栏中选择聚类类型 ——选择Variables项,要进行变量 ——选择Variables项,要进行变量聚类

(4)指定参与分析的变量,将选定的变量选进右侧的Variable矩形框中;将标识变量通过下面一个按钮选到Lables Cases By 框中。

(5)如果参与分析的变量量纲一致,不必对数据进行标准化,否则要进行标准化处理。

(6)确定聚类方法

在主对话框中,单击method按钮,在对话框中根据需要指定聚类方法、距离测度的方法、数据标准化的方法等。

●聚类方法的选择

Bwteen-groups-linkage组间连接 Within-groups linkage组内连接

Nearest neighbor 最近邻法——首先合并最相似的两项 Futhest neighbor 最远邻法 等等

●对距离的测度方法的选择

地理研究当中大多数采用等间隔测度的变量(interval),主要的方法有

25

Euclidean distance 选项(欧氏距离)

Squared Euclidean distance 选项(欧氏距离平方)

Cosine 选项,即Cosine aimilarrity measure cos相似性测度(夹角余旋) Pearson correlation 选项(皮尔逊) ●确定标准化的方法

选择标准化的方法在Transform Values栏中进行,鼠标对准Standaridize框中的向下箭头按钮。

对数据进行标准化可选择的方法

——None选项,不进行标准化,是系统默认值 ——Z scores选项,是标准差标准化的方法

——Range -1 to +1 ,把数值标准化到-1到+1之间。

——Maximum magnitude of 1,把数值标准化到最大值是1,也就是最大值标准化

——Range 0 to 1,就是极差标准化。

——Mean of 1 均值标准化,若均值为0,则所有值都加1

——Standard deviation of 1选项,把被需要标准化的变量初以该变量的标准差,若标准差为零,则取值保持不变。

(7)选择要求输出的统计量

聚类结束后要把哪些统计量输出,可以采用Statistuics对话框进行选择,

展开相应的Statistics对话框

——Agglomeration schedule复选项,为凝聚状态表,显示聚类过程中每一步合并的类,可以跟踪聚类的合并过程,仔细查看哪些观测量更接近一些。

——Proximity Matrix复选项,为各项间的距离矩阵,以矩阵的形式给出各项之间的距离或相似性测度值。(可以是距离、相关系数、相似系数,取决于method 对话框中的measure选择)。如果样本或变量太多,不用选择。

(8)选择统计图

——Dendrogram 复选项,树形图 ——Icicle 冰柱图

实验六 综合测试

【测试方式】

由测试老师随机选择一个实验项目,要求每一位学生进行现场上机操作。 【上机学时】4

26

* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *

Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

Case 4 4 Case 9 9 Case 3 3 Case 2 2 Case 8 8 Case 1 1 Case 5 5 Case 7 7 Case 6 6

─┬───┐

─┘ ├───────────┐

─────┘ ├───────────────────────────────┐ ─┬───────┐ │ │ ─┘ ├───────┘ │ ─────────┘ │ ─┬─────┐ │ ─┘ ├─────────────────────────────────────────┘ ───────┘

27

本文来源:https://www.bwwdw.com/article/zmpa.html

Top