节假日高校出行的交通方式倾向与选择

更新时间:2024-03-13 07:40:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

ChangshaUniversity of Science & Technology

课程设计

设计题目:节假日高校出行的交通方式倾向与选择 课程名称:运输统计与分析 学院:交通运输工程学院 专业:交通运输 班级:交运1302班 学生姓名:刘丽婉

学号: 201330010214 指导教师:周和平柳伍生李利华

====2014 /2015学年第二学期====

课程设计(学年论文)任务书

课程名称:运输统计与分析 适用对象:交通运输 一、 课程设计(论文)目的

《运输统计与分析》课程设计作为独立的教学环节,是交通运输本科专业的必修课。其目的是,通过本课程设计实践,培养学生理论联系实际思想,加深统计分析基本理论与基本知识的理解,学会收集或调查行业统计数据,切实掌握各种统计分析方法,并能灵活运用统计软件在计算机上实现,正确解释和分析运行结果,培养运用各种统计分析方法解决交通运输领域内实际问题的能力。

二、 课程设计(论文)题目与内容

本课程设计(论文)主要任务为:针对交通运输领域内某一主题,设计调查表调查或查询相关统计数据,根据本课程讲授内容选择多种合适的统计分析方法,运用SPSS建立模型分析问题。题目自拟,但题名一般要包含主题与统计方法,且必须与交通运输专业相关,选题主题主要包括:

1. 运输产品市场定位 2. 客货运需求分析与预测 3. 政策或技术方法实施效果评价 4. 交通出行行为选择 5. 影响因素分析 6. 运输市场调控 7. 交通运输状态判别分析 8. 运输服务质量评价 9 自选

三、 课程设计(论文)基本要求

(一)选题要求

1. 一人一题,不得重复;

2. 客货运需求分析与预测选题不得超过30%; 3. 所有选题必须报指导老师批准;

4. 选题确定后原则上不得更改,如需更改,必须得到指导教师同意。 (二)内容要求

报告内容原则上不少于8000字,其正文至少包括如下几个方面的内容: 1. 问题背景(问题的提出、必要性与意义,数据来源)

2. 描述性统计 3. 多元统计分析

(包含数据准备、SPSS操作步骤、输出结果及分析) 4. 总结 5. 附录数据清单 (三)成果要求

1. 必须采用三种以上统计分析方法(不包含描述性统计); 2. 图表规范美观;

3. 报告中的所有SPSS输出结果必须更改为中文; 4. 报告排版符合规范要求。

四、 课程设计(论文)时间及进度安排

1. 时间:

两周:2014-2015学年第二学期第十九、二十周 2. 进度安排:

确定主题;调查、收集数据:2天 数据分析与预处理、描述性统计分析:2天 分析方法原理及选择:2天 SPSS操作及结果分析:4天 解决实际问题或建议:2天 撰写报告、总结:2天

(此部分可以按照自己设计具体内容,详细安排) 3. 成果提交:

要求独立完成,每人需提交1份打印的设计报告(A4)、word电子文档、数据文件(sav格式)。电子文档文件名为:学号后四位+姓名+题目,先发电子文档给指导老师,经许可后方可打印。最终成果(打印稿1份、电子文档1份)统一交班长汇总并转交指导老师;最终成果提交截止时间为第20周周五。

五、 成绩评定

成绩评定按各项评分汇总,如表1所示:

表1 成绩评定项目与分值

选题 10分

对于以下情况给予5分的特别加分:

数据来源 20分 统计方法 30分 软件操作 20分 规范性 10分 考勤 10分

1. 选题具有新意

2. 采取自主调查方式完成课程设计; 3. 运用自学的统计分析方法且使用正确。

成绩评定按百分制计分(最高100分),并按照学校相关规定按优秀、良好、中等、及格和不及格五个等级进行等级评定。

如下以下情况之一,按“不及格”进行处理: 1. 存在严重抄袭行为; 2. 未按时提交成果; 3. 方法运用严重错误; 4. 报告排版混乱; 5. 缺席3次以上。

六、 报告格式

课程设计报告装订顺序依次为:封面、课程设计(学年论文)任务书、目录、正文、参考文献、成绩评定表。报告中所有图表应按“章号-图表序号图表名”(例:图1-1***频数图)进行编号。具体格式参看课程设计报告样本。

七、 主要参考资料

1.王周伟,周敏编著.SPSS综合分析与综合应用.上海:上海交通大学出版社,2012年1月;

2.张文彤,钟云飞编著. IBM SPSS.数据分析与挖掘实战案例精粹.北京:清华大学出版社.2013年1月;

3.贾俊平.编著. 统计学.北京:中国人民大学出版社.2012年6月(第5版)。

目录

1 概述............................................................................................................................ 1

1.1 1.2 1.3 2

研究背景与意义....................................................................................... 1 数据来源................................................................................................... 1 采用的分析方法....................................................................................... 1

描述性统计分析..................................................................................................... 3 2.1 2.2

数据处理................................................................................................... 3 描述性分析............................................................................................... 3

3 出行方式统计分析................................................................................................. 5 3.1

主成分分析法........................................................................................... 5 3.1.1 3.1.2 3.1.3 3.2

数据准备............................................................................................ 5 SPSS操作步骤 .................................................................................. 5 结果分析............................................................................................ 7

对应分析法............................................................................................. 10 3.2.1 3.2.2 3.2.3

数据准备.......................................................................................... 10 SPSS操作步骤 ................................................................................ 12 结果分析.......................................................................................... 14

3.3 logistic回归分析法 ................................................................................ 17 3.3.1 3.3.2 3.3.3

数据准备.......................................................................................... 17 SPSS操作步骤 ................................................................................ 19 结果分析.......................................................................................... 21

3.4 4

曲线估计预测法..................................................................................... 24

总结....................................................................................................................... 32 4.1 4.2 4.3

本设计的主要工作................................................................................. 32 存在的不足............................................................................................. 32 下阶段研究需解决的问题..................................................................... 32

附录一数据清单.......................................................................................................... 33 附录二问卷调查表...................................................................................................... 34

1 概述

1.1 研究背景与意义

随着交通行业的发展,人们出行已经有了多种多样的方式可以选择,而高校大学生作为现在促进社会发展的主力军,研究他们对交通方式的选择倾向是不可或缺的。除此之外,在节假日,人们对出行方式的需求大大提升,节假日的出行次数和概率和大大增加。由于经济条件越来越好和闲暇时间越来越多,出外旅游将成为人们的经常性的消费,人们对旅游服务质量的要求也会越来越高。在信息化时代,每周例行的短途往返(从家里至办公地点,或从家里至超级市场选购生活用品)的次数将相对减少,但是人们参加特定目的的长途旅行的次数可能会比以前任何时候不多。

在这样的环境及背景促使下产生了我这次的研究课题:节假日高校出行的交通方式倾向与选择。研究不同目的下高校学生对于交通方式的选择,有利于进行交通力的分配,了解节假日高校学生的去向,进行不定量的交通方式分配从而尽可能满足更多人的需求,合理高效的利用好现有的交通资源。

1.2 数据来源

因为在现有的统计数据资料中未能直接查阅到所需的资料,所以这里采用的是调查获取数据,通过随机发放问卷进行抽样调查。问卷详见附录二。

调查方法:问卷随机抽样调查。

抽样率:因为是在网上随机方法问卷,因此不确定整体数是多少,总共收集了18份问卷,各个年级各个地区都有,粗略估计抽样率应在30%左右。

1.3 采用的分析方法

(1)主成分分析:为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。通过设置不同的因素从而更加清晰的找到高校学生在某种目的选择此类交通方式的原因,因为是探究原因而设置了很多与此相关的变量,所以这里采用主成分分析法刚好能解决。

1

(2)对应分析:通过分析由定型变量构成的交互汇总来揭示变量间的联系,可揭示同一变量各个类别之间的差异,及不同变量各个类别之间的对应关系。

(3)logistic回归分析:由于事物间的联系是多方面的,在因变量相同的情况下,通过探讨不同的自变量来研究之间的相关性的大小。这里应用到问卷里,在已经是本地(省市)学生的情况下,对是否选择回家及回家的方式与选择原因进行调查与分析。

(4)曲线估计预测法:在实际的一元回归分析中,一般首先绘制自变量和因变量间的散点图。如果散点图中的数据分布明显呈直线趋势,则可以利用线性回归分析方法估计回归方程。但在很多情况下并非如此,数据在散点图中的分布呈曲线趋势且具有某种函数的图形特点。这时如果要作回归分析,就需要利用SPSS的曲线估计。研究大学所处城市的级别来预测该高校大学生对于交通方式的选择倾向。

2

2

2.1 数据处理

描述性统计分析

此次调查问卷总共采集到18份问卷,得到的相关统计量如表2-1所示,我们可以很直观的看到并得出这样的结论,高校大学生节假日出行的主要交通工具是公交车,占到了总人数的50%,其次乘坐火车的人占到了总人数的33.33%,乘坐高铁和乘坐电瓶车及自行车的都占到了总人数的5.56%,选择步行及出租车、长途汽车与飞机的则为0。在此次随机调查中,因为调查的时间不够长,导致数据并不能完整的分布,按理论上讲每一种出行方式都会有人选择的,但还是可以知道,高校大学生还是比较倾向于选择公交车,火车作为自己的出行工具。

表 2-1 出行方式统计表

出行方式 步行 自行电瓶出租公交长车 车 车 车 途汽车 高铁 火车 飞机 合计 频数 百分比 0 0% 1 1 0 9 50% 0 0% 1 6 0 18 100% 5.56% 5.56% 0% 5.56% 33.33% 0%

2.2 描述性分析

这对此现象,本课题对究竟是什么影响到高校大学生节假日出行方式的选择进行了调查。结合生活经验,列出了如下的一些影响因素:性别,年级,是否为本地(省市)学生,每月生活费,每月交通费,出行目的,出行方式选择原因,学校周围交通情况以及其他因素。对上述的因素进行相关分析。

3

图2-1 数据输入

在数据输入中,因为有设定是否为本地(省市)学生的选项,因为在是与否的不同前提下有不同的选项,通过对本地(省市)学生节假日是否选择回家探究在距离较近的情况下,高校大学生对于回家的倾向以及限定距离的交通方式的选择。

在统计的18人中,有6人为本地(省市)学生,其中有4人选择节假日回家,占总人数的66.6%,可见在较短距离下,高校大学生对于回家的倾向很明显,在这4人中,1人选择私家车回家,1人选择长途汽车,1人选择火车,1人选择其他方式(高铁)。而后对他们选择该方式的原因进行调查,如图2-2。

图2-2 本地(省市)学生回家方式选择与原因统计图

从上图可以看出,选择私家车是考虑到路线问题,选择长途汽车是因为价格问题,选择火车是考虑到安全问题,选择其他(高铁)是因为时间问题,可见每一种交通方式的选择对于本地(省市)学生回家都存在这一定的原因。

这仅仅是对本地(省市)学生的一个小类别的分析,其他各方面都影响着节假日高校大学生出行的交通方式的选择,接下来,我们也要进行一系列的分析与讨论。

4

3

3.1 主成分分析 3.1.1 数据准备

出行方式统计分析

由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Va(rF1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,??,第P个主成分。

选取所在城市,性别,年级,生活费,出行方式作为主要指标,数据来自随机问卷调查统计结果,无缺失数据。 3.1.2 SPSS操作步骤

(1)点击“分析-降维-因子分析”,将需要分析的影响因素选入变量; (2)在“描述”中,选择需要输出的统计量与相关矩阵; (3)在“抽取”中,选择主成分分析,勾选需要输出的量。

5

图3-1 主成分分析操作步骤1

图3-2 主成分分析操作步骤2

6

图3-3 主成分分析操作步骤3

3.1.3 结果分析

表3-1 相关矩阵

你的大学所

你的性别是?()

相关 你的性别是?() 你的大学所在城市为?() 你所在的年级为?() 你每月的生活费是?() 你出行是选择的交通方式是?() .462 -.026 .136 -.236 1.000 .000 -.352 .063 1.000 -.236 -.319 -.169 1.000 .063 .136 1.000 .056 在城市为?

()

.056 1.000 你所在的年级为?()

-.319 -.169 你每月的生活费是?()

.000 -.352 你出行是选择的交通方式是?() .462 -.026

表3-2 KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin度量。 Bartlett 的球形度检

近似卡方

.362 10.811 7

验 df 10 Sig.

.372 表3-3 公因子方差

初始 提取 你的性别是?() 1.000 .856 你的大学所在城市为?() 1.000 .703 你所在的年级为?() 1.000 .857 你每月的生活费是?() 1.000 .759 你出行是选择的交通方式1.000 .886 是?()

提取方法:主成份分析。

表3-4 解释的总方差 初始特征值 提取平方和载入 成份 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 1.622 32.439 32.439 1.622 32.439 32.439 2 1.284 25.678 58.116 1.284 25.678 58.116 3 1.155 23.093 81.209 1.155 23.093 81.209 4 .623 12.452 93.661 5 .317 6.339 100.000 提取方法:主成份分析。 8

图3-4 主成分分析碎石图

表3-5 成份矩阵a

你的性别是?() 你的大学所在城市为?() 你所在的年级为?() 你每月的生活费是?() 你出行是选择的交通方式是?()

提取方法 :主成份。 a. 已提取了 3 个成份。

成份

1 .730 .461 -.415 -.545 .639 2 .459 -.696 .263 .468 .548 3 -.337 .075 .785 -.493 .420 从“相关矩阵表”中可知许多影响因素之间直接的相关性均大于0.8,存在高度相关性,证明本设计选取的影响因素之间存在信息上的重叠,从相关性来看适于进行主成分分析。且显著性均小于0.05,认为分析结果存在统计学意义。

在“KMO 和 Bartlett 的检验”中可知,Bartlett球度检验统计量的观测值为38.151。相应的显著值小于0.05,故应拒绝原假设,认为相关系数矩阵与

9

单位存在显著差异。模型的KMO值为0.8<0.825<0.9,根据Kaister给出的KMO度量标准,可知适合进行因子分析。

“公因子方差” 表显示了所有变量共同度数据。第一列数据是因子分析初始解下的变量共同度,它表明:如果对原有4个变量采用主成分分析方法提取所有特征值,那么原有变量的所有方差都可被解释,变量的共同度均为1(原有变量标准化后的方差为1)。事实上,因子个数小于原有变量的个数才是因子分析的目标,所以不可提取全部特征值。第二列的数据是在按指定提取条件(这里为特征值大于1)提取特征值时的共同度。可以看到:本设计选取的影响因素中的GDP和公路总里程可被解析(均大于85%)。

在“说明的总方差”中,“合计,方差的,累积”,分别表示特征值,方差贡献率,累计方差贡献率。它们描述了因子分析初始解的情况。可以看到,第一个因子的特征值为3.742,解释原有4个变量总方差的93.554%,累积方差贡献率为93.554%;第二个因子的特征值为0.214,解释原有4个变量总方差5.338%,累积方差贡献率为98893。其余数据含义类似。在初始解中由于提取了4个因子,因此原有变量的总方差均被解释,累积方差贡献率100%。

在“碎石图”中,横坐标为因子数目,纵坐标为特征值。可以看到第一个因子特征值很高,对解释原有变量的贡献最大,第三个以后的因子特征值都较小,对解释原有变量的贡献很小。但,4 个变量在第一个因子上的载荷都很高,意味着它们与第一个因子的相关程度高,第一个因子很重要。

3.2 对应分析法

对应分析也称关联分析、R-Q型因子分析,是近年新发展起来的一种多元相依变量统计分析技术,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。 3.2.1 数据准备

依据输入的数据,设定各数值标签,将年级中:1=“大一”,2=“大二”,3=“大三”,4=“大四”,5=“研究生”;出行方式中:1=“步行”,2=“自行车”,3=“电瓶车”,4=“出租车”,5=“公交车”,6=“长途汽车”,7=“高铁”,8=“火

10

车”,9=“飞机”,如图3-5,图3-6,图3-7:

图3-5 数据输入

图3-6 设定数值标签1

11

图3-7 设定数值标签2

3.2.2 SPSS操作步骤

(1)选择“分析”-“降维”-“对应分析”打开分析窗口,如图3-8:

图3-8 对应分析窗口

(2) 选择“你出行时选择的交通方式”作为行,“你所在年级”作为列,并定义范围,出行方式(行)为(1 8),年级(列)为(1 5),如图3-9,图3-10:

12

图3-9 出行方式定义范围

图3-10 年级定义范围

13

图3-11 定义完成图

(3) 点击确定后,经计算得出表格和对应分析图。

3.2.3 结果分析

表3-6 对应表 你所在的年级为?() 你出行是选择的交通方式是?() 步行 自行车 电瓶车 出租车 公交车 长途汽车 高铁 火车 有效边际 大一 0 0 1 0 0 0 0 1 2 大二 0 1 0 0 7 0 1 3 12 大三 0 0 0 0 0 0 0 1 1 大四 0 0 0 0 2 0 0 1 3 研究生 0 0 0 0 0 0 0 0 0 有效边际 0 1 1 0 9 0 1 6 18 表3-7 摘要 惯量比例 置信奇异值 相关 维数 1 2 奇异值 .742 .341 惯量 .551 .116 卡方 Sig. 解释 .788 .166 累积 .788 .954 标准差 .167 .168 2 .440 14

3 总计 a. 28 自由度 .179 .032 .699 12.583 .995 a.046 1.000 1.000 1.000 表3-8 概述行点a 维中的得分 你出行是选择的交通方式是?() 步行 自行车 电瓶车 出租车 公交车 长途汽车 高铁 火车 有效总计 a. 对称标准化 质量 .000 .056 1 . .493 2 . .543 1.026 . .291 . .543 -.788 惯量 . .028 .444 . .102 . .028 .097 .699 点对维惯量 1 . .018 .771 . .145 . .018 .048 1.000 2 . .048 .172 . .124 . .048 .608 1.000 1 . .361 .955 . .786 . .361 .271 贡献 维对点惯量 2 . .201 .045 . .141 . .201 .726 总计 . .562 1.000 . .927 . .562 .996 .056 -3.208 .000 .500 .000 .056 .333 1.000 . .464 . .493 -.326

15

图3-12 对应分析图

16

图3-13 对应分析图-初步解析

通过以上对应分析过程中,选择了研究年级与出行方式的关系,从各表图数据中可以得出,高校学生在节假日出行时,大一学生更愿意选择火车出行,大二学生更愿意选择公交车出行,大三学生更愿意选择火车出行,大四学生更愿意选择公交车作为交通方式出行,研究生则在此次调查中未参加,无法得出结论。

3.3 logistic回归分析 3.3.1 数据准备

Logistic 回归分析是对因变量为定性变量的回归分析,从模型角度出发,把 事件发生的情况定义为 Y=1,事件未发生的情况定义为 Y=0,这样取值为 0、1 的 因变量可以写为:?

17

依据输入的数据,设定各数值标签,将本地生中;0=“是”,1=“否”;选择回家中:0=“会”,1=“不会”,-3=“不满足是本地生的前提不参与调查”;回家方式中:1=“私家车”,2=“公交”,3=“出租车”,4=“长途汽车”,5=“火车”,6=“飞机”,7=“其他(需注明)”;选择原因中:1=“时间问题”,2=“价格问题”,3=“路线问题”,4=“安全问题”,5=“其他(需注明)”,如图3-14,图3-15:

图3-14 数据输入

图3-15 回归分析数据准备

18

3.3.2 SPSS操作步骤

(1)点击“分析”-“回归”-“多项logistic”,打开窗口,分别设置本地生、是否回家、选择原因作为因变量,选择回家的交通方式作为因子,如图3-16,图3-17,图3-18:

图3-16 回归分析设定1

19

图3-17 回归分析设定2

图3-18 回归分析设定3

20

3.3.3 结果分析

得到数据表格,如下: 表3-9 参数估计(1) Exp(B) 的置信区你是否为所在院校的本地(省市)学生?() 是 截距 a显著水B 标准误 Wald .000 df 1 平 .997 Exp(B) 间 95% 下限 上限 18.455094.588 7 .000 . b[回家方式=-3] [回家方式=1] [回家方式=4] [回家方式=5] [回家方式=7] a. 参考类别是: 否。 -20.25094.5850 .000 7 .000 .000 1 .997 1.605E-9 . 1 . 1.000 1.000 1.000 .000 .000 . 1 . 1.000 1.000 1.000 .000 .000 . 1 . 1.000 1.000 1.000 0 c. . 0 . . . . b. 计算该统计量时发生浮点溢出。因此,其值被设置为系统缺失值。 c. 因为此参数冗余,所以将其设为零。 表3-10 参数估计(2) Exp(B) 的置信区你节假日的时候会选择回家么?() -3 截距 a显著水B 标准误 Wald .000 df 1 平 1.000 Exp(B) 间 95% 下限 上限 1.792 13504.275 1.000 .000 . b[回家方式=-3] [回家方式=1] [回家方式=4] [回家方式=5] .000 13504.275 .000 .000 .000 1 1.000 . 1 . 1.000 1.000 1.000 .000 .000 . 1 . 1.000 1.000 1.000 .000 .000 . 1 . 1.000 1.000 1.000 21

[回家方式=7]

截距

0 c

. . 0 . . . . 20.254 14943.38

2 .000 1 .999

.000

. b

[回家方式=-3] [回家方式=1] [回家方式=4] [回家方式=5] [回家方式=7]

a. 参考类别是: 不会。

-35.9615054.60

7 3 .000 1 .998 2.397E-16 .000 13365.77

1 .000 13365.77

1 .000 13365.77

1 0 c

.000 1 1.000 1.000 .000 . b

.000 1 1.000 1.000 .000 . b

.000 1 1.000 1.000 .000 . b

. . 0 . . . . b. 计算该统计量时发生浮点溢出。因此,其值被设置为系统缺失值。 c. 因为此参数冗余,所以将其设为零。

表3-11 参数估计(3) Exp(B) 的置信区间 选择如上交通方式主要考虑的是?() -3 截距 a显著水B 标准误 Wald .000 df 1 平 1.000 Exp(B) 下限 95% 上限 2.639 7574.254 10.641 .000 . b[回家方式=-3] [回家方式=1] [回家方式=4] [回家方式=5] [回家方式=7] 时间问题 [回家方式=-3] 截距 2.365 7574.255 .000 10177.599 .000 10177.599 -19.000 0 c.000 1 1.000 .000 1 1.000 1.000 .000 . b.000 1 1.000 1.000 .000 . b8373.653 . .000 1 .998 5.603E-9 .000 . b. 0 . . . . 19.000 6679.864 -19.000 6679.866 .000 1 .998 5.603E-9 .000 . b.000 1 .998 22

[回家方式=1] [回家方式=4] [回家方式=5] [回家方式=7] 价格问题 [回家方式=-3] [回家方式=1] [回家方式=4] [回家方式=5] [回家方式=7] 路线问题 [回家方式=-3] [回家方式=1] [回家方式=4] [回家方式=5] [回家方式=7] 截距 截距 -19.000 -19.000 -38.000 0 c.000 . 1 . 5.603E-9 5.603E-9 5.603E-9 .000 . 1 . 5.603E-9 5.603E-9 5.603E-9 .000 . 1 . 3.139E-17 3.139E-13.139E-17 7 . . . 0 . . . .000 8836.630 .000 8836.631 .000 .000 .000 1 1.000 1.000 .000 . b.000 1 1.000 . 1 . 1.000 1.000 1.000 19.000 11569.865 -19.000 0 c.000 1 .999 1.785E8 .000 . b.000 . 1 . 5.603E-9 5.603E-9 5.603E-9 . . 0 . . . . .000 8836.630 .000 8836.631 19.000 11569.865 .000 .000 .000 1 1.000 1.000 .000 . b.000 1 1.000 .000 1 .999 1.785E8 .000 . b. 1 . 1.000 1.000 1.000 -19.000 0 c.000 . 1 . 5.603E-9 5.603E-9 5.603E-9 . . 0 . . . . a. 参考类别是: 安全问题。 b. 计算该统计量时发生浮点溢出。因此,其值被设置为系统缺失值。 c. 因为此参数冗余,所以将其设为零。 由上述表格可以看出:

(1)由表一、表二可以看出:人们选择的是出行方式=4,其

系数绝对值最大(-2.860);显著 0.000<0.05,具有统计意义,出行方式=4 在

23

Logistic 回归方程中最重要。出行方式=4 的系数为负值(-2.860),其含义是: 出行方式=4 是费用问题中 0=不愿意接受的负性因素,所在确定是本地(省市)学生时,有66.6%的学生会选择节假日回家,选择的交通方式也偏向于中短距离的交通工具。

(2)由表三可以看出:人们选择的是出行方式=2,其

系数绝对值最大(21.094);显著 0.000<0.05,具有统计意义,出行方式=2 在 Logistic 回归方程中最重要。出行方式=3 的系数为正值(21.094),其含义是: 出行方式=2 是耗时问题中 0=耗时长的正性因素。因为不同的考虑原因,选择回家的本地(省市)学生也会选择不同的交通工具。考虑到路线问题选择私家车的方式回家,考虑到价格问题选择长途汽车的方式回家,考虑到安全问题选择火车的方式回家,考虑到时间问题选择其他方式(注明高铁)的方式回家。 3.4 曲线估计预测法 3.4.1 数据准备

选取所在城市,交通情况,选择出行的交通方式作为主要指标,数据来自随机问卷调查所得结果,无缺失数据。

曲线估计用在因变量与自变量与一个已知或未知的的曲线或者非线性函数关系相联系的情况下,在很多情况下有两个相关的变量,用户希望用其中一个变量对另一个变量进行预测,但是又不能马上根据记录数据确定一种最佳模型,此时可以用曲线估计在众多回归模型中建立一个既简单又比较适合的模型。

首先提供多种可选择的函数模型,用户在不能明确究竟哪种模型更接近样本数据时,可以同时选择几种模型;然后,SPSS自动完成模型的参数估计,并显示F值、对应的相伴概率等统计量;最后,用户应选择具有最大的模型作为自己的回归模型,并作一些预测。

另外,曲线估计还可以直接用在时间序列的分析中。

SPSS的曲线估计模型有几种,它们是:线性模型、二次项模型、复合模型、生长模型、对数模型、三次项模型指数模型、逆模型逻辑模型,用户可以同时选择几种,然后找出最佳模型。 3.4.2 SPSS操作步骤

(1)选择“分析”-“回归”-“曲线估计”,打开对话框;

24

(2)在左侧源变量框中选择“出行交通选择方式”作为因变量,选择“所在城市”为自变量。如图:

图3-19 曲线估计设定1

其中,在所处城市值设定中,1-7设定如图:

图3-20 所出城市设定值

(3)在左侧源变量框中选择“出行选择交通方式”作为因变量,选择“学校附近交通情况”为自变量,如图:

25

图3-21 曲线估计设定2

其中“学校附近交通情况”设定值如图:

图3-21 交通情况设定值

(4)将模型框中选择多种方法进行拟合,点击“确定”。分别得出两个不同自变量

26

下的因变量结果如下。 3.4.3 结果分析

(1)以“所处城市”为自变量:

表3-12 模型描述

模型名称 MOD_1

因变量

1

你出行是选择的交通方式是?()

方程

1 线性 2 对数 3 倒数 4 二次 5 三次 6 复合a

7 幂a

8 Sa 9 增长a 10

指数a

自变量 你的大学所在城市为?() 常数

包含 其值在图中标记为观测值的变量 未指定

用于在方程中输入项的容差

.0001 a. 该模型要求所有非缺失值为正数。

表3-13 个案处理摘要

N

个案总数 18 已排除的个案a

0 已预测的个案 0 新创建的个案

0 a. 从分析中排除任何变量中带有缺失值的个案。

表3-14 变量处理摘要

变量

因变量

自变量

27

你出行是选择的交通方式是?() 正值数 零的个数 负值数 缺失值数

用户自定义缺失 系统缺失

18 0 0 0 0 你的大学所在城市为?()

18 0 0 0 0

表3-15 模型汇总和参数估计值 因变量:你出行是选择的交通方式是?() 模型汇总 方程 线性 对数 倒数 二次 三次 复合 幂 S 增长 指数 R 方 .001 .008 .019 .189 .220 .014 .033 .052 .014 .014 F .011 .126 .309 1.747 2.110 .232 .550 .882 .232 .232 df1 1 1 1 2 2 1 1 1 1 1 df2 16 16 16 15 15 16 16 16 16 16 Sig. .919 .728 .586 .208 .156 .637 .469 .362 .637 .637 常数 6.009 6.735 4.585 16.892 9.972 6.480 8.010 1.288 1.869 6.480 参数估计值 b1 -.047 -.701 4.410 -5.131 .000 .957 -.292 1.476 -.044 -.044 b2 b3 .542 -.658 .087 自变量为你的大学所在城市为?()。

28

图3-22 曲线估计绘图1

从上述图表可以得出,在所在城市为自变量,选择交通方式为因变量的情况下,得到三次、二次、线性、对数的拟合度都较好,其中三次曲线R^2=0.972最高,故用三次曲线拟合预测,其拟合方程为:

X3?0.78X2?45.827 Y=13.0862

下面对学校附近交通情况与选择出行的交通方式进行曲线拟合分析:

表3-16 模型描述

模型名称 因变量

1

MOD_2

你出行是选择的交通方式是?()

方程 自变量

1

线性

你学校附近的交通情况便利么?()

常数

其值在图中标记为观测值的变量

包含 未指定

29

表3-17 个案处理摘要

个案总数 已排除的个案 已预测的个案 新创建的个案

a

N

18 0 0 0 a. 从分析中排除任何变量中带有缺失值的个案。

表3-18 变量处理摘要

变量

因变量

自变量 你学校附近的交

你出行是选择的交通方式是?() 正值数 零的个数 负值数 缺失值数

用户自定义缺失 系统缺失

18 0 0 0 0 通情况便利么?

()

18 0 0 0 0

表3-19 模型汇总和参数估计值 因变量:你出行是选择的交通方式是?() 模型汇总 方程 线性 R 方 .045 F .750 df1 1 df2 16 Sig. .399 参数估计值 常数 4.277 b1 .683 自变量为你学校附近的交通情况便利么?()。

30

图3-23 曲线估计绘图2

由上图可以看出,交通便利情况与出行交通方式选择之间存在明显的线性关系,在交通情况便利程度高的地方,该地高校大学生选择出行的方式偏向于快速,便捷的交通工具。因此可以预测交通情况越高,选择方式越多。 3.5 主要结论

大一学生因为刚进入新学校新地区的原因,节假日会选择去较远一点的地方旅游玩耍,因为偏向于使用火车这种交通方式,而大二学生因为已经熟悉周围环境,节假日多偏向于去中短距离走亲访友或者休闲购物,因为会选择公交车作为出行方式,大三学生由于大多忙于实习,所以在市内地区来回跑,也倾向于公交车的交通方式,大四学生找到工作,许多在外省外地,在学校与工作地点之间会选择便利而且价格适中的火车座位出行方式。

因此可以在学校增加一些公交站点,或是开通直达火车站的专车,在节假日,公交车,火车应适当的增加车次,以满足更多人的出行需求。

31

4 总结

4.1 本设计的主要工作

本次设计是调查高校大学生在节假日出行的交通方式选择,观察统计的交通方式主要有:自行车、公交车、长途汽车、火车、高铁、飞机等,调查问卷设计的其他问题有:性别,年级,所在城市级别,是否为本地(省市)学生,生活费,学校附近的交通情况等问题。通过对各项影响数据进行SPSS分析,运用到了四种方法:主成分分析法,对应分析,Logistic分析,曲线估计预测法,加强了对交通运输统计与分析课程的了解,对统计知识的掌握和运用。 4.2 存在的不足

(1)在本次设计中,由于收集的数据不是很多,这就避免不了各种偶然因素的影响,数据在图表中无法明确显示其特点;

(2)在设计开始前有很多相关因素没有考虑完全;

(3)对spss的使用也还没有做到熟悉精通。可能存在未使用但是适合本例的方法。

4.3 下阶段研究需解决的问题

注意数据之间的关联关系,选择最为重要的因素进行分析,缩小范围,全国性数据太有偶然性,无法一一调查清楚,明确一个容易实现的范围,使数据分析更加准确,具体。

32

附录一 数据清单

33

附录二 问卷调查表

关于高校大学生节假日对于交通方式的选择调差

1.你的性别是?() [单选题] [必答题] ○ 男 ○ 女

2.你的大学所在城市为?() [单选题] [必答题] ○ 北京、上海、广州、深圳 ○ 香港、澳门、台湾

○ 一线城市(天津,重庆及各省会城市)

○ 二线城市(中东部地区的省会城市、沿海开放城市和经济发达的地级市)

○ 三线城市(中东部地区省域内的区域中心城市、经济条件较好的地级市和全国百强县,也包括一些西部地区的省会首府城市)

○ 四线城市(中部地区的地级市为主,也包括一些经济发达省份的相对欠发达地区) ○ 五线城市(中西部地区的地级市)

3.你所在的年级为?() [单选题] [必答题] ○ 大一 ○ 大二 ○ 大三 ○ 大四 ○ 研究生

4.你是否为所在院校的本地(省市)学生?() [单选题] [必答题] ○ 是

○ 否 (请跳至第8题)

5.你节假日的时候会选择回家么?() [单选题] [必答题] ○ 会

○ 不会 (请跳至第8题)

6.你回家时选择的交通方式是?() [单选题] [必答题] ○ 私家车 ○ 公交 ○ 出租 ○ 长途汽车 ○ 火车 ○ 飞机

○ 其他 _________________ *

34

7.选择如上交通方式主要考虑的是?() [单选题] [必答题] ○ 时间问题 ○ 价格问题 ○ 路线问题 ○ 安全问题

○ 其他 _________________ *

8.你每月的生活费是?() [单选题] [必答题] ○ 1000及以下 ○ 1000~1500 ○ 1500~2000 ○ 2000~2500 ○ 2500以上

9.用于交通出行的费用是多少?() [单选题] [必答题] ○ 50以内 ○ 50~100 ○ 100~200 ○ 200~500 ○ 500以上

10.你节假日时出行的主要目的是?() [单选题] [必答题] ○ 逛街购物 ○ 走亲访友 ○ 旅游 ○ 消磨时间 ○ 回家

11.你出行是选择的交通方式是?() [单选题] [必答题] ○ 步行 ○ 自行车 ○ 电瓶车 ○ 出租车 ○ 公交车 ○ 长途汽车 ○ 高铁 ○ 火车 ○ 飞机

12.选择该种交通方式的主要原因是?() [单选题] [必答题] ○ 方便快捷 ○ 价格合适

35

○ 安全 ○ 计划路线 ○ 朋友推荐

13.如果资金情况允许,你会选择哪种交通方式出行?() [单选题] [必答题] ○ 长途汽车 ○ 高铁 ○ 火车 ○ 飞机

○ 其他 _________________ *

14.你节假日选择不出行的主要原因是?() [单选题] [必答题] ○ 资金不足 ○ 没有目的地 ○ 缺少同行小伙伴 ○ 时间不够 ○ 喜欢宅不喜动

○ 其他 _________________ *

15.你学校附近的交通情况便利么?() [单选题] [必答题] ○ 便利(出行方式多样,选择方便) ○ 一般(出行方式较少)

○ 不便利(出行一次需要耗费大量时间)

36

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

成绩评定表

指导教师评语: 成绩 选题 (10分) 数据来源 统计方法 软件操作 (20分) (30分) (20分) 规范性 (10分) 考勤 加分项总分 (10分) (5分) 指导教师签名:

37

本文来源:https://www.bwwdw.com/article/1xn8.html

Top