云南省旅游消费影响因素分析—主成分分析方法

更新时间:2024-05-02 17:45:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

云南省旅游消费影响因素分析

小组成员:付显勇 王修平

一、背景介绍及研究的目的

旅游业是以提供服务为主的综合性服务行业,通过提供食、住、行、游、购等服务满足人们对旅游业的需求。旅游业现已成为全球经济中发展势头最强劲和规模最大的产业之一。近年来, 中国旅游业一直保持较高的发展速度, 旅游业作为国民经济新的增长点, 在整个社会经济发展中的作用日益显现。而云南作为中国的旅游大省,旅游业是其新兴支柱产业。

本文的研究对象是云南省的旅游收入,目前学术界对旅游出现了许多不同的定义,一般都是从各个角度给旅游下的定义,这样的定义多达十多种,分别描述了旅游的不同方面。另外影响旅游的因素也是不计其数,从经济状况、人口、社会结构,到目的地的旅游资源开发、两地交通、两地文化差异,以及国际游的汇率、通胀率和政治环境等诸多因素都会影响旅游。结合本次案例的实际,由于近十几年我国旅游增长主要集中在国内游方面,并且经济环境、政治环境、旅游资源优势相对稳定,本案例选取的影响因素包括以下几个方面:居民人均可支配收入、入境旅游人数、旅游接待天数、入境旅游者人均天消费额、旅游饭店数、公路里程。数据的来源均为历年的云南统计年鉴。

旅游属于奢侈品的一种,是人们在物质生活得到满足之后对于精神生活的一种追求。随着现代旅游学研究规模的不断深入,人们逐渐发现,旅游并不仅仅是一种经济现象,更多的是一种社会文化现象。旅游活动所涉及的范围之广泛都是以往任何活动都无法比拟的。随着旅游的快速发展和广泛流行,人们对旅游现象的研究逐渐由经济角度专项奖旅游作为一种复杂的社会现象来研究。这是旅游学卖出了下载的范畴,开阔了研究视野。很显然,这些人文方面的影响目前为止是很难用定量分析来进行研究的,例如我们只能研究旅游收入、人数方面的因素,而必须忽略旅游中带个人们美的感受和人文气息的熏陶,因为那些事物无法定量化研究。

二、运用EViews软件分析影响云南省旅游消费收入因素

(一)、数据的选择与处理 1、影响因素的选择

影响云南省旅游消费收入的影响因素有很多, 我们这里选取最重要的几个因素进行分析,包括旅游接待天数(X1)、入境旅游者人均天消费额(x2)、居民人均可支配收入(x3 )、入境旅游人数(x4 )、旅游饭店数(x5)、公路里程(x6)。 2、数据的收集

表1 国内旅游收入数据资料

年份 旅游收入/亿元(Y) 旅游接待天数/天(X1)人均天消费额/美元(X2)人均可支配收入/元(X3) 入境者人数/人(X4) 旅游饭店数(X5) 公路里程/公里(X6) 1040000 1001141 1131303 1303550 1000101 1100994 1999 2000 2001 2002 2003 2004 175.08 1648475 163.01 6178.68 259 102405 408 431 560 572 747 183.19 1557453 166.93 6324.64 226.36 1751459 171.2 6797.71 163604 163953 164852 166133 167050 255.00 2029803 170.22 7240.56 278.31 1603080 170.99 334.08 1911976 171.76 7643.6 8870.9 2005 2006 2007 2008 2009 386.15 2616071 170.61 9265.9 1502787 1810017 2219030 2502170 799 867 887 904 826 167638 198496 200333 203753 206028 447.10 3241139 173.76 10069.9 494.74 4004101 182.73 11496.1 594.77 4527585 187.29 13250.2 730.66 5457749 180.85 14423.93 2844902 2010 916.82 6151988 182.31 16064.54 3291532 560 209231 2011 1195.73 7501258 186.59 18575.62 3953837 563 214524

三、采用主成份法进行共线性处理。

根据样本数据得到各解释变量的样本相关系数关系如下图所示:

从上图可知,各解释变量之间的相关系数较高,旅游收入Y与旅游接待天数X1、旅游接待天数X1与旅游者人数X4、人均可支配收入X3与旅游者人数X4之间的相关系数分别为0.9806、0.9985、0.9771,均在0.9以上,所以这些解释变量之间显然存在多重共线性,而从实际上看也该存在多重共线性,与模型假设无多重共线性不符合,因而所得结果异常。

采用主成分分析法处理共线性:

各成分分析如下:

主成分分析结果如下 第1主第2主成分 成分 第3主成分 第4主第5主成第6主成成分 分 分 X1 0.425 0.423 0.432 0.424 -0.342 0.100 -0.229 -0.357 0.222 -0.273 0.237 0.164 0.141 -0.857 0.106 0.078 0.290 -0.001 -0.823 -0.477 -0.741 -0.049 0.122 0.658 特 X2 征 X3 向 X4 量 X5 X6 特征值 贡献率 累积 贡献率

0.323 0.411 5.027 0.838 0.838 0.800 0.231 0.684 0.114 0.952 0.485 -0.747 0.160 0.027 0.979 0.097 0.468 0.109 0.018 0.997 0.102 -0.004 0.020 0.003 0.9999 0.020 -0.007 0.0006 0.0001 1.000 碎石图:

各成分变量载荷图如下:

由上表结合碎石图以及载荷图可以看出,第1主成分的贡献率为83.8%,已能较好地反映6个一致指标的总体变动情况,而且根据它的特征值可以发现第2个特征值开始明显变小,碎石图在第二主成分处左右出现明显的拐弯,表中已经给出对应的特征向量,且累计贡献率大于95%,因此选取第一和第二主成分,设为Z1、Z2两大类主成分

选取各成分(变量)对主成分贡献率大于0.23的变量为主成分的组合成分,则两大主成分的表达式为:

PC1=0.425X1+0.423X2+0.432X3+0.424X4+0.323X5+0.411X6 PC2=-0.342X1+0.100X2-0.229X3-0.357X4-+0.800X5+0.231X6

对变量进行标准化处理

键入命令:GENR y1=(y-@mean(y))/@stdev(y),其余X也采用同样的方法。

得到相应的Y1 X11 X22 X33 X44 X55 X66

对标准化变量进行回归得到模型:

Y1??0.955X11-0.221X22?1.151X33?0.864X44-0.050X55?0.095X66

Z1 Z2的表达式如下:

Genr Z1=0.425*x11+0.423*x22+0.432*x33+0.424*x44+0.323*X55+0.411*X66 Genr Z2=-0.342*X11+0.1*x22-0.229*x33-0.357*x44+0.8*X55+0.231*X66

得到的数据信息如下

对新生成的主成分Z1和Z2进行相关性分析如下表:

从上表可看出,经过将六个变量整合为Z1和Z2两个主成分后,两者之间不再有明显的相关性,因此可认为该操作消除了变量之间的共线性

第一大主成分Z1由旅游接待天数X1、人均天消费额X2、人均

可支配收入X3、旅游者人数X4、公路里程X6构成,且每一类的贡

献率都在0.4左右,所以Z1几乎是这五项的等权平均,因此可以将他看成是旅游消费收入的直接影响因素

第二大主成分Z2的主要成分是旅游饭店x5,贡献率达到0.8,且他与其他成分的相关性不高,因此可以把它看成是旅游消费收入的间接影响因素

对主成分进行最小二乘估计,得出结果:

其中,修正可决系数为0.959542,整体拟合状况良好。pc1和pc2的p值均为0,表明这两个因素对y有显著影响。

5.求解标准化回归系数:

由于y 和x 都是标准化变量,所以标准化回归系数

?i?c1v1j?c2v2j=116.3136v1j-85.9048v2j(i=1,2,…,6)其中c1,c2为主成分与变量y回归后的系数,v1j,v2j为原6个变量表示前两个主成分时的系数。 最终模型中的系数bi=

SY?i,bi即为利用主成分消除共线性后,Si原变量在最终模型中的系数。SY、Si分别为Y 和Xi的标准差。 首先,将Y、X1~X6 作为数组打开, 在窗口菜单上选择Descriptive Stats \\ Common Sample,

得到各变量的均值和标准差,如下:

计算过程可以在Excel表中进行操作操作如下:

其中,?0=Y-??iXi

最终模型为:

y?-1075099.433?0.00014X1?31.74X2?0.6915X3?0.00289X4?1.073X5?0.0074X6

本文来源:https://www.bwwdw.com/article/ex1g.html

Top