多元统计课题论文

更新时间:2023-12-03 19:36:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中国各地区经济发展与环境保护的关系(基于2011年数据)

陶宽 许玉完 倪正华 许世杰 赵荣杰 朱焌

摘要:

保护环境是我国的基本国策,随着我国经济建设步伐的加快,环境保护刻不容缓。中国是制造业大国,劳动密集型产业居多,工业污染较为严重。因此,如何创造出“绿色GDP\是当务之急。

本文根据全国各省份废水、废气的排放量(中国统计年鉴2011年数据)以及八个治理工业污染的方法,运用SPSS软件,应用聚类分析和因子分析,分别对各个省份的治理情况进行排名。

关键词: 工业污染治理与经济发展 聚类分析 因子分析

一.引言:

工业污染是指工业生产过程中所形成的废气、废水和固体排放物对环境的污染。污染主要是由生产中的“三废”(废水、废气、废渣)及各种噪音造成的,可分为废水污染、废气污染、废渣污染、噪音污染。

绿色GDP能够反映经济增长水平,体现经济增长与自然环境和谐统一的程度,实质上代表了国民经济增长的净正效应。绿色GDP占GDP比重越高,表明国民经济增长对自然的负面效应越低,经济增长与自然环境和谐度越高。实施绿色GDP核算,将经济增长导致的环境污染损失和资源耗减价值从GDP中扣除,是统筹“人与自然和谐发展”的直接体现,对“统筹区域发展”、“统筹国内发展和对外开放”是有力的推动。同时,绿色GDP核算有利于真实衡量和评价经济增长活动的现实效果,克服片面追求经济增长速度的倾向和促进经济增长方式的转变,从根本上改变GDP唯上的政绩观,增强公众的环境资源保护意识。

本文遵循绿色GDP的思想,对于治理废气、废水污染八种方法的好坏进行了排

名,从而了解经济发展与环境保护之间的关系。

二.研究对象:

中国幅员辽阔,各个城市地区发展不一样,且各有特色。为了能够比较好的代表中国的普遍情况,研究各个地区经济发展和环境保护治理之间的关系,我们从统计局公布的数据中选择比较有代表性的变量,且地区也具有普遍的覆盖率和代表性。选取的变量有工业废气排放总量,工业废水排放总量,自然保护区占辖区面积比重,废气废水治理设施套数,工业治理当年投资来源总额,生活垃圾无害化处理率,家庭可支配收入,年底余额等变量。

三.描述性统计分析

(一)聚类分析:?

我们依次用系统聚类法和快速聚类法对数据进行聚类,发现用快速聚类法对数据的分类更加简洁明了,所包含的信息也刚加全面。因此,我们最后选择呈现的是快速聚类法的结果。使用快速聚类法,我们将地区按照不同的变量分别将其分为五类。最后再综合两方面的数据分组得出最后的聚类。?

【1】选择变量为平均每人家庭可支配收入,居民储蓄存款年底余额这两个变量,指定分类数为5。我们在Option选项中选择Initial cluster center(最初分类重心),ANOVA(方差分析表),Cluster information for each case(每个样品的分类信息)。得到以下分类结果。 表3-1

Initial Cluster CentersCluster315461.1613650.801平均每人家庭可支配收入(元)居民储蓄存款年底余额(亿元)31838.0815650.20223897.8036318.70422944.2623334.50514980.47267.10?

该表格表示的是最初各类的重心,也就是种子点,在这里我们将地区分为五类。

由表格我们可以读出:平均每人家庭可支配收入在每一组的重心依次为31838.08,23897.80,15461.16,22944.26,14980.47。可以看出第一组的经济是最发达的,第二组和第四组的经济较好,第三组和第五组的经济相对而言较落后。?

?

表3-2

Cluster MembershipCase Number12345678910111213141516171819202122232425262728293031

V1 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆Cluster1533535514433543332555355535555Distance1539.1888554.0324917.5101873.4581914.2353085.1051207.9063802.8911539.1882187.7473985.9763124.0735752.5362118.0943800.9812237.7001167.2661761.279.0002049.6742383.3942451.8423123.3941903.4521698.3223870.0862992.0122722.0563754.2652910.7982254.653?该表是样品的分类情况以及每个组内的距离情况。这里我们看到快速聚类法将不同地区分为这样的五类:{1:北京,上海};{2:广东};{3:河北,山西,辽宁,安徽,福建,河南,湖北,湖南,四川,陕西};{4:江苏,浙江,山东};{5:天津,内蒙古,吉林,黑龙江,江西,广西,海南,重庆,贵州,云南,西藏,甘肃,青海,宁夏,新疆}。我们可以对分类结果进行分析。第一类地区经济最为发达,第

二类地区经济稍微次之,但是居民储蓄年底余额确是很多。第四类地区经济较第二类稍微弱些,但总体也还不错。第三类地区的经济会稍微落后一些,第四类地区经济就比较落后了,年底储蓄量也是十分低的,说明生活并不是特别富裕。 表3-3

Number of Cases in each ClusterCluster123452.0001.00010.0003.00015.00031.000.000?ValidMissing该表表示了每组的分类数目:如第一组内的地区有2分在一起,第二组内有1个地区,第三组有10个地区,第四组内有3个地区,第五组有15个地区。总和正好为31个地区没有遗漏。?表3-4

Final Cluster CentersCluster316690.3910779.461平均每人家庭可支配收入(元)居民储蓄存款年底余额(亿元)30455.5116326.65223897.8036318.70423416.3721198.30515875.784032.20?该表表示的是最后各类的重心,这个表格可以结合上面的样品分类情况表一起看。可以看出第一类的平均每人家庭可支配收入比较高,而第二类的居民储蓄存款年底余额相较其他4组要高。第五类的居民储蓄存款年底余额为几组中最低的。?表3-5

Distances between Final Cluster CentersCluster12345?121040.09414840.8178560.51419071.490234521040.09414840.8178560.51419071.49026536.76015128.06233268.16526536.76012401.2546796.25615128.06212401.25418749.27833268.1656796.25618749.278?该表表示的是最后分类组之间的距离。发现两组间相差距离最小的是第三类和

第五类,仅为6796.256。第二类和第五类之间的距离是最大的,为33268.165。不同类之间的距离表示的是不同地区之间的差别。?

表3-6

ANOVAClusterMean Square平均每人家庭可支配收入(元)居民储蓄存款年底余额(亿元)129441915.6421630974.2ErrorMean Square446440014.3435782381.226dfdf2626F20.10072.916Sig..000.000The F tests should be used only for descriptive purposes because the clusters have been chosen tomaximize the differences among cases in different clusters. The observed significance levels are notcorrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means areequal.??

该表表示的是方差分析表,但是应当注意的是F值只能作为描述使用,不能根据该值判断各类均值是否有显著差异。从方差分析表可以看出,这两个变量对于分类贡献都是十分显著的。?

???

【2】选择变量为自然保护区占辖区面积比重,废水治理设施数,废气治理设施数,工业污染治理当年投资来源总额,人均公园绿地面积,生活垃圾无害化处理率这六个变量,指定分类数为五,我们在Option选项中选择Initial cluster center(最初分类重心),ANOVA(方差分析表),Cluster information for each case(每个样品的分类信息)。得到以下分类结果。 表3-7

本文来源:https://www.bwwdw.com/article/rlot.html

Top