刘群产业讨论课总结

更新时间：2024-03-31 10:26:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

刘群湖南省环保厅推荐度：
相关推荐

产业讨论课学习的方法总结与综述

刘群资环学院0816班 2012.12.30

第一次因素分解法

一、因素分解法

因素分解法是把一个目标变量的变化分解成多个组成因素的变化，从数量方面研究多种因素对目标变量的变动的影响方向和影响程度的一种分析方法。研究者把一组反映事物性质、状态、特点等的变量简化为少数几个能够反映出事物内在联系的、固有的、决定事物本质特征的因素。

传统因素分析方法

计算简便，易于掌握，内容被广泛宣传和运用，深入人心，至今仍占据因素分析理论的主导地位。不真实性（反映各因素单独变动影响），不确定性（指标计算顺序不同其计算结果不同），不一致性（反映总指标变动的相对指标等于反映各因素变动的相对指标的乘积，而反映总指标变动的绝对指标则是反映各因素变动的绝对指标的代数和）理想指数分析法计算较为简便，且克服了传统方法的不确定性缺陷。不真实性和不一致性现象在此依然存在。采用几何平均数方法，增大了计算误差，由此产生了不稳定性（即有时出现总指标变动的程度或绝对数额与各因素指标变动的程度或绝对数额在数量上不协调或不对等现象）。微积分因素分析法

克服了不确定性和不一致性缺陷，计算也较简便。它导源于高等数学理论，因而增强了因素分析理论的科学性。不能彻底克服不真实性缺陷，由于它采用对数方法处理数据，增大了计算误差，也存在不稳定性缺陷。

因素分解法按照分解方式可以分为拉氏指数分解法、迪氏指数分解法和费雪理想指数法等。其中, 迪氏指数分解法又分为数学平均迪氏分解法( AMDI)和对数平均迪氏分解法( LMDI)等。

主要概括为以下几种分析方法 1、结构分解法（SDA）

结构分解法(SDA)是从20世纪80年代以来开始逐渐得到广泛应用的，是基于投入产出表中的各部门直接消耗系数和最终需求结构加以分析。自Leontief 和Ford最先引用投入产出方法计算美国能源消费污染排放并提供能源控制政策以来, SDA( 投入产出结构因素分解法) 模型已经发展成为投入产出技术领域的一种主流经济分析工具, 被广泛用于经济增长贸易、劳动力、价格、能源和环保等多方面的经济分析研究中。很多国内外学者如Wier和Hasler[1],Alcumtara和Duarte[2],倪红福 [3],赵晓丽[4]等，都对此进行了大量的研究。核心思想：是将经济系统中某因变量的变动分解为有关各独立自变量各种形式变动的和，以测度各自变量对因变量变动贡献的大小。把经济变量按照一定的经济联系和数学规则, 将分解的因素再细化, 进而拓宽了分析的功能, 使经济分析更加透彻、方便、系统。存在的问题：测算结果惟一、因素权重可比、交互影响等。

优缺点：

此方法有明显的优势，如可以获得非常详细的行业数据，揭示部门之间的完全联系，便于展开深入的微观分析[5]。

但其缺陷和局限性也非常突出。首先因为投入产出表每五年才编制一次，所以只能用于跨期分析，而且只能进行加法分解。然后由于方法本身的原因，在分解中会产生交互项问题, 存在测算结果的不一致、因素权重的可比性不强、交互影响分解难等问题[6]。

2、指数分解法（IDA）

指数分解模式数据需求小，分解方法多样，是广大人民群众喜闻乐见的一类分解形式，经过科研工作者们多年的不懈耕耘，也相继研究出了Laspeyres, AMDI, LMDI, Fisher, AWD, Sun/Shapley等分解方法。指数分解分析最早可以追溯到1871年Laspeyres提出的以基期价格为权重的指数，主要用来解决一些经济问题，比如产品产量变化和价格变化各自对企业销售额的影响。

基本思想是把一个目标变量（如，能源消耗或二氧化碳排放量）的变化分解成若干个影响因素的组合，从而可以辨别出各个因素影响程度的大小即贡献率，确定出影响作用比较大的因素，继而根据需要把这种分解逐层进行下去，最终把各种因素对目标变量的影响区分开来。传统因素分析法（拉式、迪式指数法），理想指数分析法（费雪的理想指数公式），微积分因素分析法（函数因素分析法)，影响系数分析法。最大优点是通过对总指标的分解，找出影响总指标的各个影响因素，分析各个影响因素对总指标的影响强度，从而找出总指标呈某种变化趋势的原因，最终提出行之有效地对策建议。

20世纪80年代以来成为国际能源研究的热点问题，也是国际能源与环境政策制定中被广泛接受的方法。 ① 拉式指数法

Laspeyres方法，简称为拉氏方法，是由德国的经济学家E. Laspeyres于1864年提出的。本质上是一种基于微分的方法,其思想是假定其他因素不变，直接对各个因素进行微分,从而得出某一因素的变化引起被解释变量的变化，拉氏因素分解法有加法分解和乘积分解。这是从价格分析领域移植过来的、最为常见的一种分解方法，广泛应用于20世纪70年代末、80年代初。

这个是Laspeyres方法的双因素分析公式 T0o0L0To0 DL?XX/XX,D?XX/XXX11i2i1i2iX21i2i1i2iiiii 作为因素分解方法的开山鼻祖， Laspeyres方法提供了一种完全不同于结构分解法的新思想。但分解后所有主效应间的交互效应会构成一个无法分解的残差项，影响分解的精度针对Laspeyres方法分解后有残差项这一缺陷，Sun(1998)提出了一个完全分解模型。此模型是LM模型的扩展，它将因素间的交互效应均匀地分布到各主效应中，即实现了残差的均匀分配。

此为RLM方法应用于生态足迹时的公式

????

② 迪氏指数法( Divisia Index Decomposition)

由法国数学家Divisia 于1924年提出。其宗旨是把分解出的各个因素都看成是时间t 的连续可微函数，对时间进行微分，然后分解出各个因素的变化对被分解变量的影响[7]。

第一次改进——算术平均迪氏分解法(ADM)

ADM方法由Boyd等人于1988年提出，采用始年和末年能源消费量的平均值作为权重，并采用对数方法计算相应因素的增量。此方法的残差项虽然比Laspeyres方法的残差小了许多，但仍然存在；同时，由于公式本身的问题，无法处理数据中存在的零值和。 TT0????Xw?wji ii???,其中wi?Dxj?exp?wlni0i?X??? 2ji???? 优点：方程式要比LMDI简单。在很多情形下，AMDI经常可以替代LMDI使用，其分解结果也非常接近。

缺点：一是不能因素逆向检验，AMDI有一个很大的残余项。二是当数据集含有0值时，AMDI就不适用了。

第二次改进——对数平均迪氏指数法(LMDI)

为了解决前面的那两个问题，新加坡学者Ang等人于1998年提出了一个修正的分别基于乘法和加法的对数均值Divisia分解法(LMDI)，采用一个对数平均公式替换了之间的简单算术平均计算方法。

此方法很好地解决了残差项和零值数据的问题，同时公式简洁，是目前使用最为频繁、应用最为广泛的一种方法。 ??XT??LwiT,wi0ji??????Dx ?exp?iwiln,其中wi?T0j?X0???Lw,w?jikk???k? 对数平均迪氏指数法( Log arithmic Mean Divisia Index, LMDI) 是目前各种方法中相对更为合理的一种。可以将余项完全分解，不会出现不可解释的余项，是一种完全的不产生残差的分解分析方法。Ang B. W. 从理论基础、适应范围、应用便利性、结果表达等方面综合比较因素分解法多种形式的优劣性, 认为拉氏指数分解中残量过大会影响分解结果, 而LMDI法能够消除残差项, 并可以在加和分解与乘积分解之间建立一定关系[ 8]。

???????3、费雪指数分解(Fisher index decomposition)

安本华等人提出的修改Fisher理想指数是一种很优秀的因素分解法，它有几个与Fisher理想指数相关的很好的性质。当分解只有两个因素时，修改Fisher理想指数与经济学中的Fisher理想指数法是一样的。把修改Fisher理想指数归到Laspeyres指数法下，是因为它的公式与Laspeyres指数有一些相关。

Fisher index由Fisher与1922年提出，是指拉氏指数和派氏指数的几何平均数，主要用于对指数公式的测验，以及调和拉氏与派氏两种指数的矛盾，又被称为“费雪理想指数”。最早是由Albrecht[9]、Ang[10]等人在02~03年逐渐将其引入到指数因素分解领域。其双变量公式如下： LPLPD?DD,D?DDX1X1X1X2X2X2 但是，现在的能源和相关问题中很少是只涉及两个变量的，Liu和Ang显然也意识到了这一点。于是，在2004年他俩联合另一名学者Hyun-Sik Chung一起提出了广义费雪指数(GFI)，将处理问题的变量数推广到n个。由于此方法折衷了拉氏和迪氏两种方法，而且能很好地克服它们的缺点，因此近几年得到了越来越广泛的应用。

4、其他方法

Kaya公式法

日本学者YoichiKaya教授提出的，将CO2排放量进行因素分解，它取决与人口，人均国民生产总值，单位生产值能耗，及单位能耗排放因子，

排放=人口 x 人均GDP x 单位GDP 能源消耗量 x 单位能耗排放量 Kaya公式法的改进

测定Ci、Ei、Yi、Pi 各部分对CO2 排放总量的影响常采用微积分方法，在计算变化量和变化分解时会出现残差干扰，即等式两边不平衡，因而造成具体在分解时出现分解谬误。故将Kay a等式进行改进:

Cef表示排放强度效应影响; Eef表示能源强度效应影响; Ye f表示经济效应影响; Pef表示人口效应影响。通过这种改进可以避免等式两边产生近似误差, 从而保证Kay a等式两边平衡[11]。冯相昭、邹骥利用修改后的Kay a恒等式对1971~ 2005年间中国CO2 排放量进行无残差分解 [12] 。

美国麻省理工学院(M IT) 的J. W. Tester等人运用Kaya公式对中、日、欧、美和世界1980 ~ 1999年间的碳排放驱动因素进行定量比较分析[13]

STIRPAT模型

通过对人口、财产、技术三个因素进行分解，公式：

α为模型的系数,b、c、d为各自变量指数,e为误差

埃里奇（Ehrlich）和康默纳（Comnoner)20世纪70年代提出的对碳排放进行因素分解的常用模型,碳排放量的变化主要取决于3 方面的因素, 即人口规模、经济发展水平和用于衡量技术水平与能源结构差异的碳排放强度

IPAT公式:Environmental impact(I)=Population(P)*Affluence(A)*Technology(T) 基于投入产出的因素分解

近年来，SDA与投入产出分析相结合的方法已经用于研究经济增长因素、劳动力、价格、能源和环境等问题，是投入产出分析领域的一个新热点。采用投入产出数据可以分析各个行业单位产出的能源消费量变化、技术结构变化、最终需求各类所占比例变化以及最终需求总量变化对总的能源消费量变化的影响。 LMDI与投入产出的结合

LMDI在分解过程中将交互项完全分解，分解结果唯一且精确。投入产出分析方法能够反应部门之间消耗数量、消耗结构的特点。

首先,根据能源消耗强度定义，运用投入产出分析方法，推导出能源消耗强度与其影响因素的关系式;

然后,以能源消耗强度为被分解变量,采用LMDI 方法,构建基于LMDI 的能源消耗强度模型,通过能源消耗强度综合模型,得到能源消耗强度影响因素的分解结果;最后,根据分解结果计算各影响因素变动对能源消耗强度变动的影响程度。

结构分解法(SDA) 残差处理改进 Laspeyres RLM 算术平均 AMDI 算式简化改进 Divisia指数对数平均以微分代替简单均值 LMDI 调和拉氏与派氏 AWD 广义Fisher 派氏 Fisher指数推广至n变量因素分解方法的发展历程

应用领域：一、生态与环境二、产业三、能源消耗四、碳排放应用领域逐渐扩展，向多层次、多角度发展，涉及到产业结构、能源消费、收入差距等多方面。如能源消耗强度与利用问题，二氧化碳的排放影响因素问题，水资源利用的变动问题，经济增长与能源消耗的问题。

参考文献

[1] Wier M,Hasler B，Accounting for nitrogen in Denmark—A structural decomposition analysis [2] Alcumtara V,Duarte R，Comparison of energy intensities in European Union countries—Results of a structural decomposition analysis

[3]倪红福，贸易隐含CO2测算及影响因素的结构分解分析 [4]赵晓丽，基于SDA法的能源消费影响关键要素分析

[5]周国富等，能源消费影响因素分析——基于行业分解与地区分解之方法 [6]韩颖等，一种能源消耗强度影响因素分解的新方法 [7]韩颖等，一种能源消耗强度影响因素分解的新方法

[8] Ang B W. Decom pos ition Analys is for Pol icy M ak ing in Energy:W h ich is the PreferredM ethod? [ J] . E nergyPolicy, 2004, 32: 1131- 1139.

[9]Albrecht et al. A Shapley decomposition of carbon emissions without residuals.

[10]Ang, B.W. et al. Perfect decomposition techniques in energy and environmental analysis. [11] 赵奥, 武春友,中国CO2 排放量变化的影响因素分解研究-基于改进的Kaya等式与LMD I分解法,战略与对策，2010,24（12）

[12] 冯相昭, 邹骥. 中国CO2 排放趋势的经济分析[ J] . 中国人口#资源与环境, 2008, 18 ( 3) : 43 - 47.

[13] J W T ester et a.l Su sta inab le En ergy: Choos ing among Op tions[M ] . US: M ITPress, 2005.

第二次区域差异的衡量方法

区域差异是指经济区域之间在自然条件、经济发展现有水平以及经济发展可预期的前景等方面的差异，这种差异可能在一定条件下的相互转化。第一类，测算单个经济指标的地区差异。

衡量单个变量极值差异的主要方法有：极值差幅(即经济指标最大值与最小值之差额)、极值差率(即经济指标最大值与最小值之比率)、极均值差幅(即经济指标最大值与平均值或平均值与最小值之差额)、极均值差率(即经济指标最大值与平均值或平均值与最小值之比率)、相对差距系数(即最大值与最小值之差额除以最大值)。分析样本观察值离散趋势的主要方法有：相对平均离差、加权平均离差、变异系数、加权变异系数、对数变异系数等。这些指标均大于或等于零，当系数等于零时，表示最大的平等，系数值越大，表明地区间差异越大。

第二类，比较两个经济指标的地域分布。

研究双变量地区差异，就是比较两个经济指标的地区分布，这种方法通常又可以分为两种类型：一是单一效果系数，二是可分解系数。最直接的方法，其指标很多，其中以基尼系数的应用最为广泛，它是在洛伦兹曲线(M.o.Lrenz，1905)的基础上发展起来的。此外单一效果系数还包括两变量的平均离差、两变量的标准差和地理联系率等。（一）变异系数法[1]。

变异系数是指总体中单位样本值变异程度的相对数，是绝对差异与平均值之比，因为在标准差的基础上进行计算的一个统计指标，所以也被称为标准差系数。标准差是样本中的各变量值与其均值的离差平方的平均值的算术平方根，它能精确反映个地区经济指标的离散程度，各地区经济指标绝对差距越大，标准差也就越大。变异系数在标准差的基础上，考虑到每组样本基数大小不同，为了剔除由于基数大小不同造成的影响，因此变异系数是以样本标准差除以样本平均值，其计算公式为：

CV??X,???i?1n(xi?x)2n

其中，n为样本数量，xi表示i地区的样本值，x表示样本的平均值，?表示标准差，该指标运用了所有地区的数据，因此所包含的信息量较为充分。实际运用中一般使用加权变异系数也叫威尔逊系数[2]。其公式为：

1? Vu?x?(xi?x)2pi ?pi?1n式中：xi,x?,pi,p分别是i地区人均GDP、背景区域人均GDP、i地区人口和背景区域总人口。Vu越大，不平衡性就越大。（三）基尼系数法[3]。 1.基尼系数计算的通式

基尼系数是在洛伦兹曲线的基础上总结出的测量收入距的指标。洛伦兹曲线(图1)原本用于衡量收入和财富分配的不平等程度，现在已经广泛应用于衡量收入分配、地区差异、产业集中度等领域。

Y E 收入累计比 C A B O 人口累计比例 X 图1

基尼系数以洛伦兹曲线为基础，由基尼系数的定义推导出来，它是洛伦兹曲线与对角线之间的面积A与对角线以下的面积(A+B)之比，即：

G?A

A?B公式虽然简单，然而在实际计算中却难以运用，因此经济学家和统计学家们提出了各种变形公式，使其更具实际操作性。目前，国内经济学界通常采用的基尼系数计算方法为：

????j?1i?1nnYjt?Yitn2,0???2u （1）

u??Yi?1nitn (2)

式中，?是基尼平均差，Yjt?Yit是任何一对收入样本差的绝对值，Yjt为某一省区第t年的某一指标，n是样本容量，u是总样本某指标的均值。则定义：

?,0?G?1 （3） 2u由（1）、（2）、（3）综合得出基尼系数的计算方法：

G?1nnY?Yit G?2??jt2nuj?1i?12.基尼系数的分解

分解法是在求出上述值的基础上，力图研究基尼系数的构成因素，除了得出

总的基尼系数的信息之外，在计算过程中还能够获得分解部分内部的基尼系数值。分解法并不是独立计算基尼系数的方法，它更重要的意义在于对基尼系数的分解，即定义的各个不同基尼系数值之间的相互关系。

例如，用分解法来测算城乡收入分配均衡情况。经济学家Sundrum（1990）在他的《欠发达国家的收入分配》一书中介绍了一种对一国或地区基尼系数进行分解的方法，其数学公式为：

G?p12u1u?u2u2G1?p2G2?p1p212 u2uu 式中，G表示总体基尼系数，G1和G2分别表示农村和城镇的基尼系数，P1、P2分别表示农村人口和城镇人口占总人口的比重，u1、u2、u分别表示农村、城镇和总体的人均收入。

这种方法会在可能在两个环节产生误差：一是用其他方法估计城乡各自的基尼系数G1和G2时，可能产生误差；二是城乡收入分布一般会在不同程度上重叠。

基尼系数为0时，表示收入分配绝对平等；基尼系数为1时，表示收入分配绝对不平等。按照联合国有关组织规定：基尼系数若低于0.2表示收入绝对平均；0.2-0.3表示比较平均；0.3-0.4表示相对合理；0.4-0.5表示收入差距较大；0.5以上表示收入差距悬殊。经济学家们通常用基尼指数来表现一个国家和地区的财富分配状况，并把0.4作为收入分配差距的“警戒线”。

（五）泰尔系数法

1nyG?log?y泰尔指数基本公式：

ni?1iG?Iw?Ib

指数分解为组间和组内差距，其分解公式为：

Ng?yg?GNg1yG??loglog?????yi?ygg?1N??i?SgNg?g?1NG

N为样本总数，将样本分为G组，Ng为第g组的样本个数，yg为第g组的收入均值，

yi为第i个样本的收入。

泰尔在20世纪50年代和60年代分别提出了两个计算公式:泰尔U系数和泰

尔T系数。其计算公式分别为：

?(xU?i?yi)2nyin22x?i?n

U值在0～1之间变动，若为0，表示完全平等；若为1，表示完全不平等。

yiyT??log ，xyii?1xnyiy??yii?1n，

x??xi

i?1n其中，n为地区数量，xi是按各地区人均收入的份额从低到高的顺序排列的，

yi为各地区的人均收入。T值在0～logN之间变化。若T值为0，表示最大平等;若为logN，表示最大不平等。

由于泰尔T系数具有可分解性，不仅能判断整体差异水平，还可以区分组内差距和组间差距，并分析二者对整体差距的贡献，另外由于其涉及对数运算，可选用不同正数作底，其结果只具有相对意义，因此实际操作中多利用泰尔T系数分解后的计算公式：

n?mYijYiTn?T?T??Yilog????Yilogpii?1?piji?1?j?1*n??? ?Tn、T*、T分别表示总体区域差异、地带间的差异、地带内的差异，i表

示地带，n为总的地带数，j为地带内子区域，Yi表示第i地带的GDP占全国GDP的比重，Pi表示第i地带人口占全国总人口的比重，Yij表示第j省GDP在第i地带GDP中所占比重，Pij表示第j省人口在第i地带人口中所占比重。

（1）不加权的变异系数与加权变异系数应用对象单变量（加权变异系数可用于双变量）优点与主要作用计算简单，不用排序。反映某一指标在不同空间的变异程度或某一指标在同一空间的不同时间指标数列的变异程度缺点不能反映引起差异的原因；不能反映各阶层指标的变动情况；没有数量界限的测度标准

（2）差异系数单变量计算简单，不用排序。反映对象数据与标准数据间的差异程度不能反映引起差异的原因；不能反映各阶层指标的变动情况；没有数量界限的测度标准计算量大；由于存在多条洛伦兹曲线相交的情况，不同形状的曲线可能产生相同的基尼系数，即相同的基尼系数可能对应人不同的收入分配状况不能反映引起差异的原因，计算量大；不能测度出区域之间差异所处的状态计算量大（需要找出样本出现的比率）；能反映各阶层指标的变动情况（3）基尼系数（分解、不分解的）单、双变量有一个数量界限的测度标准，较易测度出区域之间居民收入分配所处的状态（分解后可以反映各阶层差异情况）（4）泰尔指数（分解、不分解）单变量具有可分解性，不仅能判断整体差异水平，也可以区分区组内差异和组内差异；有一个数量界限的测度标准具有可分解性，不仅能判断整体差异水平，也可以区分区组内差异和组内差异；有一个数量界限的测度标准；不同时间空间的系数值可以直接对比计算方便；具有可分解性，发现导致不平衡性变化的原因；计算简单；反映总体差异（5）余期望系数单、双变量（6）库兹涅茨比率双变量（加权、不加权）（7）地理联系度双变量没有数量界限的测度标准；不能反映出不同区域间的差异没有数量界限的测度标准；不能反映出不同区域间的差异；不能反映出引起差异的原因；阿特金森指数阿特金森指数是测度收入分配不公平指数中明显带有社会福利规范看法的一个指数。阿特金森指数首先计算出一个等价敏感平均收入ye(ye定义为如果每个人享受到了这样一个等价敏感收入时的社会总福利,相当于收入实际分布时具有的社会总福利值)。yε可由下式计算得出:

其中yi为第i人(或组)的实际收入(总收入);f(yi)为第i人(或组)占总人口比例的密度函数;ε为不平等厌恶参数。该参数反映社会对于不平等的厌恶(或对平等的偏好)程度,其取值范围是0<ε<+∞,随着ε的增加,社会给予更大的权重给收入相对较低的人群。比较典型的ε权重有0.5和2。

在定义了yε后阿特金森指数可以表示为:

其中μ为平均收入,从该指数可以看出:社会收入分配越公平,则yε越接近μ,阿特金森指数值也就越小;对于任何分布而言,阿特金森指数值的取值范围为[0,1],其中0代表社会达到了收入的完全公平分配。

阿特金森指数完全符合判断收入分配不公平程度测定指数优良的五条公理性原则。

参考文献：

［1］吴睿,《中国西部省际经济差距变化研究》，西北工大 [2]吴殿廷，《区域分析与规划高级教程》高等教育出版社 [3] 冯海峰，《区域经济差距的分析方法》北京交通大学

第三次时序全局主成分分析

主成分分析（Principal Component Analysis，PCA），将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。在实际课题中，为了全面分析问题，往往提出很多与此有关的变量（或因素），因为每个变量都在不同程度上反映这个课题的某些信息。主成分分析首先是由K.皮尔森对非随机变量引入的，尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。

主成分分析(PCA) [1]是利用降维的思想，在信息损失较少的前提下把多指标转化为少数几个综合指标的多元统计分析方法。该方法的重点就是通过主成分分析，选择若干主成分，基于主成分的方差贡献率构建权重，从而构造综合评价函数。而时序全局主成分分析[2] 是全局主成分分析和时序分析的结合，把同样的经济指标数据按年份从上到下排成时序立体数据表，在对其进行经典主成分分析的基础上，以一个综合变量来取代原来的原始数据，再以此为基础描绘出系统的总体水平的变化轨迹 [3]。

论文例子：选取中部六省2005—2009年的地区生产总值、第一产业增加值、第二产业增加值、第三产业增加值、人均地区生产总值、工业增加值、固定资产投资、社会消费品零售总额、地方财政一般预算收入、城镇居民人均可支配收入、农村居民人均纯收入等11个指标

数据，利用时序全局主成分分析方法动态描绘中部六省2005-2009年的经济发展历程。 1. 指标数据标准化（SPSS软件自动执行），为了消除量纲的影响；

2. 通过SPSS软件对标准化后的数据进行分析计算，得到前两个特征值及累计贡献率； 3. 确定主成分个数为2个，计算其累计方差贡献率分析； 4. 确定主成分Fi表达式； 5. 计算主成得分Fi命名；

6、时序分析是通过图像法直接观察数据点的相对位置的变化，从而得到分析数据的运动规律及其结构变迁的一种常用方法。为了更好的说明问题，主要做了三个方面的时序变化图。

参考文献：

[1]王国梁，何晓群．多变量经济数据统计分析[M]．西安：陕西科学技术出版社，1993

[2]任若恩，王惠文．多元统计数据分析一理论、方法、实例[M]．北京：国防工业出版社，1997

[3]乔峰，姚俭．时序全局主成分分析方法在经济发展动态描绘中的应用[J]．数理统计与管理，2003，22(2)：1—5

[4]冯建中。何先平，时序全局主成分分析在中部六省经济发展评价中的应用，宜春学院学报，

2011,33（12）

第四次数据包络分析

1978年由著名的运筹学家A.Charnes (查恩斯)，W.W.Cooper(库伯)和E.Rhodes(罗兹) 首先提出了数据包络分析（Data Envelopment Analysis，简称DEA）的方法，去评价部门间的相对有效性（因此被称为DEA有效）。

数据包络分析(data envelopment analysis，DEA)

是一个对多投入\\多产出的多个决策单元的效率评价方法。 DEA是使用数学规划（包括线性规划、多目标规划、具有锥形结构的广义最优化、半无限规划、随机规划等）模型，评价具有多个输入、特别是多个输出的“部门”或“单位”（称为“决策单元”，简记DMU）间的相对有效性（称为DEA有效）。以“相对效率”概念为基础, 以凸分析和线性规划为工具, 根据多指标投入和多指标产出, 对相同类型的单位( 部门) 进行相对有效性或效益评价的一种新的系统分析方法。

根据对各DMU观察的数据判断DMU是否为DEA有效，本质上是判断DMU是否位于可能集的“生产前沿面”上。

这类组织例如学校、医院、银行的分支机构、超市的各个营业部等，各自具有相同（或相近）的投入和相同的产出。评价同类型单位( 又称/ 决策单元) 之间的相对有效性, 评价指标中可以包含人文、社会、心理学等领域中的非结构化因素, 各指标的量纲一般不相同, 也可以使用无量纲指标[1]

他们的第一个模型被命名为CCR模型。从生产函数角度看，这一模型是用来研究具有多个输入、特别是具有多个输出的“生产部门”同时为“规模有效”与“技术有效”的十分理想且卓有成效的方法。

1984年 R.D.Banker,A,Charnes和W,W,Cooper给出了一个被称为BCC的模型。1985年Charnes,Cooper和 B,Golany，L.Seiford,J.Stutz给出了另一个模型（称为CCGSS模型），这两个模型是用来研究生产部门的间的“技术有效”的。

1986年Charnes，Cooper 和魏权龄为了进一步地估计“有效生产前沿面”，利用Charnes, Cooper和K.Kortanek于1962年首先提出的半无限规划理论，研究了具有无穷多个决策单元的情况，给出了一个新的数据包络模型——CCW模型．

1987年Charnes, Cooper，魏权龄和黄志民又得到了称为锥比率的数据包络模型——CCWH模型。这一模型可以用来处理具有过多的输入及输出的情况，而且锥的选取可以体现决策者的“偏好”。灵活的应用这一模型，可以将CCR模型中确定出的DEA有效决策单元进行分类或排队等等。这些模型以及新的模型正在被不断地进行完善和进一步发展。 1、评价决策单元技术和规模综合效率的C2R模型设有n个同类型的企业（也称决策单元），对于每个企业都有m种类型的“输入”（表示该单元对“资源”的消耗）以及p种类型的“输出”（表示该单元在消耗了“资源”之后的产出）。N个决策单元

这n个企业及其输入-输出关系如下：

hj??uyr?1mrprj?vxi?1ij=1,2,…,n

ij在DEA中一般称被衡量绩效的组织为决策单元（decision making unit——DMU）。设：n 个决策单元（ j = 1，2，…，n ）每个决策单元有相同的 m 项投入（输入）（i = 1，2，…，m ）每个决策单元有相同的 p 项产出（输出）（r = 1，2，…，p ）

Xij ——第 j 决策单元的第 i 项投入 yrj ——第 j 决策单元的第 r 项产出

而第j0个决策单元的相对效率优化评价模型为：

maxhj0?pr?uyr?1mrprj0?vxi?1irjij0?uyr?1m

（1）

?1,j?1,2,...,ns.t. ? vixiji?1

v,u≥0, i=1,2,…,m;

上式为分式规划问题(C2 R 模型) 2、BCC模型

模型假设有n 个决策单元DMUj ( j = 1, 2, ,,n) , 每个决策单元都有m 种类型输入和s 种类型输出, 用x ij ( x ij > 0; i = 1, 2, ,, m) 代表第j 个决策单元DMUj 第i 种输入的投入量, 用y rj ( y rj > 0; r = 1,2, ,, s) 代表第j 个决策单元DMU j 第r 种输出的产出量, 记X j = ( x 1j , x 2j , ,, x mj )T, Yj = ( y1 j , y 2j ,,, y sj ) T 。引入了非阿基米德无穷小量E、投入松弛变量S- 和产出松弛变量S+ 后, 第j 0 个决策单元的BCC 模型如下:

当纯技术效率为1 时表示该单元达到技术有效, 即科技活动处于最佳的生产状

态下, 科技产出相对于科技投入达到了最大化; 当纯技术效率小于1 时表示该单元未达到技术有效, 科技活动偏离了最佳生产状态, 非技术有效。当规模效率为1 时表示该单元达到了规模有效, 即科技活动的投入恰到好处, 既不偏大也不过小, 科技活动的规模报酬正处于由递增到递减之间临界点的最佳状态; 当规模效率小于1 时表示该单元的科技活动正处于规

[2]

模报酬递增或递减的阶段, 非规模有效。

白雪，张明斗借助于DEA －BCC 模型，以全国31 个省份为研究对象，对其纯技术效率、规模效率和综合效率进行测算，并对非DEA 有效单元进行投影求出有效目标值。根据实际情况分析找到建议促进区域经济发展效率的提高[3]。

3、锥比率的数据包络模型——CCWH模型

1987年查恩斯，库伯，魏权龄和黄志明又得到了称为锥比率的数据包络模型——CCWH模型。这一模型可用来处理具有过多的输入及输出的情况,而且锥的选取可以体现决策者的“偏好”。灵活地应用这一模型，可以将CCR模型中确定出的DEA有效决策单元进行分类或排队。

数据包络分析是一种非参数的统计分析的新方法. 考虑到现有的具有多个独立子系统的YMK -DEA 模型不能体现决策者的偏好, 建立了体现决策者偏好的锥比率C2WH-YMK 模型, 并将它应用于中国制造业发展效率评价的研究中。 4、CCGSS 模型，也称为加法模型

CCGSS 模型，也称为加法模型，由Charnes A、Cooper W W、Golany B、Seiford L、Stutz J

等人提出（取上述五人名字首字母命名该模型），是DEA（数据包络分析）模型中一种适合评价技术有效性和规模有效性的分析方法，通过数学模型来对各决策单元间的相对效率进行比较，对具有多个输入变量和输出变量的复杂系统的效率指标进行分析。

耕地资源的投入产出恰恰是一个具有多种输入与输出的复杂系统。耕地的有效利用是以区域耕地资源科学配置和优化为前提，在有限的耕地面积上合理增加相关生产要素的投入(数量适宜且结构协调)，从而最大限度地挖掘耕地利用潜力并提高耕地利用的综合效益，而建立C2GS2 模型恰恰可以从定量的角度，对耕地资源的利用效率进行直观的评价。 5、窗口分法

采用魏权龄在《DEA 方法与模型的应用—— 数据包络分析( 三) 》中运用的窗口分法，将文章的数据分成3个窗口，窗口跨度为3年，其中窗口1为2005～2007年的数据，窗口2为2006～2008年的数据，窗口3为2006～2007年的数据。投入指标的选择: ( 起降架次、固定资产投资额和从业人员数)

产出指标的选择: ( 旅客吞吐量、货运吞吐量、消费品零售总额和进出口额)

使用DEA 窗口分析法从区域资源整合的角度考察除涟水机场外的七个江苏民用机场临空经济的运行效率，样本时间段为2005～2009年。实证研究的结果表明江苏七个民用机场临空经济的资源配置效率，从北到南呈现阶梯形上升状况: 其中无锡机场效率最高，对外贸易是其主要优势；南京和常州机场效率。其次，良好的机场运输业务和经济和谐无偏废的发展是他们各自的优势；徐州和连云港机场效率最低，对外贸易是制约他们的主要因素。研究成果可为各机场发展临空经济，优化资源整合提供参考。

区域资源整合视角下临空经济的效率X——基于DEA 窗口分析法和灰色预测的江苏临空经济区的实证研究，史普润, 江可申, 魏洁云

参考文献：

[1]潘雄锋. 东北老工业基地科技创新绩效分析[ J] . 科技与经济, 2005( 2) . [2]李莉, 毛加强基于BCC 模型的中国西部地区科技创新绩效分析，统计与信息论坛，2011，26（5）

[3]白雪，张明斗，基于BCC 模型的区域经济发展绩效评价研究，商业研究，2012 魏权龄.数据包络分析（DEA）[M].北京：科学出版社，2004:1-51.

DEAP

deap 2.1软件分析过程及结果解释：

第一步，设置参数，变量及选定所用模型

下述：16为DMU个数，即总体样本个数；1为面板数据中的年限，如果做横截面数据，就写1，面板数据则写选取的时序个数（如年数）；4，3分别为产出指标、投入指标个数（在编辑EG1。DTA文件时，产出指标放前面）；0表示选取的是投入主导型模型，1表示产出主导型，二者区别不大，关键结合问题选取，一般选投入主导型；crs表示不考虑规模收益的模型即C^2 R模型，vrs表示考虑规模收益模型即BC^2模型；最后是内部算法，一般选0就可以。

eg1.dta DATA FILE NAME eg1.out OUTPUT FILE NAME 16 NUMBER OF FIRMS

1 NUMBER OF TIME PERIODS 4 NUMBER OF OUTPUTS 3 NUMBER OF INPUTS

0 0=INPUT AND 1=OUTPUT ORIENTATED 1 0=CRS AND 1=VRS

0 0=DEA(MULTI-STAGE), 1=COST-DEA, 2=MALMQUIST-DEA, 3=DEA(1-STAGE), 4=DEA(2-STAGE)

第二步，结果解释：

1、效率分析EFFICIENCY SUMMARY: firm crste vrste scale

四列数据分别表示：firm样本次序；crste不考虑规模收益是的技术效率（综合效率）；vrste考虑规模收益时的技术效率（纯技术效率）；scale考虑规模收益时的规模效率（规模效率），纯技术效率和规模效率是对综合效率的细分；最后有一列irs,---，drs,分别表示规模收益递增、不变、递减。 2、 SUMMARY OF OUTPUT SLACKS、SUMMARY OF INPUT SLACKS分别表示产出和投入指标的松弛变量取值，即原模型中的s值。 3、SUMMARY OF PEERS:

表示非DEA有效单元根据相应的DEA有效单元进行投影即可以实现相对有效。后面有相应的权数SUMMARY OF PEER WEIGHTS。

4、SUMMARY OF OUTPUT TARGETS、SUMMARY OF INPUT TARGETS 为各单元的目标值，即达到有效的值，如果是DEA有效单元则是原始值 5、FIRM BY FIRM RESULTS即针对各个单元的详细结果 original value 表示原始值；

radial movement表示投入指标的松弛变量取值，即投入冗余值； slack movement 表示产出指标的松弛变量取值，即产出不足值 , projected value达到DEA有效的目标值。

第三步，针对各结果，进行分析，如效率分析、投入冗余产出不足分析、投影分析等

第五次面板数据

面板数据（panel data）也称平行数据，或时间序列截面数据（time series and cross section data）或混合数据（pool data），是指在时间序列上取多个截面，在这些截面上同时选取样本观测值所构成的样本数据。面板数据从横截面上看，是由若干个体在某一时刻构成的截面观测值，从纵剖面上看是一个时间序列。面板数据用双下标变量表示。例如

yi t, i = 1, 2, …, N; t = 1, 2, …, T

表示在横截面i时间t上取值。N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变，yi . ( i = 1, 2, …, N)是横截面上的N个个体截面数据序列；若固定i不变，y. t (t = 1, 2, …, T)是纵剖面上的一个时间序列（个体）其有时间序列和截面两个维度，当这类数据按两个维度排列时，是排在一个平面上，与只有一个维度的数据排在一条线上有着明显的不同，整个表格像是一个面板,所以把panel data译作“面板数据”。但是,如果从其内在含义上讲,把panel data译为“时间序列—截面数据” 更能揭示这类数据的本质上的特点。也有译作“平行数据”或“TS-CS数据（Time Series - Cross Section）”。

这种数据具有如下优点: ( 1) 面板数据可以很好地容纳、控制不可观测的个体单元集之间的

异质性、动态性。( 2) 面板数据充分利用了时间段和截面单元的信息, 给出了更多的变量、数据信息、自由度, 从而减少了变量之间多重共线性的产生, 使估计结果更加有效、稳定、可靠。( 3) 面板数据可以将不同时间点上的经历和行为联系起来, 表明不同个体的截面数据是如何随时间的变化而变化的, 能够更好地研究数据的动态矫正。( 4) 面板数据可以研究不断变化的个体类型。( 5) 面板数据模型可以构造和检验比纯时间序列和截面数据更为复杂的行为模型,如技术的有效性。( 6) 面板数据模型可以给出较纯时间序列和截面数据更好的预测。林谦，面板数据的模型建立和检验分析，统计与信息论坛，2006,21（5）

最常见的面板数据有以下几类[ 2] : 平衡的面板数据: 这种数据结构的个体在所有的时间段上都是相同的; 不平衡的面板数据: 在每一个时间段上, 都有旧的个体退出, 新的个体进入, 即每一个时间段上个体的数目都不相同; 旋转的面板数据: 每一个时间段上更新相同数目的样本; 伪面板数据。[ 2] HSIAO, CH ENG. Analysis of Panel Data[M] . New Yor k: Cambr idge University Press, 2003: 20- 24.

面板数据可用固定效应(fixed effect) 和随机效应(random effect) 估计方法,即如果选择固定效应模型,则利用虚拟变量最小二乘法(LSDV) 进行估计;如果选择随机效应模型,则利用可行的广义最小二乘法(FGLS) 进行估计(Greene ,2000) 。

单位根检验：在进行时间序列的分析时,研究者为了避免伪回归问题,会通过单位根检验对数据平稳性进行判断。但对于面板数据则较少关注。随着面板数据在经济领域应用,对面板数据单位根的检验也逐渐引起重视。面板数据单位根的检验主要有Levin、Lin 和Chu 方法(LLC 检验) (1992 ,1993 ,2002) 、Im、Pesaran 和Shin 方法( IPS 检验) (1995 ,1997) 、Maddala 和Wu 方法(MW检验) (1999) 等。

协整检验：协整检验是考察变量间长期均衡关系的方法。在进行了各变量的单位根检验后,如果各变量间都是同阶单整，那么就可以进行协整检验了。

一般的顺序是：先检验变量的平稳性,当变量均为同阶单整变量时,再采用协整检验以判别变量间是否存在长期均衡关系。如果变量间存在长期均衡的关系,我们可以通过误差修正模型(ECM) 来检验变量间的长期因果关系;如变量间不存在协整关系,我们将对变量进行差分,然后通过向量自回归模型(VAR),检验变量间的短期因果关系。

本文来源：https://www.bwwdw.com/article/ok1r.html

相关文章：

正在阅读：

刘群产业讨论课总结03-31

Matlab常见函数汇总09-20

2011年高考生物复习教案：第19讲人体的稳态（人教版）0312-24

MATLAB符号运算练习题03-25

四奥第2讲巧填运算符号10-18

实验一 MATLAB数值与符号运算10-04

签证管理办法（执行版）07-06

双人座巡逻车游乐设施项目可行性研究报告（发改立项备案+2013年最新案例范文）详细编制方案01-14

再不敢用尽全力的随笔11-20

4工程签证管理流程05-15

上一篇：上海市真如城市副中心启动区A6地块1融资投资立项项目可行性研究下一篇：创业计划书（改）