对中国农村医疗保健人均消费支出的函数性数据分析

更新时间:2024-06-05 08:06:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

经济函数性数据分析论文

对中国农村医疗保健人均消费支出的函数性数据分析

对中国农村医疗保健人均消费支出的函数性数据分析

摘要:近年来随着我国经济实力的提升,农村地区的经济发展水平也越

来越高,人民的物质生活水平得到的极大地提升,而医疗支出则是关系到居民的身心健康,随着国家政策的完善以及居民对医疗卫生的越加重视,农村地区的医疗保健支出也在稳中上升,本文从函数性数据分析角度选取了2004-2014年间全国31个省市自治区的农村医疗保健人均消费现金支出进行了分析。运用聚类方法对31个省市自治区进行分类,并从医疗保健出发分析当前的政府医疗政策,为农村医疗建设提出建议。

关键词:农村医疗保健;函数性数据分析;K-Means 聚类分析;MATLAB

一、 背景介绍

医疗保健属于公共产品和公共服务范畴, 供求关系比较特殊。它是居民的基本生活需求,是保障劳动力持续性的基础,有利于促进经济、社会的稳定发展,长期以来医疗保健作为重要的消费行为,给家庭、个人带来较大压力。近年来, 我国居民的医疗保健消费水平有了较大的提高, 在医疗保健的计量研究文献中, 医疗保健消费常被列入居民消费结构中的一类消费品进行讨论。在本文中,不同地区的农村医疗保健支出对应一个时间序列数据,就目前的研究文献来看,函数性数据分析方法的研究虽然在国外已经取得了丰硕的成果,但总体来看还处于起步阶段。且很少用于经济数据的分析。本文对于农村医疗保健支出这一函数性数据运用函数性聚类方法研究

其地区分类情况,为此首先对数据进行了预处理,将离散的观测数据转化为函数数据,并将处理后的数据应用于聚类分析,基于MATLAB编写程序,对31个省市自治区的农村医疗保健人均消费支出进行函数性K-Means 聚类分析。 二、 数据选取

本文使用国家统计局(http://www.stats.gov.cn/)中20004-2014年各地区农村医疗保健人均消费支出的调查数据,该数据为时间序列数据以及横截面数据相结合的面板数据。 三、 实证分析 1.

函数性数据的预处理

1.1 函数性数据预处理的理论原理

在统计研究中所得到的数据往往是离散性的数据,这需要寻找自变量时间 t 与因变量 X 之间的函数关系X=X(t)。但由于抽查的数据往往存在一定误差,因此并不要求X=X(t) 经过所有的时间点,而只要求在给定点????上的误差????=???????????,??=0,1,2?按某种标准最小。即对离散性数据进行修匀处理(光滑处理)。下面利用B样条基函数做曲线拟合以及最小二乘法解决这个问题。

首先选取B样条基函数????{??},??=1,2,?,??,则函数X{??}的估计X{??}=∑????=1????????{??},这样做有利于对拟合的曲线求一阶或高阶导数。例如,医疗消费指出的速度变化(一阶导数)曲线和加速度变化(二

????{}{}阶导数)曲线。即有??????{??}=∑??????????。其中??????表示该??????=1

函数的m阶导数。B样条基适用于非周期性函数数据修匀处理。它从

Bernstein基函数构造的Bezier曲线存在的问题出发,拓展了Bezier 曲线。利用B样条基对数据进行处理的光滑曲线的次数不受样本大小的限制,是低阶次曲线,且能更好的逼近数据点。

其次,还要确定基展开式中的系数????,??=1,2,?,??,利用最小二

????

∑∑乘法准则,即:‖??‖2=min?[??{??}??2??=1????????{????}] ??=1

2

令‖??‖2则转化为求多元函数的极小值点,问题2=??{??1,??2,?????},由多元函数极值的必要条件,由1.2 对数据进行预处理

利用上述方法,我们对 2002-2012 全国各地区城镇居民生活消费人均现金支 出进行分析,利用 MATLAB 编写的绘图函数绘图。

图1显示了我国31个省市的农村居民人均医疗保健支出的变动情况,从图中可以看出2004年至2014年31个省市自治区的农村居民人均医疗保健支出整体呈上升趋势,不同地区医疗保健支出的上升幅度稍有差异。而在2014年整体都有稍微下降的趋势。

结合图2可以看出,31个省市自治区农村居民医疗保健变动速度曲线在2012年前基本都位于绝对零线之上,变动的方向一致,医疗保健支出整体呈增长趋势,但增长速度大小均有不同。而在2012年后呈现两种变化,增长速度有正有负,其中新疆地区的医疗保健支出仍出现明显的增长趋势,而北京、内蒙两地的医疗保健支出出现下降趋势,且北京地区下降速度最大。

图1:人均医疗保健支出变动情况

??????????

=0确定????,??=1,2,?,??的值。

图二: 人均医疗保健支出增速变化情况

表1:2004-2014中国31省市自治区农村居民人均医疗保健现金支出(元)

北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 2004 507.6 177.1 116 84.2 154.5 145.2 161.2 131 424.5 163.2 326.1 91.9 136.4 110.3 155.9 95.2 110.7 124.1 153.2 83.6 86.6 115.3 117.4 47.2 87.7 28.9 118.1 85.3 126.6 186.9 142 2005 504.2 179.18 134.77 102.9 176.44 233.53 193.57 253.52 561.72 198.56 415.63 133.68 154.03 154.68 188.48 123.41 135.37 168.19 203.85 123.39 93 142.65 144.45 71.79 122.33 44.44 165.82 113.96 152.33 198.84 169.28 2006 575.8 263.24 166.34 142.66 232.76 267.86 256.28 253.84 549.44 232.3 459.39 165.02 162.26 159.14 221.8 140.55 172.44 196.54 197 123.91 110.92 159.68 160.31 76.76 138.16 54.37 195.61 127.35 192.77 187.6 189.69 2007 629.56 306.19 188.06 170.85 281.46 265.01 311.37 272.49 571.06 263.85 452.44 177.04 174.12 167.71 230.84 173.19 178.77 219.95 199.31 149.01 95.55 168.57 174.75 79.31 167.92 50 222.51 149.82 229.28 239.4 210.69 2008 709.44 301.06 219.32 210.32 320.62 283.37 380.71 351.05 697.11 290.93 532.06 199.44 197.85 205.68 280.49 215 210.36 244.17 259 154.32 123.82 197.15 209.22 96.38 181.97 53.84 251.23 164.72 270.06 318.77 244.59 2009 867.87 299.79 289.27 240.94 416.87 409.64 511.5 434.25 738.94 322.99 609.07 227.1 219.02 232.78 301.55 242.87 236.31 258.07 232 205.16 129.26 242.6 258.13 133.15 197.55 71.5 329.26 180.09 291.34 356.39 316.55 2010 840.61 360.47 344.25 328.92 467.97 413.83 462.42 443.16 584.51 362.28 709.3 264.39 251.36 243.84 383.89 287.83 295.24 293.59 307.43 228.99 138.35 270.31 276.06 178.07 239.94 71.16 376.2 203.13 307.92 417.92 314.73 2011 1035.18 571.65 434.67 349.29 534.18 482.85 673.57 573.59 908.63 645.59 921.31 440.53 321.2 346.68 508.38 399.71 438.2 396.54 398.54 301.25 290.13 375.26 413.12 246.28 309.25 65.78 533.44 339.28 308.08 444.69 376.87 2012 1125.25 760.41 543.75 490.25 588.87 548.77 840.52 727.02 1028.96 724.23 746.05 510.06 380.6 380.45 635.34 468.81 591.87 497.24 446.46 383.95 306.54 482.24 498.29 282.51 362.63 82.67 619.94 398.01 520.06 492.14 444.18 2013 1063.7 819.4 681.7 559.6 890.4 614 870.4 794.3 746.7 637.9 802.2 534.9 476.6 389.1 637.7 487.1 622.2 629.3 544.4 420.1 334.7 524.7 520.2 313.4 370.9 46.6 707.3 499.4 707 630.6 649 2014 914.6 831.1 664.2 563.6 996.1 903.8 878.1 885.1 793.4 688.8 860.2 597.2 625.5 435 615.6 603.7 728.2 634.9 573.7 407.6 399.2 583.7 572.9 301.1 397.5 51.5 758.9 450.5 717.3 675.2 556.4 2. 函数性的聚类分析

2.1 k-means算法的基本思想

设X={??1,??2,?????,?????}为n个????空间的数据,在聚类开始前,需要制定k为初始聚类个数。选取k的方法有很多种,可以随机选择,也可以根据样本的数目选择。K均值算法的基本工作过程

为:首先从n个数据对象中选择k个对象作为初始聚类中心,其他对象则根据他们与这些聚类中心的相似度(距离)分别分配到最相似的类中,计算相似度公式如下,假设????为第j个类的类中心,则????与????的距离及相似度分别为:

1

d(????,????)=√(?????????1)2+(????2?????2)2+?+(?????????????) (1)

2

s(????,????)=

1??(????,????)

(2)

然后计算每个更新的类的聚类中心,假设第j个类中的样本为{????1,????2,?,??????},即包含????个样本,则该类的聚类中心为????=(????1,????2??????????????),其中??????为类中心????的第k个属性,可根据式(3)求得:

??????

??+??+?+????1??2????

??????= (3)

????

然后不断重复这一过程,直到标准测度函数收敛为止(从表现形式上即为更新后的雷中新与更新前一致),一般采用均方差作为标准聚类测度函数,其形式为: J=√

??2∑????=1∑??=1(???????????)

???1 (4)

最后得到的聚类具有如下的特点:聚类内部尽可能紧凑,不同类类间尽可能分开。

但是在聚类之前,传统的K均值算法需要指定聚类的样本数,由于样本初始分布不一致,有的聚类样本可能含有很多数据,但数据分布相对集中,二有的样本集却含有较少数据且数据分布相对分

散。因此即使是根据样本数据选择聚类个数,依然可能导致聚类结果中同一类样本差异过大欧哲不同类样本差异过小的问题而无法得到满意的聚类结果。本文针对这个问题,采用一种层次结构的K-means聚类方法,在聚类之前不需要制定最终的聚类个数,而是在聚类过程中根据层次结构进行指定。 2.2 对数据进行聚类

从31个省市自治区的农村居民医疗保健支出出发,提取经过预处理的医疗保健支出函数系数,利用函数性K-Means聚类方法对其进行聚类分析。聚类结果见表 2 。

表2:K-Means聚类结果 类别 包含省份 1 山西、内蒙古、吉林、浙江、福建、江西、山东、河南、湖北、湖南、广东、广西、海南、重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆 天津、河北、辽宁、黑龙江、上海、江苏、安徽 数量 23 2 7 3 北京 1 由聚类可知,在农村医疗保健支出方面,大部分城市都处于类别1这一类中,这些城市的医疗保健支出一直处于上升趋势,且上升趋势较快,一方面是由于这些地区的经济发展较快是的收入增多带动了医疗保健支出的增加,另一方面也与当地的医疗保险措施有关,这些地区是典型的处于小康初级阶段水平,农村居民收入能够满足基本的物质需求而且有了一定的能力来满足基本的医疗需求,而在2012-2014年期间由于经济的进一步增长,使得其有更多的预

算来满足医疗保健方面的支出。

在第二分类中的医疗保健支出都处于平稳上升的状态,且在2012年-2013年有不同程度的下降,这是由于在2012年政府政策的推动使得这部分居民享受到更加实惠的医疗救助,一方面医疗水平在上升,另一方面政府补贴使得医疗保健支出有着降低。

第三分类中则只有一个城市北京,北京的医疗保健支出一直明显高于其他省市自治区,这也是由于北京市的经济发达使得人们在满足物质需求的同时更加注重医疗保健,更加注重自身身体健康,同时北京地区新型农村建设也起到了一定的影响。

从上述聚类结果可以看出,农村医疗保健支出在不同地区差距比较大,而医疗保健支出是居民满足自身温饱问题后的重大的必要支出,在不同地区的人群,由于收入的不同使得医疗保健支出不同,这看出居民收入限制了医疗保健的支出水平,这时候就需要政府施行有力的公共政策来满足必要的医疗需求,而第一类中省份数达到23个,这表明政府政策的实施仍有着一定的进步空间。

为了更清楚地观察医疗保健支出变动的区域特征,本文绘制了各区域的类中心线, 见图 3 和图 4。

图3:类中心线

图4:各类曲线

观察图3 和图 4 可以看出,三类区域的农村居民医疗保健支出均呈上涨趋势。但各区域的上涨幅度差异明显。其中,第三类(北京)的曲线更为倾斜。

四、 结论

本文运用函数性数据分析方法,采用K-Means聚类分析,研究了我国31个省市自治区农村居民人均医疗保健现金支出数据。从聚类结果可知,北京市的医疗保健支出最高,其他省份由于政府政策、人均收入的影响而有着不同的医疗保健支出方面的差异,这些差异也反应出了不同城市政府政策的不同以及欠发达地区居民对于医疗政策的需求。而欠发达地区的医疗保健支出负担主体仍为个人,社会支出与政府次之,而农村地区由于地理条件、分布等原因也使得农村居民不易取得需要的医疗服务,医疗保健支出差距较大,且医疗价格变动对农村居民的负担影响更大。因此农村地区更需要更为成熟完善的医疗体系。

聚类分析的结果体现了当前我国经济发展的状况,这与经济分析以及城市划分也有着高的相关度,这也体现了农村医疗保健支出与居民收入的关系,更是从微观反应宏观的良好体现,农村医疗保健体系的完善关系到民生以及整体未来经济的发展,更是关系到整体社会制度的保障与完善。 五、 参考文献

[1]严明义. 函数性数据的统计分析:思想、方法和应用[J]. 统计研究, 2007, (2): 87-94

[2]严明义. 函数性数据的分析方法与经济应用[M]. 中国财政经济出版社:严 明义, 2014.

[3]靳刘蕊. 函数性数据分析方法及应用研究[D]. 厦门:厦门大学, 2008. [4]罗丽娟. 现行医疗保障体制下我国居民医疗保健支出的研究.2012

附录 实证部分Matlab程序

>> % attach FDA founctions software package addpath('d:\\MatlAB\\fdaM')

>> % --------------------对数据进行平滑处理-------------------- ncase=31; % 31个省市

>> LNPI=xlsread('C:\\Users\\fyq\\Desktop\\函数性数据分析论文\\数据文件(人均医疗保健).xlsx')

>> age=[2004:1:2014]'; >> knots=age;

>> norder=6; % 函数阶数

>> nbasis=length(knots)+norder-2; % B-样条基函数 >> rng=[2004,2014];

RegLNPIbasis=create_bspline_basis(rng,nbasis,norder,knots); >> % 粗糙惩罚法修匀拟合函数 Lfd=int2Lfd(4); lambda=10^(-1);

RegLNPIfdPar=fdPar(RegLNPIbasis,Lfd,lambda); RegLNPImat=LNPI(:,1:31);

RegLNPIfd=smooth_basis(age,RegLNPImat,RegLNPIfdPar);

% --------------------绘制拟合曲线-------------------- figure(1)

plot(RegLNPIfd);

xlabel('\\fontsize{18}时间');

ylabel('\\fontsize{18}取自然对数的农村人均医疗消费'); % --------------------绘制速度曲线-------------------- figure(2)

plot(RegLNPIfd,1);

xlabel('\\fontsize{18}时间'); ylabel('\\fontsize{18}速度'); % 计算类中心

RegLNPIfine=eval_fd(RegLNPIfd,age); meileigeshu=zeros(1,K); RegLNPIcenter=zeros(11,K); for i=1:K for j=1:N

if kmeansjieguo(j)==i

RegLNPIcenter(:,i)=RegLNPIcenter(:,i)+RegLNPIfine(:,j); meileigeshu(i)=meileigeshu(i)+1; end end

RegLNPIcenter(:,i)=RegLNPIcenter(:,i)/meileigeshu(i); end

% --------------------分别绘制各类曲线--------------------

sectornames={'北京';'天津';'河北';'山西';'内蒙古';'辽宁';'吉林'; '黑龙江';'上海';'江苏';'浙江';'安徽';'福建';'江西'; '山东';'河南';'湖北';'湖南';'广东';'广西';'海南'; '重庆';'四川';'贵州';'云南';'西藏';'陕西';'甘肃'; '青海';'宁夏';'新疆'};

Class={zeros(1,N),zeros(1,N),zeros(1,N)}; for i=1:K for j=i:N figure(3)

subplot(ceil(K/2),2,i); if kmeansjieguo(j)==i

plot(age,RegLNPIfine(:,j)); Class{1,i}(1,j)=j; end

hold on;

plot(age,RegLNPIcenter(:,i),'r-','LineWidth',3); hold on; end end

% --------------------绘制各类的类中心曲线-------------------- figure(4)

plot(age,RegLNPIcenter(:,1),'r','LineWidth',2.5); hold on;

plot(age,RegLNPIcenter(:,2),'g','LineWidth',2.5); hold on;

plot(age,RegLNPIcenter(:,3),'m','LineWidth',2.5);

本文来源:https://www.bwwdw.com/article/c1i6.html

Top