中国的人口预测-By_gnksguybb

更新时间:2023-05-15 13:01:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中国的人口预测

摘要

本文在人口预测中先用新陈代谢GM(1,1)灰色模型对中短期的人口进行预测,首先将2001~2005年的人口总量作为输入序列对2006年的人口总量作出预测,然后保持序列的维数不变,每一次进行预测时,去掉最旧的值加入新值作为新的输入序列,由此得到精度更高的人口预测值。但是,灰色预测模型的误差会随着预测范围的延伸而增大,所以为了减小误差我们构造一个衰减函数,通过对影响人口增长的因素的分析,求出人口阻滞系数,将人口阻滞系数带入衰减函数中求得衰减指数,利用衰减指数修正由灰色模型预测的人口总量,得到精度比较高的数据。

在人口的长期预测中,由于灰色模型固有的缺陷,仅通过衰减是不能消除模型误差的,由此,我们在预测长期人口时引入Leslie矩阵模型。首先通过已知数据中的死亡率和妇女生育率构造Leslie矩阵,然后以2005年人口总数作为初始值进行迭代,预测出2026~2050各年的人口总量。在模型改进中,我们借鉴新陈代谢的思想,对Leslie模型进行优化,由于在原Leslie模型中没有考虑城市化速率对人口的影响,所以模型改进中对人口序列进行了修正,然后将每次用Leslie矩阵预测出来的人口值作为下次预测的初始序列,不断更新序列直至预测出所有人口序列,画出2006~2050中国人口走势直方图和修正后的人口预测直方图,再与由新陈代谢GM(1,1)模型和Leslie模型预测的人口数据做出的2006~2050年人口直方图对比。

最后,我们得到了如下结论:在中短期内,中国人口会增加较快,但总人口最大值不会超过17.4亿人;随后,人口增长减缓,到本世纪中叶,人口增长率会趋向于0,人口总数大体维持在16.8亿人左右。同时从改进的人口走势图和改进的人口预测图还可以看出,灰色预测模型在预测中长期的人口数量时会有很大的误差,这也恰好说明了我们引入衰减指数和Leslie模型的正确性。

关键词: 新陈代谢GM(1,1)模型;人口阻滞系数;衰减指数;Leslie人口预测模型

一、问题重述

中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长。2007年初发布的《国家人口发展战略研究报告》(附录1) 还做出了进一步的分析。

根据已有数据,运用数学建模的方法,对中国人口做出分析和预测是一个重要问题。

二、 问题分析

从附录中的数据列项可以知道对于我国人口划分为城市人口,镇人口和乡村人口三大块,所以我们预测我国人口时也是分别对城市人口,镇人口和乡村人口进行预测,这样也能反映我国未来人口的流动情况和及人口的结构变化趋势。近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长。为此我们建立模型时也将这些因素考虑进去。

三、模型建立与求解

3.1中短期模型

总体思路是先用灰色模型预测出2006年到2025年的人口总量,但是人口的增长又受很多社会因素的影响,比如城市化速率,老龄化速率,性别比等。于是我们构造一个衰减指数模型,综合各影响因素,得到人口阻滞系数,将人口阻滞系数带入衰减模型,得到衰减指数,修正由灰色模型预测的人口总量。

3.1.1利用新陈代谢GM(1,1)模型预测人口总量

所谓新陈代谢模型,即由原始序列测值X(0)(n

X

(0)

(0)(0)

(1),X(2), X

(0)

经灰色建模后求得预,X(n)

1),将此最新信息加入序列,并去掉最老信息

X

(0)

(1)以保持序列长度不变,

如此反复类推则可建立GM(1, 1)新陈代谢模型。新陈代谢模型充分利用数据所携带的最

新信息,揭示系统的发展趋势,通常可获得较高的预测精度。

根据2006年统计年鉴,查得2001~2005年全国人口总量及城镇,乡村人口比重,如下

表1 2001~2005年全国人口数及构成

和镇的人口比重:

某年城市比重

城市男 城市女

该年年鉴的城镇比重

城市男+城市女+镇男 镇女

同理

某年镇比重

镇男 镇女

该年年鉴的城镇比重

城市男+城市女+镇男 镇女

计算得城市人口和镇人口如下表所示: 表2 2001~2005年全国人口结构

以2001~2005年市、镇、乡人口数作为初始序列,利用新陈代谢GM(1,1)模型分别对城市、镇、乡村三大系统的人口进行预测,每年全国的总人口即为每年这三大系统的人口之和。计算结果如下: 表4 新陈代谢GM(1,1)模型预测2006~2025年人口

由上表数据可知,在2025年我国人口就将达到19亿,而根据题设附录1中提到的按目前1.8的总和生育率预测,总人口将于2010年、2020年分别达到13.6亿人和14.5亿人,2033年前后达到峰值15亿人左右。我们认为,新陈代谢的GM(1,1)模型出现过值预测,为此,我们对预测出来的数据进行修正,建立衰减指数模型。

3.1.2衰减指数模型:

考虑影响人口增长的因素,如城市化速率,老龄化速率,性别比等。一个国家的老龄化速率在一定程度上会影响死亡率。另外如果男女性别比例高于或低于1:1,则会影响出生率。我们知道城市化速率加快,涌向城市的人口将增多,对于农村而言则将导致农村人口的减少。我们把这三个因素对人口的作用统一到人口阻滞系数。通过实验我们发现衰减趋势与反正切函数吻合度较高,且新陈代谢GM(1,1)模型预测的值随着预测的年份越远,误差越大,这与反正切函数衰减由慢到快十分相似,于是我们就以反正切函数为模型样板,引入人口阻滞系数得到衰减指数模型:

2 ytj arctan(ktj t 35)

其中:

y

tj

即为衰减指数,ktj为人口阻滞系数, t 代表年份,比如我们以2005年作为观

测数据的最后一年,预测2006,2007年的数据则有t=1,2,以此类推。 j表示区域,市,镇,乡分别用j=1,2,3表示,模型中的数35是多次取不同的值试验得到的实验值。

为定义人口阻滞系数ktj,先定义如下几个系数: 1)性别比系数 k

xtj

x

t 1,jt,j

x

t,j

是第t年的男女性别比例,xt 1,j是第t-1年的男女性别比例;

Ltj

1.01

Ltj Lmin Lmax Lmin

0.1;

2)老龄化速度系数k

Ltj为老龄化速度,亦即第t年的老龄化比重减去第t-1年的老龄化比重, Lmin为在观测数据中计算得的老龄化速度的最小值, Lmax为在观测数据中计算得的老龄化速度的最大值。 3)城市化速度系数

kV

1.01

tj

V VV V

tjmax

minmin

0.1

V

tj

为城市化速度,为第t年城市人口比重减去第t-1年城市人口比重,Vmin为在

观测数据中计算得的城市化速度的最小值,Vmax为在观测数据中计算得的城市化速度的最大值。

在以上的老龄化速度系数和城市化速度系数中加上常数1.01是为了使系数“归一放大”后保证对阻滞系数至少有1%的贡献。 从而有: ktj k

xtj

kLtj

kVtj

利用附录2的01-05年的数据计算各个区域的性别比系数,老龄化速度系数,城市化速度系数,人口阻滞系数,结果如下

为了便于预测计算,将各年计算得到的人口阻滞系数取均值代入衰减指数模型,于是得到了针对市,镇,乡的三个衰减指数方程:

2

城市 y arctan(1.108461 t 35)

t1

2 镇 yt2 arctan(1.109333 t 35)

乡村

那么,修正后人口值=衰减指数 人口预测值

已经用新陈代谢GM(1,1)模型预测出2006至2025年的人口,见表4,得到修正后的人口预测值:

表8 经指数衰减模型修正的人口预测

t3

y

2

arctan(1.098414 t 35)

由表中数据可以明显看出,随着预测时间加长,预测的人口总数一直上扬,实际上由

于多种因素的影响,人口增长会有一个极值,说明该模型在预测长期发展时误差将会很大,所以对于长期人口预测应改用效果比较好的Leslie模型。由表还可以看出,在未来的十多年中,城镇人口增加明显,乡村人口呈减少态势,反映了在中国城市化还需要发展,而且发展空间很大,这一点与实际情况相符:2006年年鉴统计资料显示,乡村人口的人口比重从1978年的82.08%下降到2005年的57.01%,今后随着经济的发展,城市化进程还会加快,越来越多的农村人口涌入城镇。

3.2人口的长期预测---Leslie 模型

20世纪40年代提出的leslie人口模型,就是一个预测人口按年龄组变化的离散模型,由文献知道Leslie模型在中长期预测中误差较小。所以我们采用该模型对中国人口的长期发展趋势进行预测。仍然从城市,镇,乡村三个系统考虑问题。

3.2.1模型假设:

1,不考虑生存空间等自然资源的制约,不考虑意外灾难等因素对人口变化的影响; 2,生育率和死亡率仅与年龄段有关,在当前中国社会,可以认为它们是稳定的; 3,城市,镇,乡村三大系统人口的迁入迁出是动态平衡的。

3.2.2符号说明:

1,xi k 为第k个时间段第i个年龄组的女性人数;

2,bi k 为第k个时间段第i个年龄组女性生育率(所谓女性生育率指生女率),育龄区间为[i1,i2](i1=15,i2=49);

3,di为第k个时间段第i个年龄组女性的死亡率;

4,si为第k个时间段第i个年龄组女性的存活率,且有si=1-di;

5, k = bi k ,是第k个时间段第i1个年龄组女性一生平均生育的女儿数,即总

i=i1和生育率;

7,n为划分的年龄组个数,此时n=91;

3.3.3模型建立与求解

首先按人口年龄的大小等间距分组,一岁为一个年龄组i(i=0,1,2,….90),一年为一个时间段k(k=1,2,….)。

i2

xi k 的变化规律有以下基本事实得到:时段k+1第一年龄组女性数量是时段k各年龄组生育之和,即:

i2

x(k 1) b(k)x(k)

1

i

i1

ii

(1)

假如排除死亡的情形,那么在一个周期内第i个年龄组的成员将全部转移到i+1个年龄组.但是,实际上必须考虑到死亡率,因此这一转移过程可由一存活系数所衰减. 于是,这一转移过程可由下述议程简单地描述:

x

i 1

(k 1) sixi(k),i 1,2,...,n 1 (2)

记时段k女性按年龄组的分布向量为

x(k)

x1(k),x2(k),...xn(k)

T

由生育率bi和存活率si构成的矩阵

0 s1 L 0 0

...0bi...bi0...0

1

2

0...

s0...

2............0............0

1

...............sn0

则(1),(2)可表为

x(k 1) Lx(k),k 0,1,2,....

b和s仅与年龄段有关,所以我们认为在未来相当长时间内b和s都是稳定的。所以

i

i

i

i

对于矩阵L和和按年龄组的初始分布向量x(0)已知时,便可以预测任意时段k的女性人口按年龄组的分布为

x(k) x(0),k 1,2,...

此时便能很容易地算出女性人口的总数。

由于题目附录2中的数据并没有直接给出生育率(女性出生率),我们采取如下公式进行计算:

生育率=1.8 妇女生育率 女婴男婴性别比

其中,妇女生育率是指该类年龄段妇女生育子女的千分比(‰),女孩出生比率根据男女出生比例(女100记)算得。1.8为目前中国的总和生育率,并且将在相当长时间内保持这一值。

查年鉴得到2005年全国城,乡,镇人口数,如下表所示,我们以2005年的人口数作为

L

k

初始数据x(0)

数。

利用Leslie模型预测2026年至2050年的人口,在讨论性别比时,我们取01年至05年的性别比均值,则有性别比:城市 1.12214, 镇 1.18844 ,乡村 1.20814 利用Leslie模型预测2026年至2050年的人口结果如下:

表10 Leslie模型预测2026~2050年的人口

直方图:

5

人口总数(万人)

年份

图1 2006~2050人口直方图

此图说明在未来50年内中国人口持续增长,到2041年人口超过了18亿,但增长相当缓慢。

四、模型的改进

受新陈代谢GM(1,1)模型启发,Leslie模型对于初始序列也可x(0)以作新陈代谢处理,即每预测一年,就将新的预测序列x(1)作为新的初始序列,这时可以考虑系统与外界的交换。就人口模式而言,影响人口增长的因素很多,从短期模型的讨论中可以知道,在中国,影响最为显著的就是城乡之间的人口流动,即城市化速度。这时我们考虑城市化速度对人口增长的影响,我们假定人口流动方向只能是从农村到城镇,从镇到城市,那么对于城市而言,城市的人口组成模式就可以用如下公式表示: 第t年城市人口数=t年预测的城市人口数+t年城镇迁入城市的人口 同理

第t年镇人口数=t年预测的镇人口数+t年乡迁入镇的人口-t年镇流入城市的人口 第t年乡村人口数=t年预测的乡村人口数-t年乡迁入城镇的人口

于是初始序列x(0)、y(0)、z(0)分别为2005年城市、镇、乡村的人口数,则2006年预测的人口数为:

x(1) L1*x(0) y(1)*Vt1 y(1) (1 Vt1)*L2*y(0) z(1)*Vt2 z(1) (1 Vt2)*z(0)

Vt1、Vt2分别是城市化速率的均值和由乡村变成镇速率的均值

求出的三个值既是我们所要求得的预测值,又是作为预测下一年人口数新的x(0)、y(0)、z(0)的值,这样不断更新直至预测出所有人口数。

通过MATLAB编程得到了2006-2050年的改进的人口走势直方图如下所示:

181614

4

人口总数(万人)

121086420

年份

图2 改进的人口走势直方图

结合中短期的预测值,得到修正后的人口预测直方图:

181614

4

人口总数(万人)

121086420

年份

图3 修正后的人口预测直方图

通过对比我们得出如下结论:

1. 在中短期内,中国人口会有较大幅度的增加,但最高值不会超过17.4亿人,到本世纪中叶,人口增幅会趋向于0,人口总数大体维持在16.8亿人左右。

2. 从改进的人口走势图和改进的人口预测图可以看出,灰色预测模型在预测中长期的人口数量时有很大的误差,这也证明了我们引入衰减指数的正确性。

五、模型评价

优点:

通过利用GM(1,1)灰色模型发现了它对于近期预测精确度较高,但是它的缺陷是不能进行长远的预测,我们建立的衰减指数模型能在稍微远的时间上对GM(1,1)灰色模型进行修正,使结果更加精确,更符合实际;利用Leslie模型进行长远期预测与修正GM(1,1)灰色模型的中短期预测结合起来使预测更佳。

缺点:

1、衰减指数模型是由经验试验得出,缺乏严格的数学理论证明;

2、修正GM(1,1)灰色模型与Leslie模型在2025与2026年间契合点不是很好,如直方图中出现了断层也就是说在2025年左右几年的数据不是很合理,这也说明两个模型的糅合没有发挥到最佳,还欠开发。再者Leslie模型过于理想化,很多因素如:老龄化、城市化、性别比等欠考虑,以致于在2026至2050的人口量是单调递增的。

六、参考文献

[1] 李华中 《人口预测的一种综合分析方法》 江苏石油化工学院学学报1999年6月第11卷第2期

[2] 姜启源,谢金星,叶俊 《数学模型》(第三版)高等教育出版社

[3] 祁建广,朱瑞军 《应用灰色模型对我国人口总量进行预测》大连理工大学电信学院自动化系,辽宁,大连,116023

[4] 方建卫, 王文娟, 楚霹 《基于最小二乘法的GM( 1, 1)模型在人口预测中的应用》贵州大学学报(自然科学版) 第24卷第4 期 2007年7月

[5] 国家统计局 《中国统计年鉴-2006》 中国统计出版社 2006年 [6] 韩中庚 《数学建模方法及其应用》 高等教育出版社 2005年

附录:

附件1、新陈代谢灰色模型的源程序: function M=daixie(data,N) t=length(data); for i=1:N

new(i)=huise(data,1);%调用灰色模型函数预测一年的人口 data(1)=[];%去掉旧值 data(t)=new(i);%添加新值 end

format bank; M=new';

灰色模型的程序:

function GM=huise(data,N) T=length(data); X0=data; X1(1)=X0(1); for i=2:T

X1(i)=X1(i-1)+X0(i); %生成一次累加数列 end

for i=1:T-1

Z(i)=-(0.5*(X1(i)+X1(i+1))); %生成均值数列 end

B=zeros(T-1,2); %构造累加矩阵B for i=1:T-1 for j=1:2 if j<2

B(i,j)=Z(i); elseif j>1 B(i,j)=1; end end=

end

for i=2:T %构造常数项向量 Y(i-1)=X0(i); end

HCS=inv(B'*B)*B'*Y'; %最小二乘法求灰参数 u=HCS';

for i=2:T+N %计算出累加序列

XR1(i)=(X0(1)-u(2)/u(1))*exp(-1*u(1)*(i-1))+u(2)/u(1); end

for i=2:T+N %还原出预测值 K(i)=XR1(i)-XR1(i-1); end

GM=K(T+N);

附件2、对Leslie模型的改进程序: changecity=0.005124715; changetown=0.00820027659; w1=zeros(91,95); w2=zeros(91,95); w3=zeros(91,95); for i=1:95

w1(:,i)=l1*x0; w2(:,i)=l2*y0; w3(:,i)=l3*z0;

w3(:,i)=(1-changetown)*w3(:,i);

w2(:,i)=(1-changecity)*w2(:,i)+w3(:,i)*changetown; w1(:,i)=w1(:,i)+w2(:,i)*changecity; x0=w1(:,i); y0=w2(:,i); z0=w3(:,i); end

本文来源:https://www.bwwdw.com/article/5wue.html

Top