基于MATLAB的人口预测模型

更新时间:2023-10-19 04:54:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

基于 MATLAB 的人口预测模型 摘要 本文以 1980-2014 年中国年终总人口数据资料为依据,分别使用了一次拟合、灰色预测模型和时间序列模型进行拟合,最终得出时间序列模型的效果最优,得到了中国人口数量逐年增长,但同时增长速度逐渐放缓的结论,为政府制定人口、经济政策提供了一定的依据。

关键词:人口数量;一次拟合;灰色预测;时间序列

前言 世界人口的迅猛增长引起了许多问题。特别是一些经济不发达国家的人口过度增长,影响了整个国家的经济发展、社会安定和人民生活水平的提高,给人类生活带来许多问题。为了解决人口增长过快的问题,人类必须控制自己,做到有计划地生育,使人口的增长与社会、经济的发展相适应,与环境、资源相协调。我国是世界上人口最多的发展中国家。人口数量多、增长快、可耕地少、国家底子薄,这是我国的基本国情。人口增长过快,严重制约着我国经济和社会发展的进程,影响着人民生活的改善和民族素质的提高。从而造成社会再生产投入不足,严重影响国民经济的可持续发展。认真分析我国目前的人口现状和特点,采取切实可行的措施控制人口的高速增长,提高人口的整体素质,已成为我国目前经济发展中需要解决的首要问题。

本文以中国近 35 年的人口数据尝试建立模型,分别建立了一次模型、灰色预测 GM(1,1) 模型和时间序列 AR 模型,最终选取了拟合效果最好的时间序列模型,用于说明我国人口问题以及预测短期内人口数量变化,以及为我国即将面临的人口问题提供一些建议。

概念与引理

定义 1 :人口问题,是由于人口在数量、结构、分布等方面快速变化,造成人口与经济、社会以及资源、环境之间的矛盾冲突。

[1]

人口数量问题,主要由非均衡生育(多子化和少子化)以及人口迁移造成,只有通过均 衡生育(发达国家 2.17 胎,发展中国家 2.3 胎)和调控迁移来解决。 人口结构问题,主要包括年龄、性别、收入、人种、民族、宗教、教育程度、职业、家庭人数等人口结构问题;其中最为突出的是年龄(多子化、少子高龄化)、性别(男女比例失调)和收入(基尼系数高、中产塌陷)结构问题。人口年龄结构问题,只有通过均衡生育

(发达国家 2.17 胎,发展中国家 2.3 胎)来解决。人口性别结构问题,只有通过限制堕胎来解决。人口收入结构问题,原因较复杂,但最终都只有通过壮大中产阶层,使中产阶层成为社会主体才能真正解决。

人口分布问题,主要包括大城市病、高密度连绵城市群的环境污染问题、大片乡村缺少 就近(200 公里内)特大城市辐射带动的发展难题、生态气候等自然条件恶劣地区人口的生存困境、以及高密度大流量的人口迁移等问题。人口分布问题,主要是通过城镇化的合理布局,构建合理的城镇体系来解决。 [2]

定义 2:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。

原理:在我们研究两个变量 x,y)之间的相互关系时,通常可以得到一系列成对的数据 1, 1, 2, 2 … m, );将这些数据描绘在x ? y直角坐标系中,若发现这些点在一条直线附近,可以令这条直线方程如(式 1-1)。

、 1 是任意实数

1

(式 1-1) 和 1,应用《最小二乘法原理》,将实测值 与利用计算 其中: 为建立这直线方程就要确定 值 1 )(式 1-1)的离差 ?

)的平方和∑? )2最小为“优化判据”。

令: 把(式 1-1)代入(式 1-2)中得:

∑? )2

? 1

)2

(式 1-2)

?

(式 1-3)

当∑

? )2最小时,可用函数 对

、 1求偏导数,令这两个偏导数等于零。

1

1

?

)

亦即: ∑

) 1

(式 1-4) )

?

(式 1-5) (式 1-6) (式 1-7) ∑ )(∑

2) 1 ∑)

得到的两个关于

、1为未知数的两个方程组,解这两个方程组得出:

1

∑) ∑ )

∑? 1

) ∑

(式 1-8) (式 1-9)

∑∑这时把 、 1代入(式 1-1)中, 此时的(式 1-1)就是我们回归的一元线性方程即:数学模型。

在回归过程中,回归的关联式不可能全部通过每个回归数据点 1, 1, 2, 2 … m, ), 为了判断关联式的好坏,可借助相关系数“R”,统计量“F”,剩余标准偏差“S”进行判断;“R” 越趋近于 1 越好;“F”的绝对值越大越好;“S”越趋近于 0 越好。

∑ ?

?

2)

) √(∑ 2

?

2

) ?∑ 2

(式 1-10) *

在(式 1-10)中,m为样本容量,即实验次数; 、

分别为任意一组实验数据的数值。

定义 3 :灰色预测是一种对含有不确定因素的系统进行预测的方法。灰色预测通过鉴 [3]

别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。其用等时距观测到的反应预测对象特征的一系列数量值构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。

GM(1,1)模型 令x )

x ) 1), x )

), … , x )

)),x(0)=(x⑴,x⑵,…,x(n))

作一次累加, 生成消除数据的随机性和波动性,即 x 1) )

∑ =1 x ) ),

1, , … , n

))

? 1) x ) ))

有x 1) (x 1) 1),x 1) ), … , x 1)

), … , x )

x可建立白化方程: x ) 1), x ) 1) x )

dx

dt

ax

u即gm 1,1)

u

a

该方程的解为: x 1) k) x 1) 1)

u

a

)

x(k+1)=(x⑴-u/a)exp(

[4]

)+u/a

其中:α称为发展灰数;μ称为内生控制灰数 定义 4 :时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后 顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。 AR 模型是一种线性预测,即已知 N 个数据,可由模型推出第 N 点前面或后面的数据(设推出 P 点),所以其本质类似于插值,其目的都是为了增加有效数据,只是 AR 模型是由 N

点递推,而插值是由两点(或少数几点)去推导多点,所以 AR 模型要比插值方法效果更好。

主要结果 数据: 我国自 1980—2013 年的年末总人口数据(单位:万人) 人口 年份 人口 年份 人口 年份 年份 人口 134091 1980 年 98705 1990 年 114333 2000 年 126743 2010 年 2011 年 1981 年 100072 1991 年 115823 2001 年 127627 128453 134735 135404 1982 年 101654 1992 年 117171 2002 年 2003 年 2012 年 2013 年 1983 年 103008 1993 年 118517 129227 136072 1984 年 104357 1994 年 119850 2004 年 129988 2014 年 136782 1985 年 105851 1995 年 121121 2005 年 130756 1986 年 107507 1996 年 122389 2006 年 131448 1987 年 109300 1997 年 123626 2007 年 132129 1988 年 111026 1998 年 124761 2008 年 132802

注:1981 年及以前人口数据为户籍统计数;1982、1990、2000、2010 年数据为当年人口普查数据推算数;其余年份数据为年度人口抽样调查推算数据。总人口和按性别分人口中包括现役军人,按城乡分人口中现役军人计入城镇人口。

数据来源:国家统计局 1989 年 112704 1999 年 125786 2009 年 133450 表 1

观察数据:

使用 MATLAB 软件根据表 1 数据画散点图

图 1

根据散点图可得,年末总人口数目随着时间的增长而增长,存在明显的正相关关系。 模型的构建与分析模型一

不考虑任何其他因素,直接使用表1数据使用线性最小二乘法进行一次拟合,可得图2 图 2 根据图2可以明显看出一次拟合拟合的效果较差,需重新拟合寻找更优模型

模型二在考虑到人口与时间的关系以及生物指数性增长的特征,使用灰色预测模型 GM

(1,1)

进行拟合,可得图3

本文来源:https://www.bwwdw.com/article/0lof.html

Top