基于BP神经网络和GM(1,1)灰色模型的中国人口预测分析
黄俸强李晶邓健萍
摘要
人口预测对国民经济的发展有着非常重要的作用.如何用操作性强,可信度高的方
法来预测人口的变化,这是一个值得探讨的问题.
本文主要根据《中国人口统计年鉴》上收集到的2001年到2005年部分数据,在灰
色预测的基础上,引入BP神经网络模型,建立了中国人口增长的GM(1,1)和BP神经网
络组合模型,并由此对中国人口增长的中短期和长期趋势做出预测.
我们通过输入原始数据资料,应用灰色模型进行预测,得到预测数列,然后将预测
值作为输入量,原始数据作为期望值,对BP神经网络进行训练,得到相应的权值和阀值,
最后输入预测年份,即可得到具有较高精度的预测量.由此可以知道,中国人口增长的
中短期和长期趋势为:
人口总量在中短期内继续增长,增速较为平稳,每年以0.11亿人口数增长.人口总
量在未来30年还将净增2亿人左右,总人口将于2010年,2020年分别达到13.63亿人和
14.67亿人,2033年前后达到峰值15.01亿人,之后人口总量缓慢下降.
我国育龄妇女(15-49岁)人数在短期内持续增加,在2014年达到顶峰,之后开始缓
慢下降,到2033年左右,下降速度加快;我国生育旺盛期育龄妇女(20-29岁)人数在短
期内持续下降,在2015年达到低谷,之后开始缓慢回升,但是一段时期后,又开始缓
慢下降,如此波动变化.
全国人口死亡率继续保持较低水平(维持在7‰以下),并缓慢下降,从1990年的
6.67‰下降到2050年的5.66‰,减少了1.01个千分点;我国男性人口死亡率高于女性人口
死亡率,乡人口死亡率高于城镇人口死亡率.
我国人口城镇化速度在未来20年里每年增长1.10-1.50个百分点,之后人口城镇化
开始放慢增长速度,2021-2050年间仅增加11.41个百分点.到本世纪中叶,城镇化水平
在75%左右.
2005年我国老年人口已超过1亿人,到2020年,65岁以上老年人口将达到1.74亿
人,比重从2005年的8.09%增长到12.02%.预计2050年,65岁以上老年人口达3.38亿
多人,比重达23.23%.老龄化进程加速.老年人口数量多,老龄化速度快,高龄趋势明
显.
出生人口性别比总体呈上升趋势.中短期变化不大,都在初始值附近波动;从2010
年到2050年平均每年增长了0.75.
此组合模型兼有灰色预测和BP神经网络预测的优点,既利用灰色系统理论具有所
需要的样本数据少,原理简单,运算方便,短期预测精度高,可检验等优点,也发挥神经
网络并行计算,容错能力强,自适应能力强等优点,模型既克服了原始数据少,数据波
动性大对预测精度的影响,也增强了预测的自适应性.
关键词:BP神经网络GM(1,1)灰色预测模型人口预测
1
一,问题重述
1.1,问题背景
中国自古以来是一个人口大国.新中国成立后,我国人口进入飞速发展阶段.1949
年到1957年8年时间,人口增长了1亿;1964年总人口超过7亿,1969年总人口超过8
亿,1974年总人口超过9亿.这一时期每增长1亿人时间间隔为5年.中国人口净增长率
波动比较剧烈.80年代以后,由于我国实行了计划生育,人口膨胀得到了有效的控制.
实行近30年来,使我国少生了4亿多人,为中国现代化建设,全面实现小康社会打下了
坚实的基础,同时也为世界人口控制做出了杰出贡献.但是由于中国人口基数大,人口
增长问题依然十分严峻.
在我国现代化进程中必须实现人口与经济,社会,资源,环境协调发展和可持续发
展,而人口问题始终是制约我国发展的关键因素之一.要发展,必须进一步控制人口数
量,提高人口质量,改善人口结构.对中国未来人口的准确预测,能够为中国经济和社
会发展的重大决策提供科学依据,这对加速推进我国现代化建设有着极为重要的现实意
义.因此,根据已有数据,运用数学建模的方法,对中国人口做出分析和预测是一个重
要问题.
1.2,问题提出
近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速,出生人口性
别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长.2007年初
发布的《国家人口发展战略研究报告》(附录1)还做出了进一步的分析.
关于中国人口问题已有多方面的研究,并积累了大量数据资料.现在得到了《中国
人口统计年鉴》上收集到的部分数据(见附录2).其中包含2001至2005年的市,镇和乡
人口不同性别的人在该类人口中所占的百分比,死亡率,生育率,每年人口抽样调查的
样本容量(人数)数据.1994至2005年的市,镇和乡男女出生比例.1995至2005年的市,
镇和乡育龄妇女生育率的千分比(‰).
根据已知数据(或搜索相关文献和补充新的数据),解决以下的问题:从中国的实际
情况和人口增长的上述特点出发,建立中国人口增长的数学模型,并由此对中国人口增
长的中短期和长期趋势做出预测.
二,问题的分析
一个国家人口的准确预测,是制定相应宏观经济政策的重要依据,对我国经济的发
展有着巨大的作用.预测是控制和规划的基础,预测的精度是控制和规划成功的前提,
而选择预测的方法是提高预测精度的关键.传统的人口预测方法主要有逻辑方法,常微
分方程方法和动态预测方法等.这些方法在人口预测领域起到了一定的作用,但采用这
些方法时都要对数据进行模型假设.由于真实模型往往是非线性的,如果在一些简单的
模型假设下就进行数据模拟,常常不能达到较好的模拟效果.神经网络对复杂非线性系
统具有曲线拟合能力,基于BP神经网络和GM(1,1)模型的组合模型进行动态预测.既利
用灰色预测的需要数据资料少的优点,又吸收了BP神经网络容错能力,自适应能力强
的优点.由于神经网络的功能之强大,型式之多样,若能将其它网络形式同灰色模型相
结合,则有可能进一步提高预测精度.
三,模型的假设与符号说明
3.1,模型假设与约定
(1)未来人口的死亡模式保持不变;
2
(2)所研究的人口为封闭人口;
(3)农村人口一旦迁入城镇或者城镇化,其人口行为和特征即与城镇人口相同,即忽略
城镇人口与迁入城镇人口或城镇化人口的差别.
(4)人口数据质量高,无误报和漏报等.
(5)在分析老年人口问题时,是以65岁作为老年人口的起点年龄;
3.2,名词定义
主要统计指标解释
人口数指一定时点,一定地区范围内有生命的个人总和.
出生率指在一定时期内(通常为一年)一定地区的出生人数与同期内平均人数
(或期中人数)之比,用千分率表示.其计算公式为:
0
00
1000
年出生人数
出生率
年平均人数
死亡率指在一定时期内(通常为一年)一定地区的死亡人数与同期内平均人数
(或期中人数)之比,用千分率表示.其计算公式为:
0
00
1000
年死亡人数
死亡率
年平均人数
人口自然增长率是指在一定时期内(通常为一年)人口自然增加数(出生人数减
死亡人数)与该时期内平均人数(或期中人数)之比,用千分率表示.计算公式为:
0
00
=1000
年出生人数-本年死亡人数
人口自然增长率=人口出生率-人口死亡率
年平均人数
预测时期短期(<10年),中期(10-25年),长期(>25年);
出生人口性别比是活产男婴数与活产女婴数的比值,通常用女婴数量为100时所
对应的男婴数来表示.正常情况下,出生性别比是由生物学规律决定的,保持在103~
107之间.
人口抚养比指人口总体中处于供养年龄(一般指15岁以下和64岁以上)的人口
与处于“经济活动”年龄(15-64岁)人口的比率.用百分铝表示.计算公式为:
0
0
1564
100
岁以下人口岁以上人口
人口抚养比=
15-64岁人口
总和生育率:一定时期(如某一年)各年龄组妇女生育率的合计数,说明每名妇女
按照某一年的各年龄组生育率度过育龄期,平均可能生育的子女数,是衡量生育水平最
常用的指标之一.
四,模型的建立和求解
4.1,GM(1,1)预测模型的基本原理
(1)GM(1,1)灰色系统[1]
所谓灰色系统是指既含有已知信息,又含有未知信息的系统,是由邓聚龙教授在
1986年提出的.灰色理论自诞生以来,发展很快,由于它所需因素少,模型简单,特别
是对于因素空间难以穷尽,运行机制尚不明确,又缺乏建立确定关系的信息系统,灰色
系统理论及方法为解决此类问题提供了新的思路和有益的尝试.
灰色预测方法是根据过去及现在已知的或非确知的信息,建立一个从过去引申到将
3
来的GM模型,从而确定系统在未来发展变化的趋势,为规划决策提供依据.在灰色预
测模型中,对时间序列进行数量大小的预测,随机性被弱化了,确定性增强了.此时在
生成层次上求解得到生成函数,据此建立被求序列的数列预测,其预测模型为一阶微分
方程,即只有一个变量的灰色模型,记为GM(1,1)模型.
灰色GM(1,1)预测模型在计算过程中主要是以矩阵为主,它和MATLAB的结合可以
有效的解决了灰色系统理论在矩阵计算中的问题,为灰色系统理论的应用提供了一种新
的方法.
(2)GM(1,1)预测模型的基本原理
GM(1,1)模型是灰色预测的核心,它是一个单个变量预测的一阶微分方程模型,其
离散时间响应函数近似呈指数规律.建立GM(1,1)模型的方法是:
设(0)(0)(0)(0)1,2,,XXXXn
为原始非负时间序列,(1)Xt为累加生成序
列,即
(1)(0)
1
,1,2,,
i
m
XtXmtn
(1)
GM(1,1)模型的白化微分方程为:
(1)
(1)
dX
aXu
dt
(2)
式(2)中,a为待辨识参数,亦称发展系数;u为待辨识内生变量,亦称灰作用量.设待辨
识向量
ˆ
a
a
u
,按最小二乘法求得1ˆ
()TTaBBBy式中
(1)(1)
(1)(1)
(1)(1)
1
121
2
1
231
2
1
11
2
XX
XX
B
XnXn
(0)
(0)
(0)
2
3
X
X
y
Xn
于是可得到灰色预测的离散时间响应函数为:
(1)(0)11at
uu
XtXe
aa
(3)
(1)1Xt为所得的累加的预测值,将预测值还原即为:
(0)(1)(1)ˆˆˆ
11,1,2,3XtXtXttn(4)
4
(3)GM(1,1)预测模型的MATLAB程序
根据上述GM(1,1)模型的数学思想,结合MATLAB语言的特点编制了一套可读性强,
容易理解的预测程序.该程序操作简单灵活,稳定性好,直接面向用户.
4.2,BP神经网络模型的基本原理
(1)神经网络的定义简介[2]
神经网络是由多个神经元组成的广泛互连的神经网络,能够模拟生物神经系统真实
世界及物体之间所做出的交互反应.人工神经网络处理信息是通过信息样本对神经网络
的训练,使其具有人的大脑的记忆,辨识能力,完成名种信息处理功能.它不需要任何
先验公式,就能从已有数据中自动地归纳规则,获得这些数据的内在规律,具有良好的
自学习,自适应,联想记忆,并行处理和非线性形转换的能力,特别适合于因果关系复
杂的非确定性推理,判断,识别和分类等问题.对于任意一组随机的,正态的数据,都可
以利用人工神经网络算法进行统计分析,做出拟合和预测.
基于误差反向传播(Backpropagation)算法的多层前馈网络(Multiple-layer
feedforwardnetwork,简记为BP网络),是目前应用最成功和广泛的人工神经网络.
(2)BP模型的基本原理[3]
学习过程中由信号的正向传播与误差的逆向传播两个过程组成.正向传播时,模式
作用于输入层,经隐层处理后,传入误差的逆向传播阶段,将输出误差按某种子形式,
通过隐层向输入层逐层返回,并“分摊”给各层的所有单元,从而获得各层单元的参考误
差或称误差信号,以作为修改各单元权值的依据.权值不断修改的过程,也就是网络学
习过程.此过程一直进行到网络输出的误差准逐渐减少到可接受的程度或达到设定的学
习次数为止.BP网络模型包括其输入输出模型,作用函数模型,误差计算模型和自学习
模型.
BP网络由输入层,输出层以及一个或多个隐层节点互连而成的一种多层网,这种结
构使多层前馈网络可在输入和输出间建立合适的线性或非线性关系,又不致使网络输出
限制在-1和1之间.见图(1).
O
1
O
2
O
i
O
m
(大于等于一层)W(1)…W(L)
(3)BP神经网络的训练
BP算法通过“训练”这一事件来得到这种输入,输出间合适的线性或非线性关系.
“训练”的过程可以分为向前传输和向后传输两个阶段:
输入层
输出层
隐含层
…
……
…
P
1
P
2
P
3
P
n
图1BP网络模型
5
[1]向前传输阶段:
①从样本集中取一个样本,
ij
PQ,将
i
P输入网络;
②计算出误差测度
1
E和实际输出(1)(2)()
21
(...((())...))L
iLi
OFFFPWWW;
③对权重值LWWW,...,)2()1(各做一次调整,重复这个循环,直到
i
E.
[2]向后传播阶段——误差传播阶段:
①计算实际输出
p
O与理想输出
i
Q的差;
②用输出层的误差调整输出层权矩阵;
③2
1
1
()
2
m
iijij
j
EQO
;
④用此误差估计输出层的直接前导层的误差,再用输出层前导层误差估计更前一层
的误差.如此获得所有其他各层的误差估计;
⑤并用这些估计实现对权矩阵的修改.形成将输出端表现出的误差沿着与输出信号
相反的方向逐级向输出端传递的过程.
网络关于整个样本集的误差测度:
i
i
EE
4.3,应用步骤
(1)输入原始数据资料;
(2)应用灰色模型进行预测,得到预测序列;
(3)将预测值作为输入量,原始数据作为期望值,对BP神经网络进行训练,得到相应的
权值和阀值;
(4)输入需要预测的年份,即可得到具有相当精度的预测量.
4.4,预测与结果分析
(1)未来我国总人口变化情况
通过查询中国人口与发展研究中心在中国人口信息网上所公布的数据,获知我国
1996—2005年的人口总数,出生率和死亡率数据.
根据此数据,应用灰色模型预测我国未来10年人口总数,出生率和死亡率,将其作
为训练样本(输入量),1990—2005年的原始数据作为检验样本(期望值),对BP神经
网络进行训练.
在此基础上,对我国未来45年人口总数进行预测.并且我们还分别使用单独的
GM(1,1)模型和BP神经网络模型对中国未来45年人口总数进行预测,预测数据见下表[4],
每年详细数据见附录表1.
表12001-2050年全国总人口变动情况预测
单位(亿人)GM(1:1)模型BP神经网络
GM(1,1)和BP
神经网络组合
国家2003人口
计生委预测结
果(TFR=1.8)
199612.192412.238912.2389
199712.297612.362612.3626
199812.403712.476112.4761
6
199912.510712.578612.5786
200012.618712.674312.6743
200112.727612.762712.762712.87
200212.837412.845312.845312.97
200312.948212.922712.922713.06
200413.0612.998812.998813.15
200513.172713.075613.075613.24
200613.172713.15713.172713.33
200713.286413.248913.286413.42
200813.40113.342713.40113.51
200913.516713.436613.516713.61
201013.633313.528313.633313.7
201113.75113.615413.75113.8
201213.869613.696113.869613.9
201313.989313.768813.989314
201414.110113.832814.110114.1
201514.231813.887814.231814.19
202014.856614.044914.677514.54
202515.508814.067714.913114.73
203016.189714.001615.000714.83
203516.900413.853815.011714.86
204017.642413.664214.98114.83
204518.416913.518814.920514.68
205019.225413.447014.838114.4000
将所得数据制成图表,如下图所示
图2未来我国总人口预测图
按此预测,从以上图表中可以知道我国人口增长的中短期和长期趋势为:中国人口
自然增长率继续保持平稳下降,人口总量在中短期内继续增长,增速较为平稳.人口总
我国总人口预测图
12
13
14
15
16
17
18
19
20
2
0
0
5
2
0
0
8
2
0
1
1
2
0
1
4
2
0
1
7
2
0
2
0
2
0
2
3
2
0
2
6
2
0
2
9
2
0
3
2
2
0
3
5
2
0
3
8
2
0
4
1
2
0
4
4
2
0
4
7
2
0
5
0
人
口
数(
亿
人)
GM(1:1)模型
GM(1,1)和BP神经网络组合
BP神经网络
国家2003人口计生委预测结果(TFR=1.8)
7
量在未来30年还将净增2亿人左右,总人口将于2010年,2020年分别达到13.63亿人和
14.67亿人,2033年前后达到峰值15.01亿人,之后人口总量缓慢下降.
对比国家人口计生委2003年预测结果,单独的GM(1,1)模型和神经网络模型都能非
常精确的预测出在短期内我国未来人口总数,在中期预测中,也能较好的反映出人口变
化趋势.在长期预测时,GM(1,1)的预测数据偏差非常大,神经网络虽然变化趋势较符合
我国未来人口变化情况,但偏差还是较大.而组合模型在这三个时期内,都能够很好的
预测出中国未来人口总量的及其变化情况.显然组合模型的预测效果最佳.关于
GM(1,1)长期预测的局限性将在模型评价中讨论.
(2)妇女生育水平变化情况
根据题中附录1的数据,利用组合模型分别预测出未来全国育龄妇女人数变化情况
及未来我国生育旺盛期育龄妇女(20-29岁)人数预测,结果见下图
我国育龄妇女人数预测
3
3.2
3.4
3.6
3.8
4
4.2
2
0
0
1
2
0
0
6
2
0
1
1
2
0
1
6
2
0
2
1
2
0
2
6
2
0
3
1
2
0
3
6
2
0
4
1
2
0
4
6
(
亿
人)
总和(15-49)
图3.1未来我国育龄妇女(15-49岁)人数预测
市镇乡育龄妇女人数预测
0
0.5
1
1.5
2
2.5
2
0
0
1
2
0
0
5
2
0
0
9
2
0
1
3
2
0
1
7
2
0
2
1
2
0
2
5
2
0
2
9
2
0
3
3
2
0
3
7
2
0
4
1
2
0
4
5
2
0
4
9
(
亿
人)市(15-49)
镇(15-49)
乡(15-49)
图3.2未来我国市镇乡育龄妇女(15-49岁)人数预测
8
我国生育旺盛育龄妇女人数预测
0.5
0.6
0.7
0.8
0.9
1
1.1
2
0
0
1
2
0
0
5
2
0
0
9
2
0
1
3
2
0
1
7
2
0
2
1
2
0
2
5
2
0
2
9
2
0
3
3
2
0
3
7
2
0
4
1
2
0
4
5
2
0
4
9
(
亿
人)
总和(20-29)
图3.3未来我国生育旺盛期育龄妇女(20-29岁)人数预测
市镇乡生育旺盛育龄妇女人数预测
0
0.2
0.4
0.6
0.8
1
1.2
2
0
0
1
2
0
0
6
2
0
1
1
2
0
1
6
2
0
2
1
2
0
2
6
2
0
3
1
2
0
3
6
2
0
4
1
2
0
4
6
(
亿
人)乡(20-29)
镇(20-29)
市(20-29)
图3.4未来我国市镇乡生育旺盛期育龄妇女(20-29岁)人数预测
未来我国育龄妇女(15-49岁)人数在短期内持续增加,在2014年达到顶峰,之后开
始缓慢下降,到2033年左右,下降速度加快.
相反,我国生育旺盛期育龄妇女(20-29岁)人数在短期内持续下降,在2015年达
到低谷,之后开始缓慢回升,但是一段时期后,又开始缓慢下降,如此波动变化.
由表3.2和表3.4可知城市面临生育水平降低农村则一直持续较高的生育水平.
(3)人口死亡率变化情况
人口死亡水平是造成人口数量和结构变化的重要因素之一,随着我国社会经济的迅
速发展医疗卫生条件的进一步改善我国人口的健康水平有了明显改善,人口的死亡率较
低.
利用组合模型对人口死亡率变化情况进行预测.所得结果下图
9
全国人口死亡率预测
5
6
7
8
9
10
1
9
9
0
1
9
9
3
1
9
9
6
1
9
9
9
2
0
0
2
2
0
0
5
2
0
0
8
2
0
1
1
2
0
1
4
2
0
1
7
2
0
2
0
2
0
2
3
2
0
2
6
2
0
2
9
2
0
3
2
2
0
3
5
2
0
3
8
2
0
4
1
2
0
4
4
2
0
4
7
2
0
5
0
(
‰)
全国人口死亡率
图4.1全国人口死亡率预测
0
1
2
3
4
5
6
2
(
‰)市男性死亡率
市女性死亡率
图4.2全国城市男女死亡率预测
0
1
2
3
4
5
6
7
20432050
(
‰)镇男性死亡率
镇女性死亡率
图4.3全国镇男女死亡率预测
10
0
1
2
3
4
5
6
7
8
9
2
(
‰)
乡男性死
亡率
乡女性死
亡率
图4.4全国乡男女死亡率预测
由上图4.1可以知道,全国人口死亡率继续保持较低水平(维持在7‰已下),并缓慢
下降,从1990年的6.67‰下降到2050年的5.66‰,减少了1.01个千分点.
从上图4.2,4.3,4.4可以知道,我国男性人口死亡率高于女性人口死亡率,乡人口死
亡率高于城镇人口死亡率.
(4)城镇化水平变化情况;
城镇人口比重是衡量经济发展水平特别是工业发展水平的重要标志,随着我国改革
开放和经济建设的发展,城镇化水平有了较大提高.
可预测城镇化水平变化情况,如下表所示,详细数据,请见附录表2
年份人口城镇化年份人口城镇化年份人口城镇化
201052.27202566.53204073.99
201559.17203068.57204575.65
202065.07203571.41205076.48
表22001-2050年我国人口城镇化水平变化趋势
人口城镇化(%)
20
30
40
50
60
70
80
90
2
0
0
1
2
0
0
4
2
0
0
7
2
0
1
0
2
0
1
3
2
0
1
6
2
0
1
9
2
0
2
2
2
0
2
5
2
0
2
8
2
0
3
1
2
0
3
4
2
0
3
7
2
0
4
0
2
0
4
3
2
0
4
6
2
0
4
9
人口城镇化(%)
图52001-2050年我国人口城镇化水平变化趋势
可以知道我国人口城镇化速度在未来20年里每年增长1.10-1.50个百分点,之后人
口城镇化开始放慢增长速度,2021-2050年间仅增加11.41个百分点.到本世纪中叶,城
镇化水平在75%左右,达到中等发达国家城镇化水平.
11
(5)老龄化人口问题
随着人口年龄结构的不断老化,人口年龄结构的类型就会从年轻型进入成年型,最
后进入老年型,我国人口年龄结构的变化也是经过了不同类型的变化.从2000年开始我
国65岁以上人口占总人口的比重达到7%,14岁人口比例为22.9%,老少比为30.4%,年龄
中位数为30.8岁表,这就意味着我国即将开始进入老龄社会.
根据中国人口与发展研究中心在中国人口信息网上所公布的数据,获知我国
2001—2005年的老年人口总数.见下表3
表3我国2001—2005年的老年人口数据
20042005
65岁以上人口数(亿人)0.910.940.960.981.01
人口老龄化程度(%)7.097.247.367.487.61
分别使用GM(1,1)和组合模型,对老龄化情况作出预测,其结果见下图5.1,5.2
65岁以上人口数预测(亿人)
0
0.5
1
1.5
2
2.5
3
3.5
4
2
0
0
1
2
0
0
4
2
0
0
7
2
0
1
0
2
0
1
3
2
0
1
6
2
0
1
9
2
0
2
2
2
0
2
5
2
0
2
8
2
0
3
1
2
0
3
4
2
0
3
7
2
0
4
0
2
0
4
3
2
0
4
6
2
0
4
9
65岁以上人口数(亿人)
GM(1,1)预测65岁以上人口数(亿人)
组合模型预测65岁以上人口数(亿人)
图6.1我国未来65岁以上人口数预测
人口老龄化程度(%)
5
10
15
20
25
30
2
0
0
1
2
0
0
4
2
0
0
7
2
0
1
0
2
0
1
3
2
0
1
6
2
0
1
9
2
0
2
2
2
0
2
5
2
0
2
8
2
0
3
1
2
0
3
4
2
0
3
7
2
0
4
0
2
0
4
3
2
0
4
6
2
0
4
9
人口老龄化程度(%)
GM(1,1)预测人口老龄化程度(%)
组合预测人口老龄化程度(%)
图6.2我国未来人口老龄化程度预测
12
市人口年龄结构
0
10
20
30
40
50
60
70
80
90
2
(
%
)
65+
0-14
15-64
图6.3我国城市人口年龄结构预测
镇人口年龄结构
0
10
20
30
40
50
60
70
80
2
0
0
1
2
0
0
7
2
0
1
3
2
0
1
9
2
0
2
5
2
0
3
1
2
0
3
7
2
0
4
3
2
0
4
9
(
%
)
0-14
15-64
65+
图6.4我国镇人口年龄结构预测
乡村人口年龄结构
0
10
20
30
40
50
60
70
80
2
(
%
)
0-14
15-64
65+
图6.5我国乡人口年龄结构预测
13
2005年我国老年人口已超过1亿人,到2020年,65岁以上老年人口将达到1.74亿
人,比重从2005年的8.09%增长到12.02%.预计2050年,65岁以上老年人口达3.38亿
多人,比重达23.23%.老龄化进程加速.老年人口数量多,老龄化速度快,高龄趋势明
显.
人口老龄化将导致抚养比不断提高,尤其是乡老年人口变化显著,50年增加了30多
个百分点.
老年人口比重的不断提高和老年人口绝对数的大量增加,在如何搞好老年人口的衣
食住行和老有所养,老有所乐,老有所为等方面是国家和社会不容忽视的问题.
(6)出生人口性别比问题(持续升高)
中国出生人口性别比自1984年开始失调,伴随着出生人口性别比异常升高的速度
从缓慢到加速,失调从轻度到重度,因而对于出生人口性别比的预测就显得相当重要.
由组合模型和题中附录1中1995-2005年的数据,对出生人口性别比问题进行预测,所
得结果如下图(图7)所示,详细数据查看附录表3.
出生人口性别比
100
105
110
115
120
125
130
135
140
145
1
9
9
4
1
9
9
8
2
0
0
2
2
0
0
6
2
0
1
0
2
0
1
4
2
0
1
8
2
0
2
2
2
0
2
6
2
0
3
0
2
0
3
4
2
0
3
8
2
0
4
2
市
镇
乡
图72006-2043年全国城,镇,乡出生人口性别比变动趋势
出生人口性别比呈上升趋势.城乡失调程度都较高,其中农村失调程度最为严重,
镇人口失调程度略轻于乡人口失调程度,城市人口失调程度又略轻与镇人口失调程度.
如果随着失调情况的进一步增长,导致我国男女人口比例不正常而产生一系列问题.例
如婚姻挤压问题凸现,导致的社会秩序混乱将成为影响社会稳定的严重隐患.
五,模型检验
现有我国1990—2005年的人口总数,出生率和死亡率数据.用MATLAB编写的灰
色GM(1,1)模型和BP神经网络模型的程序,首先根据我国1990-2004年的数据,利用此
组合模型进行预测,将所预测得到的2005年全国人口总数与已有数据进行比较,并验证
组合模型的短期预测精度.
通过计算,可知单独利用GM(1,1)模型进行预测得到的2005年全国人口总数为
13.1727亿人,利用组合模型得到的预测数据为13.0615亿人,实际数值为13.0756亿人.
由此得出GM(1,1)预测的数据与实际数值的绝对误差
1
是0.0961,相对误差
1
ˆ是
0.0074,均方差
1
MSE为0.0687.组合模型得到的仿真数据与实际数值的绝对误差
2
是
14
0.0143,相对误差
2
ˆ是0.00108,均方差
2
MSE为0.00997.显而易见,
12
12
ˆˆ,
12
MSEMSE,此组合模型在人口总数预测方面仿真数据的精确性较单独的
GM(1,1)模型要高得多.
六,模型评价及推广
1,灰色GM(1,1)模型评价推广
(1)灰色GM(1,1)模型优点
灰色GM(1,1)预测模型在计算过程中主要以矩阵为主,它与MATLAB的结合解决了
它在计算中的问题.由MATLAB编制的灰色预测程序简单实用,容易操作,预测精度较
高.
(2)灰色GM(1,1)模型的缺点
该模型是指运用曲线拟合和灰色系统理论对我国人口发展进行预测的方法,因此它
对历史数据有很强的依赖性,而且GM(1,1)的模型没有考虑各个因素之间的联系.因
此,误差偏大,尤其是对中长期预测,例如对中国人口总数变化情况做长期预测时,误
差偏大,脱离实际.下面我们来讨论GM(1,1)模型的适用范围.
GM(1,1)模型的白化微分方程:
(1)
(1)
dX
aXu
dt
其中a为发展系数,
有命题当GM(1,1)发展系数2a时,GM(1,1)模型无意义.
通过分析,可得下述结论:
当0.3a时,GM(1,1)可用于中长期预测;
当0.30.5a时,GM(1,1)可用于短期预测,中长期预测慎用;
当0.50.8a时,GM(1,1)作短期预测应十分谨慎;
当0.81a时,应采用残差修正GM(1,1);
当1a时,不宜采用GM(1,1)
在对中国人口总数变化情况做长期预测时,a=-0.3572,因此只能做短期的预测.
如果要考虑到多因素的联系和影响,此时我们不妨建立GM(1,n)模型.GM(1,N)
模型能模拟系统发展的动态过程,不但吸收了传统的灰色模型的建立,而且建立了多中
改进的灰色模型,提高了预测精度.具体参考[5]
2,BP神经网络模型评价推广
(1)运用BP神经网络进行人口预测的可行性
一个好的人口预测模型首先应符合人口基本理论和数学建模要求,这是选择模型的
关键.其次要保证模型数据可得,一致和可比性,在数据预测检验阶段应充分拟合原始
数据,特别是有波动的数据,因为波动性数据往往蕴藏了系统重要信息.具有P个输入,Q
个输出的BP网络可看作P维欧氏空间到Q维欧氏空间的一个非线性映射,含一个隐含
层的BP网络可以逼近任何连续函数.BP网络的非线性映射与人口非线性特征是相近的,
对于未知的人口动力学系统可通过神经网络来学习系统的表征量并进行预测,已有定理
从数学上保证了网络用于时间序列预测的可行性.网络的输入向量和结构参数可由相空
间重构技术予以确定,同时BP网络的动态学习能力对人口波动性数据具有较强的识别
15
和拟合能力,克服了以往人口预测模型剔除奇异值或划分阶段处理的缺陷.因此从模型
映射性质,输入变量的选择和波动性数据拟合等方面表明BP神经网络模型用于人口预
测是可行的.用神经网络对人口历史数据进行分析拟合,是人口预测的有效方法.与传
统的人口预测方法相比,将基于BP神经网络的时间序列预测方法用于人口预测,避免
了繁琐的常规建模过程.神经网络模型良好的适应和自学习能力,使预测系统计算简单,
灵活,运用计算机强大的组合能力,可以更好地实现人口分类预测和管理,大大提高人
口预测效率和预测精度.
(2)BP神经网络模型的不足:
BP神经网络需要大量的样本数据用来训练和测试,当样本数量不够时,预测的误
偏差很大.
针对这些问题,我们提出GM(1,1)和BP神经网络的组合模型,这样利用灰色系统
理论具有所需要的样本数据少,原理简单,运算方便,短期预测精度高等优点,也发挥
了神经网络并行计算,容错能力强,自适应能力强等优点.
七,我们的一些建议
(1)今后20年前后我国人口趋于年青化的发展态势,之后人口老年化的趋势逐渐
显著,且成年群体的负担会越来越重.鉴于此,要加强发展基层的养老保险等社会保障
事业,现在的年轻群体可以投入这样的组织来保障老年的生活,同时也减轻年轻一代的
负担.
(2)继续实施计划生育政策,促使人口健康,稳定发展,并利用教育,宣传等形式
来.引导男女性别比的协调发展,如果按照上述的态势发展,势必会造成一系列严重的
社会问题.
(3)发挥地区优势,创造就业机会,我国的优势,发展自己的经济,活跃市场,给上
述的群体创造更多的就业和再就业机会.
结语:
此组合模型将灰色GM(1,1)模型与BP神经网络模型相结合,既利用灰色预测的需
要数据少的优点,又吸收了BP神经网络容错能力,自适应能力强的优点.此组合模型简
单,实用,特别是在原始数据非常有限的情况下,可以得到相当精度的拟合数据,并能
得到可靠的预测数据.
由于神经网络的功能之强大,型式之多样,若能将其它网络形式同灰色模型相结合,
则有可能进一步提高预测精度,并能在人口预测方面发挥更大的作用.
参考文献:
[1]邓聚龙,灰预测与灰决策,武汉:华中科技大学出版社,2002年.
[2]闻新周露李翔张宝伟,MATLAB神经网络仿真与应用,北京:科学出版社,2003.
[3]飞思科技产品研发中心,MATLAB6.5辅助神经网络分析与设计,北京:电子工业出版
社,2003.
[4]2001-2050年全国总人口变动情况预测,
/tjsj/tjsj_cy_?id=1422,2007年9月21日.
[5]邓聚龙,多维灰色规划,武汉:华中理工大学出版社,1989年.
16
附录
附表12001-2050年全国总人口变动情况预测
单位(亿人)GM(1:1)模型BP神经网络
GM(1,1)和BP
神经网络组合
国家2003人口
计生委预测结
果(TFR=1.8)
199011.433311.433311.4333
199111.679611.582311.5823
199211.780411.717111.7171
199311.88211.851711.8517
199411.984611.98511.985
199512.08812.112112.1121
199612.192412.238912.2389
199712.297612.362612.3626
199812.403712.476112.4761
199912.510712.578612.5786
200012.618712.674312.6743
200112.727612.762712.762712.87
200212.837412.845312.845312.97
200312.948212.922712.922713.06
200413.0612.998812.998813.15
200513.172713.075613.075613.24
200613.172713.15713.172713.33
200713.286413.248913.286413.42
200813.40113.342713.40113.51
200913.516713.436613.516713.61
201013.633313.528313.633313.7
201113.75113.615413.75113.8
201213.869613.696113.869613.9
201313.989313.768813.989314
201414.110113.832814.110114.1
201514.231813.887814.231814.19
201614.354613.934114.334114.27
201714.478513.972214.433214.35
201814.603514.002814.523814.42
201914.729514.026814.605314.48
202014.856614.044914.677514.54
202114.984814.057914.740714.59
202215.114114.066214.795214.63
202315.244614.070414.841614.67
202415.376114.070814.880714.7
202515.508814.067714.913114.73
202615.642714.061214.939614.76
17
202715.777714.051314.96114.78
202815.913814.038114.97814.8
202916.051214.021614.99114.81
203016.189714.001615.000714.83
203116.329413.978315.007414.84
203216.470313.951615.011614.85
203316.612413.921715.013614.85
203416.755813.888915.013514.86
203516.900413.853815.011714.86
203617.046313.816615.008314.86
203717.193413.778215.003414.86
203817.341713.739514.997214.86
203917.491413.701214.989714.85
204017.642413.664214.98114.83
204117.794613.629314.97114.81
204217.948213.59714.959914.79
204318.103113.567714.947814.76
204418.259313.541614.934714.72
204518.416913.518814.920514.68
204618.575813.499114.905514.63
204718.736113.482414.889614.58
204818.897813.468314.87314.53
204919.060913.456614.855814.4600
205019.225413.447014.838114.4000
附表22001-2050年我国人口城镇化水平变化趋势
市镇乡人口城镇化(%)
20010.2420.12970.628337.17
20020.25750.12980.612738.73
20030.2620.14410.593940.61
20040.26650.15790.575642.44
20050.27110.1710.557944.21
20060.27580.18340.540845.92
20070.28060.19520.524247.58
20080.28550.20650.50849.2
20090.29040.21720.492450.76
20100.29540.22730.477352.27
20110.30050.23690.462653.74
20120.30570.24590.448455.16
20130.3110.25440.434656.54
20140.31640.26240.421257.88
20150.32190.26980.408359.17
18
20160.32750.27680.395760.43
20170.33310.28330.383661.64
20180.33890.28930.371862.82
20190.34480.29480.360463.96
20200.35070.30.349365.07
20210.35680.2960.347265.28
20220.3630.29350.343565.65
20230.36930.29020.340565.95
20240.37570.28670.337666.24
20250.38220.28310.334766.53
20260.38880.27980.331466.86
20270.39550.27670.327867.22
20280.40240.27380.323867.62
20290.40930.27150.319268.08
20300.41640.26930.314368.57
20310.42360.26740.30969.1
20320.4310.26550.303569.65
20330.43840.2640.297670.24
20340.4460.26220.291870.82
20350.45370.26040.285971.41
20360.46160.25820.280271.98
20370.46960.25560.274872.52
20380.47770.25280.269573.05
20390.4860.24930.264773.53
20400.49440.24550.260173.99
20410.50290.24120.255974.41
20420.51160.23620.252274.78
20430.52050.23050.24975.1
20440.52950.22450.24675.4
20450.53870.21780.243575.65
20460.5480.21080.241275.88
20470.55750.20320.239376.07
20480.56710.19530.237676.24
20490.5770.18670.236376.37
20500.5870.17780.235276.48
附表32006-2043年全国城,镇,乡出生人口性别比变动情况预测
年代市男女出生比例(女100计)镇男女出生比例(女100计)乡男女出生比例(女100计)
1994114.52124.33116.15
1995111.92115.62117.75
1996111.68111.68117.7
1997108.81125.9118.85
19
1998110.68108.73119.98
1999110.27118.4122.03
2000113116.3119.3
2001109.28116.02117.59
2002111.37123.12122.11
2003112.06110.97120.9
2004114.44126.9122.21
2005113.92117.21121.21
2006113.3065120.1293122.2317
2007113.5967120.6005122.6144
2008113.8876121.0735122.9983
2009114.1793121.5483123.3834
2010114.4718122.025123.7697
2011114.765122.5036124.1573
2012115.0589122.9841124.546
2013115.3536123.4664124.9359
2014115.649123.9507125.3271
2015115.9452124.4368125.7195
2016116.2422124.9249126.1131
2017116.5399125.4148126.508
2018116.8384125.9067126.9041
2019117.1376126.4005127.3014
2020117.4377126.8963127.7
2021117.7384127.3939128.0998
2022118.04127.8936128.5009
2023118.3423128.3952128.9032
2024118.6454128.8988129.3068
2025118.9493129.4043129.7117
2026119.2539129.9118130.1178
2027119.5594130.4214130.5252
2028119.8656130.9329130.9339
2029120.1726131.4464131.3438
2030120.4804131.9619131.7551
2031120.789132.4795132.1676
2032121.0983132.9991132.5814
2033121.4085133.5207132.9965
2034121.7194134.0444133.4129
2035122.0312134.5701133.8307
2036122.3437135.0979134.2497
2037122.6571135.6277134.67
2038122.9712136.1597135.0917
2039123.2862136.6937135.5146
2040123.602137.2298135.9389
20
2041123.9185137.768136.3646
2042124.2359138.3084136.7915
2043124.5541138.8508137.2198
BP神经网络的matlab程序
p=p1';t=t1';
[pn,minp,maxp,tn,mint,maxt]=premnmx(p,t);%原始数据归一化
net=newff(minmax(pn),[5,1],{'tansig','purelin'},'traingdx');%设置网络,建立相应的BP网络
=2000;%训练网络
=0.01;
=100000;
=1e-5;
[net,tr]=train(net,pn,tn);%调用TRAINGDM算法训练BP网络
pnew=pnew1';
pnewn=tramnmx(pnew,minp,maxp);
anewn=sim(net,pnewn);%对BP网络进行仿真
anew=postmnmx(anewn,mint,maxt);%还原数据
y=anew';
GM(1,1)的matlab程序
gm.m:
functionf=gm(x0,m)%定义为函数gm(x)
n=length(x0);
x1=zeros(1,n);
x1(1)=x0(1);
fori=2:n%计算累加序列x1
x1(i)=x1(i-1)+x0(i);
end
i=2:n;%对原始数列平行移位并负值给y
y(i-1)=x0(i);
y=y';
i=1:n-1;
c(i)=-0.5*(x1(i)+x1(i+1));
B=[c'ones(n-1,1)];
au=inv(B'*B)*B'*y;%计算参数a,u矩阵
i=1:m;%计算预测累加数列的值
ago(i)=(x0(1)-au(2)/au(1))*exp(-au(1)*(i-1))+au(2)/au(1);
yc(1)=ago(1);
i=1:m-1;%还原数列的值
yc(i+1)=ago(i+1)-ago(i);
i=2:n;
21
error(i)=yc(i)-x0(i);%计算残差值
yc(1)=ago(1);
i=1:m-1;%修正还原数列的值
yc(i+1)=ago(i+1)-ago(i);
c=std(error)/std(x0);%计算后验差比
relerror=abs((error)-mean(error)*ones(size(error)));
[nrow,ncol]=size(relerror);
p=0;
fori=2:ncol
ifrelerror(1,i)<0.6745*std(x0)
p=p+1;
end
end
p=p/(n-1);
w1=min(abs(error));
w2=max(abs(error));
i=1:n;%计算关联度
w(i)=(w1+0.5*w2)./(abs(error(i))+0.5*w2);
w=sum(w)/(n-1);
au%输出参数a,u的值
ago;%输出累加数列ago的值
x0;%输出原始序列值
f=yc;%输出预测的值
error;%输出残差的值
c;%输出后验差比的值
p;%输出小误差概率的值
w%输出关联度
end
本文发布于:2022-11-15 12:30:02,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/88/24274.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |