第37卷第5期周口师范学院学报2020年9月V o l.37N o.5J o u r n a l o f Z h o u k o u N o r m a l U n i v e r s i t y S e p t.2020
几种改进的GM(1,1)模型在我国疟疾中的应用
马霞1,刘政旺1,陈娜2
(1.太原工业学院理学系,山西太原030008;2.周口师范学院,数学学院,河南周口466000)
摘要:疟疾是一种虫媒传染病,利用2012-2019年我国疟疾的年发病数据,采用加速平移变换㊁一阶平滑变
换㊁三点平滑㊁加权均值生成㊁改进的加速加权㊁自然对数对原数据进行优化处理,建立GM(1,1)模型,将模型
预测值和实际数据对比,通过精度检验值和数值模拟,得出改进后的模型能较好地预测我国疟疾的发病情况.
关键词:灰色GM(1,1)模型;疟疾;加速平移变换;加权均值生成;预测
中图分类号:O175文献标志码:A 文章编号:16719476(2020)05001805
D O I:10.13450/j.c n k i.j z k n u.2020.05.005
疟疾(M a l a r i a)是由疟原虫引起的虫媒传染病,可通过蚊子在人与人之间传播,是全世界最重要的寄生虫感染疾病之一.疟疾曾经严重威胁人们的健康,曾在2014年有近百个国家和地区出现持续性的疟疾传播[1].疟疾在我国流行也十分猖獗,曾造成发病人数达各类传染病之首.新中国刚成立不久,疟疾在我国1800多个县流行,传播范围十分广泛[2].疟疾的预防和控制之所以困难主要原因是由于疟原虫及媒介蚊虫繁殖速度快,免疫力强,难以全部消灭,同时也缺乏有效的疫苗,结果使得人类能够反复感染疟疾.
目前,关于疟疾的预测研究较少,国内主要研究疟疾大都是以区域为单位,其中周菊静,怀根娣等[3]分析了2010~2015年江阴市疟疾流行情况.将病例按照月份㊁年龄㊁性别㊁行业㊁输入还是本地进行了分类,结果发现1~9月份为高发病期,其中20~29岁男性输入病例占比较大㊂灰色模型在预测手足口病㊁电力负荷㊁儿童死亡率等方面已有较多的应用[4-6].灰色模型基于数据本身,在原始数据量小的情况下就可以实现预测精度较高的结果,对数据处理简便㊁快捷㊁准确度高㊁计算也十分方便,对样本容量和概率分布没有严格的要求,一定程度上有助于减少时间序列的随机性和提高预测精度[7].GM(1,1)预测模型对于原始数据是震荡的拟合效果不理想,需要进一步的改善,原始序列的不光滑性导致预测效果误差较大[8].本文根据我国基本控制中心发布的2012-2019年疟疾的发病数据[9],采取几种数据优化处理的方法建立GM(1,1)灰色模型,对我国疟疾的发病情况进行预测,为疟疾的防治工作提供依据.
1数据资料与计算方法
1.1数据来源
2012-2019年我国疟疾发病数来源于疾病预防控制中心网站公布的法定传染病数据,见表1. 1.2 GM(1,1)模型的建立
设变量X(0)=(x(0)(1),x(0)(2), ,x(0)(n))为非负原始序列,首先对X(0)做积生成数列X(1)= (x(1)(1),x(1)(2), ,x(1)(n)),其中x(1)(k)=ðk i=1x(0)(i)=x(1)(k-1)+x(0)(k)(k=1,2, ,n),则定义
GM(1,1)模型的白化微分方程为d X(1)d t+a X(1)(t)=b,其中a为发展系数,b为灰作用量.a和b可
收稿日期:20200518;修回日期:20200605
基金项目:太原工业学院重点科研基金项目 生物模型的动力性态研究 (2016L Z02)
作者简介:马霞(1990-),女,河南驻马店人,硕士,讲师,研究方向:动力系统,生物统计.
以利用最小二乘法求解的参数,则GM (1,1)模型的预测序列为^X (1)(k +1)=(x (0)(1)-b a )
e -a k
+b a
,k =1,
2, ,n -1,其中k 为时间序列.表1 我国疟疾2012-2019年的发病人数
年份/月份
20122013201420152016201720182019126030727825033327525526821652532162363391982682303165194169244258208182167420535424327530422621417553054053243543693002311956341882344386356312230231729968334035828130324426182592882912632352592332269
177238255243222208237220102212252292252101942072001121321022221119519020825812210
203
212
244
239
183
181
204
总计28204242312332893341285626902635由表1可以看出,2013年发病人数为最高,2014-2016呈现递增趋势,2016-2019呈现递降趋势,
序列属于震荡序列,不属于光滑序列,且序列的级比并不都在规定范围内,所以原始序列不适合进行建模预测.本文去掉前两年的数据,选取2014-2019年的数据作为研究对象,
对数据优化处理:三点平滑处理㊁加速平移变换㊁加权均值生成㊁加速平移变换和加权均值生成混合使用㊁一阶平滑变.对原始数据进行处
理后,用级比公式计算数列级比λ(k ),当所有的级比都在(e -2
n +1
,e
2
n +1
)范围内,则数列可以用GM (1,1
)进行建模并预测.
1.3 改进的GM (1,1
)模型的建立设原始序列X (0)=x (0)(1),x (0)(2), ,x (0)(n )
,其中x (0
)(k )⩾0,k =1,2, ,n (1
)加速平移变换[10一鼓作气的主人公是谁
]M =m a x x (0)(k )|k =1,2, ,n ,m =m i n x (0)
(k )|k =1,2, ,n 则称T =M -m 为序列X (0)的振幅.令x (0)(k )d 1=x (0)
(k )-(
k -1)T ,k =1,2, ,n ,则变换后的序列为:X (0)D 1=(x (0)(1)d 1,x (0)(2)d 1, ,x (0)(n )d 1).
(2)一阶平滑变换[11]x (0)(k )d 2=((x (0)(k )+T )+(x (0)
(k +1)+T )
)/4,k =1,2, n -1其中T 为X (0)的振幅,则变化后的数列为X (0)D 2=x (0)(1)d 2,x (0)(2)d 2, ,x (0
)(n )d 2
(3
)三点平滑处理x (0)(1)d 3=3x (0)(1)+x (0)(2) /4, x (0)(n )d 3=x (0)(n -1)+3x (0)
(n ) /4x
(0
)(k )d 3=x (0)(k -1)+2x (0)(k )+x (0)(
k +1) /4,k =2,3, ,n -1则变换后的序列为:X (0)D 3=(x (0)(1)d 3,x (0)(2)d 3, ,x (0)
(n )d 3)
(4
)加权均值生成[10]
x
(0
)(k )d 4=ðk
i =1
x (0)
(
i ) /k ,k =1,2, ,n 为加权均值生成变换,变换后的序列为:X (0)D 4=(x (0)(1)d 4,x (0)(2)d 4, ,x (0)
(n )d 4).
(5
)改进的加速加权变换首先对原序列进行改进的加速平移变换,令x (0)(k )d 5=x (0)(k )-(溥仪简介
k -1)T *
,k =1,2, ,n ,其中T *
=(M -m )/7,然后,对所得的序列进行加权均值生成得,x
(0
excel
)(k )d 6=ðk
i =1
x (0
)(
i ) /k ,k =1,2, ,9
1第37卷第5期
马霞,等:几种改进的GM (1,1
)模型在我国疟疾中的应用
02周口师范学院学报2020年9月n.
(6)自然对数处理
x(0)(k)d7=l n x(0)(k),k=1,2, ,n
变换后的序列为:
番茄炒肉X(0)D7=x(0)(1)d7,x(0)(2)d7, ,x(0)(n)d7.
通过加速平移变换㊁一阶平滑变换㊁三点平滑㊁加权均值生成㊁改进的加速加权㊁自然对数对原数据进行优化处理依次对原始序列进行处理,得到新序列值见表2.根据处理过的序列进行GM(1,1)建模,利用MA T L A B软件求出其中的发展系数-a,灰色作用量b,平均相对误差Q,均方差C和小误差概率P,得出不同方法建立模型的预测值见表3.
表2我国2014-2019年疟疾发病人数处理后的数据值
年份201420152016201720182019
发病数312332893341285626902635
加速平移变换312339954753497455146165
一阶平滑变换19562010.51902.251739.51684.25-
三点平滑变换3164.53260.53206.752935.752717.752648.75
加权均值生成3123320632513152.253059.82989
改进的加速加权31233256.433351.863303.543261.513241.14
自然对数处理8.0478.0988.1147.9577.8977.877
表3基于处理后的数据建立的改进模型的预测值
预测值/年份201420152016201720182019202020212022
加速平移变换312341114545502555556141678975058297
一阶平滑变换195620091887177316651564147013801296
三点平滑316533013119294327782621247423352203
加权均值生成312332573193313030693009295028922835
改进的加速加权312332903266324132183195317131483125
自然对数8.0478.1218.0547.9887.9227.8577.7927.7287.665将上表中的预测值还原为预测发病人数,具体公式如下:
设预测值为Y^(0)=y^(0)(1),y^(0)(2), ,y^(0)(9)
(1)加速平移变换
根据y^(0)(k)=x^(0)(k)-(k-1)T,k=1,2, ,n,可以得到
x^(0)(k+1)=y^(0)(k+1)-k T,k=1,2, ,n-1,x^(0)(1)=y^(1)(1)
所以得到预测值为:
X^(0)=(x^(0)(1),x^(0)(2), ,x^(0)(9))=(3123,3405,3133,2907,2731,2611,2553,2563,2649)
(2)一阶平滑变换
根据x(0)(k)d6=((x(0)(k)+T)+(x(0)(k+1)+T))/4,k=1,2, ,n-1,
培美曲塞说明书
当k=1时,x^(0)(2)=4y^(0)(1)-x^(0)(1)-2T,则y^(0)(1)=y(0)(1)=(x(0)(1)+T)+(x(0)(2)+T)
4
所以,x^(0)(2)=4y^(0)(1)-x^(0)(1)-2T=x(0)(2),以此类推,得到预测值为:
X^(0)=(x^(0)(1),x^(0)(2), ,x^(0)(9))=(3123,3289,3335,2802,2877,2372,2094,2016,1759)
(3)加权均值生成
根据y^(0)(k)=ðk i=1x^(0)(i)/k,k=1,2, ,n,
可以得到x^(0)(k)=k y^(0)(k)-ðk-1i=1x^(0)(i),k=2,3, ,n.其中x^(0)(1)=x(0)(1),进而可得,x^(0)(k+1) =k y^(0)(k+1)-k y^(0)(k),k=1,2, ,n-1.所以得到预测值为:
X^(0)=(x^(0)(1),x^(0)(2), ,x^(0)(9))=(3123,3391,3065,2942,2823,2708,2595,2487,2381) (4)改进的加速加权变换
将(1)和(3)结合,可以得到
x^(0)(k+1)=k y^(0)(k+1)-k y^(0)(k)-k T,k=k=1,2, ,n-1
其中x^(0)(1)=x(0)(1)不变,T=(m a x(X(0))-m i n(X(0)))/7.得到了更好的预测值
X^(0)=(x^(0)(1),x^(0)(2), ,x^(0)(9))=(3123,3355,3016,2868,2720,2573,2427,2280,2165) (5)自然对数
根据y^(0)(k)=l n x^(0)(k),k=1,2, ,n可以得到x^(0)(k)=e y^(0)(k),所以得到预测人数为:
X^(0)=(x^(0)(1),x^(0)(2), ,x^(0)(9)=(3123,3365,3148,2946,2758,2584,2422,2272,2132)通过以上方法的还原,最终得到不同方法建立的模型预测的2014-2022年疟疾的发病人数见表4.通过模型的预测人数与实际数据进行对比,采用平均相对误差㊁均方差比㊁小误差概率进行检验,检验结果见表5.由上表的精度值可以得出,原始序列经过上述方法处理后,建立的GM(1,1)模型中,相对误差(Q)由小到大的排序是,加速平移变换<;三点平滑变换<;改进的加速加权<;自然对数<;一阶平滑变换<;加权均值生成.均方差比值(C)由小到大的排序是,加速平移变换<;自然对数<;三点平滑变换<;改进的加速加权<;一阶平滑变换<;加权均值生成.小误差概率(P)最小的是一阶平滑变换,为0.8,其他均为0.
8333.通过上述六种方法处理后的预测值精度都达到了二级,可以预测未来我国三年疟疾的发病情况.利用MA T L A B软件将上述六种方法处理后的原始序列建立的模型计算出的预测值呈现在曲线图中进行比较,如图1所示.通过数值模拟的结果和模型的精确值,平均相对误差来看改进的加速加权的结果较好,适合中长期预测.
表4我国2014-2021年疟疾发病人数的预测值
发病人数/年份201420152016201720182019202020212022加速平移变换312334053133290727312611255325132449一阶平滑变换312332893335300228772372209420161759三点平滑316533053119294327782621247423352203加权均值生成312333913065294228232708259524872381改进的加速加权312333553016286827202573242722802135自然对数312333653148294627582584242222712132
表5改进的GM(1,1)模型的精度检验值
加速平移变换一阶平
滑变换
三点平
滑处理
加权均
值生成
改进的加
速加权
自然对
数处理
平均相对误差(Q)0.0233
(二级)
0.0317
(二级)
0.0255
(二级)
0.0368
(二级)
0.026
(二级)
0.0262
(二级)
均方差比(C)0.3439
(二级)
0.4737
(二级)
0.3739
四级几分算过(三级)
0.4968
(二级)
0.3837
包头博物馆(二级)
0.3549
(二级)
小误差概率(P)0.8333
(二级)
0.8
(二级)
0.8333
(二级)
0.8333
(二级)
0.8333
海南省高考(二级)
0.8333
(二级)
12
第37卷第5期马霞,等:几种改进的GM(1,1)模型在我国疟疾中的应用
图1 模型预测的疟疾发病人数与法定报告的发病人数对比曲线图
2 结论
本文用改进的GM (1,1
)模型对我国疟疾的发病情况进行了预测,进行了相应的平均相对误差㊁方差比检验和小误差概率检验,并做出了精度等级评判.根据这几种检验结果可以得出,改进的GM (1,1)模型可以用来预测我国疟疾的流行发病情况.参考文献:
[1]胡琴晴.三类疟疾传播模型的定性分析[D ].华中师范大学,2015.
[2]毕艳.3S 技术支持下云南热带地区疟疾流行态势的研究[D ].云南师范大学,2005.
[3]周菊静,怀根娣,华金祥.2010-2015年江苏省江阴市疟疾流行情况分析[J ].医学动物防制,2017,33(01):112-116.
[4]宋媛媛,王雷,熊甜.灰色预测模型GM 11在手足口病发病率预测中的应用[J ].公共卫生与预防医学,2018,29(5):51
-54.
[5]孙建梅,钱秀婷,王永晴.基于改进灰色模型的中长期电力负荷预测[J ].电工技术,2019,19(31):28-31.
[6]庞艳蕾,张惠兰,李向云等.灰色模型GM (1,1)和A R I MA 在拟合全国婴儿㊁5岁以下儿童死亡率中的应用[J ].中国
卫生统计,2015,32(03):461-436.
[7]刘思峰,杨英杰,吴利丰等.灰色系统理论及其应用.第3版.[M ].北京:科学出版社,2004:1-15.
[8]邵珠艳,王春梅,魏曼莎.灰色GM (1,1)预测模型在疾病预测中的应用[J ].中国医院统计,2003,10(3):146-148.
[9]C h i n e s e C e n t e r f o r D i s e a s e C o n t r o l a n d P r e v e n t i o n :Y e a r l y r e p o r t o n i n f e c t i o u s d i s e a s e i n C h i n a [E B ].h t t p ://w w w.c h i -n a c d c .c n /t j s j /f d c r b b g /i n d e x .h t m l /.A c c e s s e d 12M a y 2
020.[10]钱吴永,党耀国.基于振荡序列的GM (1,1)模型[J ].系统工程理论与实践,2009,29(03):149-154.
[11]曾波,刘思峰.基于振幅压缩的随机振荡序列预测模型[J ].系统工程理论与实践,2012,32(11):2493-2497.
(责任编辑 杨建辉)
22
周口师范学院学报
2020年9月