基于SEIR模型的国内疫情数据走势分析综述
徐显豪 张思源2
(大庆师范学院机电工程学院 黑龙江 大庆 163000)
摘 要:现如今国内疫情情况相对稳定,然国外疫情正处于高发时期。首先介绍了新冠肺炎爆发以来对国内外造成的影响,随后通过对主要的传染病动力学模型SI、SIS、SIRnationstar、SEIR四个模型进行分析,比对出适合本次疫情的SEIR模型;对拐点和结束时间的预测、疫情防控措施的论证和基本再生数的论证三个方面进行深度模型分析;通过早期某些学者搭建的不完善的SEIR模型,讨论模型的局限性,并且研究分析改进后的SEIR模型特点;最后以减少模型误差、提高模型的拟合度为目的进行扩展探究。
关键词:SEIR模型;COVID-19;基本再生数;传染动力学模型
REVIEW OF DATA TREND OF COVID-19 IN CHINA BASERD ON SEIR MODEL
Xu xianhao
(Department of mechanical and electrical engineering,Daqing Normal University,Daqing 163000,Heilongjiang,China)
成都最好的留学中介Abstract At prent, the domestic epidemic situation is relatively stable, but the foreign epidemic situation is in a period of high incidence.This paper first introduced the impact of COVID-19 on domestic and foreign countries since the outbreak of COVID-19, and then analyzed the main epidemic dynamics models SI, SIS, SIR and SEIR, and compared the SEIR model suitable for this epidemic.In-depth model analysis was conducted on three aspects: prediction of inflection point and end time, demonstration of epidemic prevention and control measures and demonstration of basic regeneration number.Through the imperfect SEIR model t up by some early scholars, the limitations of the model are discusd, and the characteristics of the improved SEIR model are studied and analyzed.Finally, to reduce the model error, improve the model fit degree for the purpo of the extension of the study.
Keywords: SEIR model2011年一本分数线 COVID-19 Basic reproduction number Infection dynamics model
0 引 言
2019年12月,武汉某些医院陆续发现多起未知的肺炎病例,并于2020年1月12日世界卫生组织将其命名为新型冠状病毒(2019-nCov,后正式改名为COVID-19)[]。通过此次新冠肺炎病毒让世界认识到传染病动力学模型在传染病疫情的预测、科学评判和指导防控措施中起到决定性的作用。其中对传染病的分析及预测,前期已经有了一些成熟的传染病动力学模型,如SI模型、SIR模型、SIS模型以及SEIR模型等[]。本文首先对以上四种模型进行剖析,其次联合新冠肺炎病毒疫情的发展历程,探讨国内外学者基于SEIR模型对国内新冠肺炎疫情仿真预测的研究结果,得出确切的依据,最后为将来的疫情仿真预测提出诚恳的意见。
1 传染病动力学模型研究分析
在引言中提到了,四种动力学模型有SI模型、SIR模型、SIS模型、SEIR模型。为了以下探讨中的便利,研究学者一般把传染病流行范围内的人群分为:易感染者(Susceptible,以下简称S)、潜伏者(Expod,以下简称E)、感染者(Infected,以下简称I)和移出者(Removed,以下简称R)。
1.1经典SI、SIS、SIR模型分析
1.1.1 经典SI模型分析
流行病传播的经典SI动力学模型是流行病数学建模中最简单的方法[]。一个群体中包括了两个群体,分别是S和I。该模型特点[]在于病毒无潜伏期、患者无治愈情况也无免疫力。假定总人数为N,且总人数不变,t时刻两类人群分别占总人数的S(t)、I(t),且初始时刻t=0时,易感染者和感染者的初始值为S0、I0;感染者的日接触数为λ。
1.1.2 经典SIS模型分析
SIS模型和SIR模型都是由Kermack和McKendrick[][][]为了研究孟买地区的瘟疫的传播情况时提出的。SIS模型[]是设定康复者不具备免疫能力。这种病毒传播有个及其特别之处在于可多次感染但可治愈却不能被免疫。
1.1.3 经典SIR模型分析
Kermack和McKendrick在1927年提出了SIR模型,其中假设传染时期短暂,故忽略了人口
的出生率与死亡率。SIR模型相对于SIS模型有一定的优越性,它增加了移出者,在SIR模型中移出者代表感染者可治愈且治愈后终身免疫。
1.1.4 三种模型比较分析
从上面三个模型的介绍,可以得知在本次新冠肺炎病毒的疫情走势分析中使用SI、SIS或SIR模型都是有一定缺陷的。考虑到潜伏期的SEIR模型对本次的疫情走势分析进行仿真预测。
1.2 经典SEIR模型分析
SEIR模型是在传染病数据研究中所使用的经典模型之一。设定总人数为N,并且依照模型的传染病流行范围将其分为了易感染者S、潜伏者E、感染者I、移出者R四类。每个之间按照对应的概率进行转变。对于SEIR模型的运用中,Ramadhan等通过构建SEIR数学模型,来模仿埃博拉病毒在两个区域之间的相互传播,得到一个地区的感染者人群不光是通过易感人群或潜伏期人群转变过来,也可通过跨区域的传播的结论。通过计算基本再生数来确定埃博拉的传播稳定性;Huang Jicai等人[ankles]在中国麻疹季节传播动态的仿真分析中构建了
一个以SEIR模型为基础的、具有周期性传染率的易感、暴露(潜伏)、传染和恢复的模型,以研究季节性麻疹流行转态和疫苗的接种效果。
2 基于SEIR模型的新冠肺炎疫情数据分析
当前在流行病动力学模型中,SEIR模型相对于其他模型考虑了潜伏期的存在。绝大多数研究者选择基于SEIR模型进行对疫情的仿真和发展预测,也有部分学者采用机器学习中的最小二乘法、梯度下降法或长短期记忆网络等方法对数据进行训练。
2.1 对拐点和结束时间的预测分析
在L Peng等人[]搭建的广义SEIR模型能够对不同五个地区进行了拐点和结束时间的预测,测得武汉疫情将在四月初结束,湖北其余城市将在3月中旬结束。范如国等[]通过模拟不同潜伏期(5天、7天、10天)的新冠肺炎发展趋势对用武汉疫情峰值确诊病例(29000、31500、34100),并预测其拐点出现的时间在2月20日~25日之间。魏永越等人[]建立传播动力学模型,对疫情进行数据拟合和预测。钟南山院士团队在模型建立中创新性的增加了长短期记忆神经网络(Long short-term memory, LSTM)[][]的方法对2003年的SARS[]数据进行训练(SARS和COVID-19同属于新冠病毒),从而辅助预测本次的新冠肺炎疫情。LSTM模型将SARS冠状病毒数据样本的时间片步长设置为3。研究人员将2019年1月22日至2月7日全国新冠肺炎病毒新发病例数放入训练后的LSTM模型中进行训练,从而获得全国新感染病例数预测和2020年2月8日后80天累积感染趋势图,并且考虑到了1月23日前后中国春节导致的人口迁移问题[]。
该模型考虑到了中国大规模春运问题,故有以下几个假设:其一是易感染群体的流入或流出,设为Sin(t)/Sout(t);其二是潜伏者人群的流入或流出(其中假设所有的潜伏者人群的流入皆来自于湖北)。经过SEIR模型和LSTM模型的分别预测得出,在2月4日到7日之间武汉市每日感染病例超过4000。
冰心 笑
2.2 对疫情防控措施的论证
蔡洁等研究人员[]构建的SEIR模型通过不同管控开始时间(10天、15天、20天)、管控强度(病例接触人数10、7、3)对新冠肺炎疫情的影响进行分析比较,从封城后第10天开始管控比第15天、20天开始,感染者峰值比分别减少了160.95%、98.67%。病例接触3人和7人、10人相比,感染者峰值相对减少了34.84%、49.21%;Li Wenning等研究人员enhance[]在改进后的SEIR模型中,按照防控措施,将新冠肺炎疫情分为了初级阶段、爆发阶段以及控制阶段。另外,考虑到了健康保障、出行限制、社会疏离、密切接触追踪以及并发后到住院的时间。最后,将潜伏者和感染者细分为了孤立人口和流动性人口;在曹盛力等研究人员对接英文[]共同建立的CIVID-19 SEIR模型中考虑到潜伏期新冠患者传播能力和追踪隔离干预措施情况,以实际数据重新拟合得到新的动力学参数,结合欧拉数值方法,最终测出防控隔离和医学追踪隔离对遏制新冠肺炎传播的重要性以及集中接收和分层治疗等措施对感染人数回落起关键作用。
2.3 对基本再生数的论证
在1911年出版的《The prevention of malaria》[]中Ross在研究疟疾在人群和媒介(蚊子)
中传播的数学模型中,首次提出了标准发生率(standard incidence rate)这一标准,并且在模型的分析中,他推断降低或控制住某一病发地区的疟疾爆发情况,可以通过减少该地区蚊子种群的数量来实现。与此同时他也明确的提出了传染病动力学中的“阈值”的概念,也就是当一个病原体进入全是易感染者的群体中,如果感染期间的平均感染个体持续保持在大于1的状况,那么疾病将持续流行。在此之后这也被McKendrick与Kermacknaval academy[][]的研究中,给出了形式化的定义,并称之为基本再生数(Basic Reproduction Number)。
周涛等[]人基于SEIR仓室模型,参考SARS的流行病学关键参数及已公布的疫情实时数据,估计出此次2019-nCoV(COVID-19)的基本再生数在2.8~3.3之间。通过李静等人[]运用基于多项式回归时变参数的SEIR模型以及基于多层感知机MLP时变参数的SEIR模型对基本再生数进行演算,分别得基本再生数为1.69和1.49。这两个数值皆小于钟南山院士团队早期对新冠肺炎疫情基本再生数的估计范围2~3之间数学sub[]。
谢家荣及其团队[]通过分阶段滚动SEIR模型,基于国家卫生健康委员会公布的确诊人数,对新冠肺炎疫情的基本再生数进行滚动测量。
2.4其他模型对疫情的拐点和发展趋势预测分析
2011上海高考英语
在这次的疫情预测分析中,诸多学者并非都应用SEIR模型进行扩展分析疫情发展事态,也有不少学者使用SIR模型、GGM 模型等。如:喻孜等人[]基于SIR模型利用易感再生数、当日感染率及考虑到潜伏期感染率求解具有时变特性的参数变化解读该阶段政府防控措施产生的效果;尹楠[]通过构建新冠肺炎疫情扩散的SIR模型分别对疫情的平均感染者数量、交叉感染以及接触性感染三个方面进行仿真模拟,从而找出预防和控制疫情蔓延的策略;王志心等人[]在构建自己的SIR模型中,融入了机器学习的方法(最小二乘准则[]和梯度下降法)对新冠肺炎的拐点进行了预测,最终结果是在20年1月25日后的16天到18天(2月13日左右)左右会出现拐点;张琳[]通过一般增长模型(Generalized Growth Model,GGM)从指数、次指数、次线性函数的增长三种方式对本次疫情发展过程进行拟合,其拟合结果与现实数据高度拟合,为这次的疫情防控效果以及发展趋势提供了有利的参考。
3 模型的局限性及重要参数分析
3.1 模型的局限性
在从疫情刚刚爆发时的研究看来,无论是考虑到了存在潜伏期的SEIR模型还是SIR模型以及其他流行病动力学模型,都有一定的局限性。因为流行病的传播过程中不仅需要考虑到
自然因素,也需要考虑到人为因素;在预测前必须做到全面的了解疾病的传播方式、特征及其他重要因素:一是在疫情爆发前期,没有考虑到病毒存在有潜伏期或有无症状感染者的存在;二是,在封城时期整治春运时期,人口迁移问题在中国对疫情预测时有很大的影响;三是,在前期疫情数据较少且不完善,因此训练出来的参数可靠性较低,预测出来的模型有存在不少限制;四是,疫情期间的很多防控措施起来不小的作用,但是现有的流行病动力学模型研究难以将其全部纳入疫情防控的所有重要影响因素之中,导致仿真预测结果具有一定的片面性。