0引言
ambiguously
随着改革开放的不断发展和我国工业化以及城市化进程的不断加速,在使得我国的经济得到了快速蓬勃发展的同时也带来了空气污染等一系列的环境问题。空气质量的恶化已经严重影响着城市市民的健康问题。其中大气污
染物的主要成分PM2.5对人体危害极大,
不仅可以引起呼吸道阻塞等炎症问题,同样还能作为很多致癌微生物的载体入侵人体,从而对人体造成更多无法预计的损伤。PM2.5是大气雾霾形成的根本原因,其来源主要有两种:自然源与人为源,其中自然源主要源于各类自然灾害,例如火山爆发、森林大火以及尘暴事件;人为源主要来自各种工业过程中各类燃料的燃烧以及机动车尾气排放。
对空气污染物中的主要成分PM2.5进行一定的研究和预测工作,并在一定的误差范围之内有效地预测PM2.5浓度工作的基础上并进行有效防控,不仅能准确地评估城市空气质量、为相关部门应对空气质量变化提供依据以及给市民出行提供合理建议,还能更好地落实国务院“打赢蓝天保卫战”三年行动计划工作部署。目前,安徽积极参与长三角区域联防联控,认真落实《长三角区域大气污染防治协作工作重点》,切实加强区域协作,积极推进信息、科技、应急、法规、标准、执法等联动机制建设,积极融入和构建长三角区域大气污染防治协作工作运行机制,这就要求我们更要做好监测、观测、预测PM2.5浓
度工作。
根据国家生态环境部公告显示:2018年,在全国338个城市中有217个城市空气质量超标,占比约为64%;全国城市的平均优良天数比率约为79%,比上年增加1.3%;2018年整个年度全国范围发生重度污染1899天,严重污染822天,而以PM2.5为首要污染物的污染天数占总数的
blueprint60%。2018年安徽省优良天气总数为276天。其中轻度污染天数为72天;重度污染天数为3天;中度污染天数为14天。总体来看安徽省2017年与2018年两年的空气质量较前两年较为恶化:其中优良天气总数减少,降低比例
约为10%,
占比较大;轻度污染天数上升100天和72天,重度污染2017年达至6天,2018年达至3天,较前两年增长较为严重,可见安徽省的总体空气质量不容乐观,且越来越严峻。在2018年至2019年中,在六种大气污染物中,有PM2.5、PM10、O3这三类污染物作为安徽省空气首要污染物出现过,其中安徽省的首要污染物主要市PM.25和PM10,占比高达90%以上,其中PM2.5出现为首要污
染物的次数最多,占80%以上,
在首要污染物的变化趋势上,PM2.5占比逐步降低,但仍占有大头,因此安徽省在防治大气污染的过
程中要在降低PM2.5浓度,及时遏止其增长趋势。
2018年12月23日安徽中北部地区出现大面积污染情况,蚌埠市连同淮南市、合肥市入选了全国空气质量最差前十,目前对蚌埠市这类地级市亟需大量研究来为政策实施提供可靠依据。我国已经有相当一部分学者对北京、
上海、杭州等城市的PM2.5进行了大量的相关研究,
而对于地级市的PM2.5研究工作从事不多。本文就以PM2.5污染较为严重的地级市为研究对象,以蚌埠市为例,从真气网获取蚌埠市PM2.5的相关数据建立合适的模型,并以此模型对蚌埠市PM2.5进行短期预测。
1文献综述
PM2.5浓度的影响因素众多,比如地区的机动车保有量、季节、风速、降雨量等变量有关,从而给PM2.5预测工作带来了一定阻碍,随着打响蓝天白云保卫战的提出,越来越多的国内学者对PM2.5浓度进行预测研究。关于
——————————————————————
—作者简介:王志建(1994-),男,安徽淮南人,硕士生在读,经济学
学位,研究方向为资源环境统计;导师:崔连标。
基于ARIMA 模型的蚌埠市PM2.5预测
PM2.5Forecast of Bengbu City Bad on ARIMA Model
王志建WANG Zhi-jian ;崔连标CUI Lian-biao
(安徽财经大学,蚌埠233030)
谦逊的意思(Anhui University of Finance and Economics ,Bengbu 233030,China )
摘要:本文首先从真气网选取蚌埠市2018年6月1日至2019年5月31日的PM2.5日浓度数据作为样本数据,接着运用
EVIEWS10.0软件并借助由Box 和Jenkins 创立的ARIMA (p ,d ,q )模型对样本数据进行合理建模,并验证所建立的AR (1)模型的合理性;然后运用所建立的AR(1)模型对蚌埠市2019年6月2日至2019年6月6日的PM2.5日浓度进行预测,最后将预测结果与实际值进行比较,结果表明:使用建立的AR (1)模型对蚌埠市短期内PM2.5浓度预测所得值与蚌埠市PM2.5浓度的实际值相对误差较小,其误差大小在10%之内,适合做蚌埠市PM2.5日浓度的短期预测。
Abstract:This paper lects PM2.5concentration data in Bengtbu City from June 1,2018to May 31,2019as sample data for the analysis of time ries,us EVIEWS 10.0software and ARIMA model created by Box and Jenkins to model the sample data and checks its rationality,and then us AR (1)model from June 2,2019to May 31,2019to verify its rationality;the concentration of PM2.5was foreen in June 6,19and the expected results were compared to the actual values.The results showed that the relative error between the expected values and the actual values was small,the error is less than 10%,which was appropriate for the short -term prediction of the PM2.5concentration in Benbu City.
关键词:预测;PM2.5浓度;ARIMA 模型;蚌埠市
Key words:forecast ;PM2.5concentration ;ARIMA model ;Bengbu City 中图分类号:X823文献标识码:A 文章编号:1006-4311(2021)03-0247-04
PM2.5的预测方法现如今主要有两种:数值模式方法与统计学方法。由于使用数值模式方法进行PM2.5预测对客观条件要求较高,需要有分辨率极高的气象模式等,大部分学者采用的都是统计学方法进行PM2.5预测,其方法应用也较于广泛与成熟。
courageously
在大气污染防治已经在全国范围内均占据着举足轻重的地位,理清大气污染物的空间分布、排放规矩
就显得尤为重要,国内不少学者进行了大量研究并取得一定成效。例如,王化杰利用耦合协调度模型、探索性空间数据分析和障碍度模型研究了安徽省2015、2016年冬季大气污染物的时空分布以及演化规律,其结果表明安徽省大气污染物具有波动性、空间不均衡性,大气污染物在全省范围内冷热点分布迥异;臧星华(2015)对全国范围内的大气污染物进行时空分布特征分析,结果表明各污染物均区域型特征,南北大气污染物浓度差异较大,且大气污染物在采暖期与非采暖期中各污染物浓度变化非常显著[1]。
郎艺超,肖璐利用SARIMA模型、批量自动化的方法对杭州市主城区的各PM2.5的监测站点进行预测,其预测结果短期相对准确,其预测结果明晰了PM2.5在杭州市主城区的空间分布[2]。
李栋,薛慧峰,张文宇等学者为了提高PM2.5预测精度提出了混合预测模型,通过模型来识别PM2.5与其各种影响因子的关系来明确预测方法的输入向量,从而大幅提高了预测精度,也能够更好的面对PM2.5的浓度突变现象[3]。
汪伟舵,吴涛涛等学者利用ARIMA模型对杭州市短期PM2.5浓度进行预测,并将其值与实际值进行比对,发现ARIMA(4,1,2)模型更适合对杭州市PM2.5浓度进行短期预测,并且提出该模型的不足之处[4]。
范剑辉,杨震,王海波等建立了三种不同的神经网络预测模型,在将预测值与实际值比对之后发现BP
神经网络要比另外两种神经网络模型的拟合程度更优良,而RBF、Elman神经网络预测模型的受限较高,其精准度不稳定,易受样本数据影响[5]。
conrvation
彭斯俊,沈家超,朱雪根据PM2.5浓度因时段差异较大,采用了分时段序列模型进行预测,在与灰色模型以及全年的时间序列分析预测的结果对比,发现分时段序列模型相对于上两种模型的预测精准度更高[6]。
2ARIMA模型
2.1ARIMA模型
时间序列预测的方法主要有三种基本类型:自回归模型(AR)、移动平均模型(MA)、自回归移动平均模型(ARIMA)。其中ARIMA模型是一种最为经典的时间序列预测模型,该模型是由Box和jenkins创立,其结合了自回归模型、移动平均模型的优点,适用于较精准的短期预测。本文应用该模型来研究PM2.5,可以在最小方差的条件下得到最好的预测结果。
ARIMA(p,d,q)模型:
2.2ARIMA模型建立的步骤
①平稳性检验:对本文选取的2018年6月1日至2019年5月31日蚌埠市PM2.5日浓度数据进行平稳性检验,本文主要运用EVIEWS10.0以单位根检验法对该时间序列数据经进行平稳性检验,本文采用单位根检验法来进行平稳性检验。如果样本数据是平稳的书简序列,则进行下一步模型识别;如果是非平稳序列则对数据进行差分处理至序列平稳,其差分次数即为ARIMA(p,d,q)模型的阶数d。
②模型识别:经过单位根检验以及可能存在的差分处理,得到平稳序列后,利用EVIEWS10.0对经过处理后样本数据作自相关、偏自相关图,然后根据相关关系图的特点来选取合适的模型。
③参数估计:在选取拟定的模型ARIMA(p,d,q)以后,利用最小二乘回归对模型参数p、q进行参数估计并在考量AC和SIC准则剔去不显著参数所对应的自变量,重新拟合选取最佳的模型参数。
④模型检验:参数估计完成后,应该对ARIMA模型的平稳性以及合理性行进行检验,对模型的残差序列进行白噪声检验。如果其为白噪声过程,则表明建立的模型是正确的。
⑤模型预测:模型检验合适之后,将模型的拟合对2018年6月1日至2019年5月31日进行拟合,观测该模型的准确度。之后对蚌埠市PM2.5浓度进行短期预测并与实际值进行比对,以检验模型的拟合度是否优良以及该模型的实用价值。
3实证分析
汉英翻译在线
本文选取2018年6月1日至2019年5月31日蚌埠市PM2.5日浓度数据作为EVIEWS10.0分析的样本数据,其数据来源于真气网。并利用WPS EXCLE软件作出PM2.5浓度的时序图。
由图1可以大致观测到PM2.5浓度与季节相关:在暖期数值较高;在冷期的数值较低,两期差异较大,且有一定的趋势性。
the holiday
3.1平稳性检验
接下来使用EVIEWS10.0对所选取的样本数据进行平稳性检验,本文采取的是单位根检验法,见表1。
由表1可以得出下述结论:样本序列的t统计量
为
图1PM2.5浓度序列图
-7.4300小于1%置信水平的临界值,故拒绝存在单位
搞笑对话
根的原假设,该样本数列为平稳序列,可以直接进行下一步骤:模型识别。
3.2模型识别
继续利用EVIEWS10.0对样本数据作自相关图与偏自相关图,见图2,根据其特点来选取所合适的ARIMA (p ,d ,q )模型。
根据自相关图与偏自相关图,如图2所
示,可以明显观测到:自相关图拖尾,偏自
相关图一阶截尾,故直接选取AR (1)模型,建立AR (1)模型,下一步可直接做模型检验。
3.3参数估计
通过对自相关图以及偏自相关的观察,明显观测到:自相关图拖尾,偏自相关图一阶截尾,只能建立AR(1)模型,故可以略去参数估计,直接进行模型检验。
3.4模型检验
利用EVIEWS10.0对所建立的AR (1)模型方程估计结果如表2所示:R-squared 为0.5399表明所建立的AR (1)模型的拟合度很好,并且AR (1)模型的估计结果的概率为零,都说明了上述所建立的AR (1)模型从总体来看是十分显著的。然后接着根据AR 检验图判断该模型的稳定性,对该模型的稳定性进行检测。
由图3可见,仅有的一个AR 根倒数在单位圆内,AR
倒数小于1,差分方程有收敛解,那么所建立的AR (1)模型是稳定的。所以本文应该建立AR (1)模型,其方程为:
y t =0.733067y t-1+着t 对所建立的AR (1)模型生成残差序列,并对其进行白噪声检验,由图4所示,上海迪斯尼英语
P 值大于0.05的临界值,显然该残差序列为白噪声过程,因此可以初步得出结论:AR (1)模型的建立可以是正确的且可以用来对蚌埠市PM2.5日浓度进行短期预测。
下一步使用所验证表明正确建模的AR1(1)模型对本文样本数据选取的时间段也即2018年6月1日至2019年5月31进行初步拟合并跟实际数据值进行对比。由图5所示,红线Actual 表示PM2.5日浓度的实际
值,也即本文所使用的样本数据,绿线Fitted 表示使用AR
(1)模型对该时间段的PM2.5日浓度的拟合值,蓝线Residual 表示残差序列。从图5中可以明显的观测到模型的拟合值与实际值的折线图重叠程度较高,表明了所建立的AR (1)模型拟合效果很好,适合对蚌埠市PM2.5日浓
度进行短期预测。3.5模型预测接下来使用建立的AR (1)模型对2019年6月2日至2019年6月6日蚌埠市日浓度进行预测,根据预测值以
t-Statistic Prob.*Augmented Dickey-Fuller test statistic -7.430003
0.0000
吉祥物英文Test critical values:
1%level 5%level 10%level
-3.448111
-2.869263-2.570952
表1序列PM2.5的单位根检验结果
图2PM2.5日均浓度相关系数
表2AR (1)模型估计结果
Variable
Coefficient Std.Error t-Statistic Prob.
C AR (1)SIGMASQ 52.725500.733067487.8914
6.2990540.03314424.85824
8.37038322.1174619.62694
0.00000.00000.0000R-squared
Adjusted R-squared S.E.of regression Sum squared resid
Log likelihood F-statistic Prob (F-statistic )0.5399540.53741222.17960178080.3-1647.990
212.43850.000000
Mean dependent var S.D.dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter.Durbin-Watson stat
52.8191832.61042
9.0465209.0785749.0592592.057208Inverted AR Roots .73
图3AR 检验
图4AR (1)模型残差序列分析
及实际值绘制成表3。
由表3中的预测值可以观察到,使用AR(1)模型的预测值与时间值相差不大,其相对误差值军在10%以内,说明模型建立合适,具有良好的预测性,具有一定的实际预测意义,预测结果也验证了此模型建立的合理性以及准确度,对蚌埠市PM2.5日浓度预测具有很好的实际意义。
4结论以及建议
近两年安徽省大气污染现状面临着各种各样的困难以及挑战,且空气质量也在逐步恶化,2018年安徽省安徽省的空气质量受到了国家生态环境部门的点名批评,大气污染防治已经成为安徽省亟待解决的现实问题。识别大气污染物规律是开展环境保护的重要前提。改变安徽省大气污染的现状迫在眉睫,为了进行相关的空气污染研究,本文从真气网选取2018年6月1日至2019年5月31日蚌埠市PM2.5日浓度数据作为本文的样本数据,根据样本数据建立由Box和Jenkins创立的ARIMA(p,d,q)模型,然后使用EVIEWS10.0软件进行实证研究分析:首先对所选取的样本数据进行单位根检验发现单位根检验结果拒绝原假设,表明该序列为平稳序列,然后根据自相关图以及偏自相关图发现模型应选取AR(1)模型,然后对模型进行检验其稳定性以及合理性,得处该模型预测工作的可行性,最后使用该模型对蚌埠市PM2.5日浓度进行短期预测,并将所得数据与实际值进行对比,发现其相对误差较小,误差范围保持在10%之内,适合做蚌埠市PM2.5日浓度的短期预测。
从过去一年内PM2.5日浓度的时序图中可以观察到:其PM2.5日浓度在冷期数值较大,且其月均浓度
皆大于70μg/m3,暖期内的日浓度值相当于较小,月君浓度均不超过50μg/m3。本文认为造成这种现象的内在原因是气候问题。其中最主要的两个主导因素是风速差异、降雨量差异。根据其中相关学者研究的得出:风速较低时可让PM2.5呈空间集聚,风速较高时会让PM2.5加速扩散。而相关学者已经从事过相关研究表明:降雨量对PM2.5具有
清除的功效。
根据PM2.5浓度分布的特征:冷期浓度数值较高、暖期数值较低,把一个年度的PM2.5数据建立一个模型进行预测与实际值比较的做法还可以优化成分冷暖两期分别建模进行预测,相信其预测数据会与实际值的贴合度更高。
虽然在短期内所建立的模型预测值较为准确,但是由于ARIMA模型自带的局限性,其只适合对短期PM2.5进行预测,不适合做长期预测,长期预测将会导致数据不稳定,从而使预测值跟实际值之间的误差加大;另外本文所建立的模型是根据2018年6月1日至2019年5月31的数据进行建立的,不能单一地用该模型一成不变地对蚌埠市PM2.5浓度进行预测,发现误差值较大时应该重新估计参数、修正模型等,以期达到更好的预测效果。
参考文献:
[1]臧星华,鲁垠涛,姚宏,李发东,张士超.中国主要大气污染物的时空分布特征研究[J].生态环境学报,2015,24(08):1322-1329.
[2]郎艺超,肖璐,George Christakos.基于SARIMA模型和普通Kriging法对杭州市主城区PM_(2.5)短期预测和制图[J].环境科学学报,2018,38(01):62-70.
[3]李栋,薛惠锋,张文宇,方铭.基于混合模型的PM2.5日浓度预测[J].统计与决策,2019,35(05):92-96.
[4]汪伟舵,吴涛涛,张子振.基于ARIMA模型的杭州市PM2.5预测[J].哈尔滨师范大学自然科学学报,2018,34(03):49-55.
[5]严宙宁,牟敬锋,赵星,严燕,罗文亮,胡满达.基于ARIMA 模型的深圳市大气PM_(2.5)浓度时间序列预测分析[J].现代预防医学,2018,45(02):220-223,242.
[6]彭斯俊,沈加超,朱雪.基于ARIMA模型的PM_(2.5)预测[J].安全与环境工程,2014,21(06):125-128.
[7]刘宗伟,周彩丽,马冬梅,邱玉刚,刘春.自回归移动平均模型在预测PM2.5中的应用[J].预防医学论坛,2016,22(08):582-584.
[8]刘杰,杨鹏,吕文生,刘阿古达木.基于气象因素的PM_(2.5)质量浓度预测模型[J].山东大学学报(工学版),2015,45(06):76-83.
[9]余辉,袁晶,于旭耀,张力新,陈文亮.基于ARMAX的PM_(2.5)小时浓度跟踪预测模型[J].天津大学学报(自然科学与工程技术版),2017,50(01):105-111.
[10]黄芸,姜国,徐治欠.ARIMA模型在黄石市PM2.5浓度预测中的应用[J].湖北师范大学学报(自然科学版),2017,37(02):38-42.
[11]康俊锋,黄烈星,张春艳,曾昭亮,姚申君.多机器学习模型下逐小时PM_(2.5)预测及对比分析[J].中国环境科学,2020,40(05):1895-1905.
[12]李晓理,梅建想,王康,李济瀚.基于Elman神经网络的PM_(2.5)质量浓度区间预测[J].北京工业大学学报,2020,46(04):377-384.
[13]翁克瑞,刘淼,刘钱.TPE-XGBOOST与LassoLars组合下PM_(2.5)浓度分解集成预测模型研究[J].系统工程理论与实践,2020,40(03):748-760.
[14]师芸,邬康康,申靖宇,尹恒毅.乌鲁木齐地区PWV对PM2.5的影响趋势分析及预测[J].导航定位学报,2020,8(01):43-48,73.
[15]杨小兵,杨峻,华华,黄晓英,张成扬.安徽PM_(2.5)时空分布特征及预测模型的研究[J].数学的实践与认识,2020,50(01):285-291.
表3PM2.5日浓度预测值
日期预测值/μg/m3实际值/μg/m3相对误差/%
2019/6/2 2019/6/3 2019/6/4 2019/6/5 2019/6/6
46
40
31
33
16
47
37
32
35
15
2.12
8.10
3.12
5.71
6.66图5AR(1)模型拟合效果