Stacking集成模型模拟膜下滴灌玉米逐日蒸散量和作物系数

更新时间:2023-05-24 10:09:32 阅读: 评论:0

第37卷第5期农业工程学报V ol.37 No.5 2021年3月Transactions of the Chine Society of Agricultural Engineering Mar. 2021 95
亲子鉴定申请书Stacking集成模型模拟膜下滴灌玉米逐日蒸散量和作物系数
陈志君,朱振闯,孙仕军,王秋瑶,苏通宇,付玉娟※
(沈阳农业大学水利学院,沈阳110866)
摘要:为准确模拟膜下滴灌玉米逐日蒸散量和作物系数,该研究以4个经典机器学习模型:随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)、BP神经网络(Back Propagation Neural Network,BP)和Adaboost 集成学习模型(Adaboost,ADA)为基础,基于Stacking算法建立了集成学习模型(Linear Stacking Model,LSM)对膜下滴灌玉米逐日蒸散量和作物系数进行模拟。并将LSM的模拟精度与RF、SVM、BP和ADA模型的模拟精度相比较,结果表明:1)RF、SVM、BP和ADA模型模拟膜下滴灌玉米的逐日蒸散量和作物系数时的相对均方根误差均大于0.2;2)相比RF、SVM、BP和ADA模型,LSM模型提高了玉米逐日蒸散量和作物系数模拟精度。LSM模拟的膜下滴灌玉米的作物系数相比于FAO推荐值更接近实测值;3)日序数、平均温度、株高、叶面积指数和短波辐射5个特征对玉米膜下滴灌玉米日蒸散量和作物系数影响最高,基于这5个特征建立的LSM模型模拟膜下滴灌玉米的蒸散量和作物系数的R2分别为0.9和0.89,相对均方根误差分别为0.23和0.16。因此,
建议在该研究区使用日序数、平均温度、株高、叶面积指数和短波辐射5个特征参数建立LSM模型模拟膜下滴灌玉米蒸散量和作物系数。该研究可为高效节水条件下作物蒸散量和作物系数的精准模拟和合理制定灌溉制度提供参考。
关键词:蒸散;模型;温度;机器学习;Stacking集成学习;膜下滴灌;作物系数
doi:10.11975/j.issn.1002-6819.2021.05.011
中图分类号:S161        文献标志码:A        文章编号:1002-6819(2021)-05-0095-10
陈志君,朱振闯,孙仕军,等. Stacking集成模型模拟膜下滴灌玉米逐日蒸散量和作物系数[J]. 农业工程学报,2021,37(5):95-104.    doi:10.11975/j.issn.1002-6819.2021.05.011
Chen Zhijun, Zhu Zhenchuang, Sun Shijun, et al. Estimation of daily evapotranspiration and crop coefficient of maize under mulched drip irrigation by Stacking enmble learning model[J]. Transactions of the Chine Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(5): 95-104. (in Chine with English abstract) doi:10.11975/j.issn.1002-6819.2021.05.011
0  引  言
作物实际蒸散量(Crop Evapotranspiration, ET a)是指作物实际通过地表和叶面的蒸发和植株蒸腾作用损失的水量[1]。ET a的准确计算和模拟对于提高农业水利用效率和制定合理的灌溉制度具有重要意义[2]。FAO-56文件中提供了各类作物(玉米、水稻和小麦等)在不同生育阶段作物系数的推荐值[1]。但FAO-56推荐的作物系数多是关于时间的函数,并没有考虑土壤环境、作物生长情况和气象条件等对其的影响[3]。大量研究表明作物系数随着作物种类、地区和气象环境等变化而变化,因而使用FAO 推荐的作物系数计算ET a存在较大的误差[4-5]。这种差异在非常规条件下(如地膜覆盖等)显得更加突出[3]。这是因为地膜覆盖一方面显著减少了土壤蒸发量降低了土壤蒸发系数,另一方面增加了作物的蒸腾量,进而增加了作物系数[6]。为此FAO也提出了修正方法,认为覆膜使
收稿日期:2020-11-19 修订日期:2021-02-13
基金项目:国家重点研发计划重点专项(2018YFD0300301);辽宁省高校科研项目(LSNFW201913);辽宁省自然科学基金项目( 20180550617)
作者简介:陈志君,博士生,研究方向为农业高效用水。
Email:****************
※通信作者:付玉娟,博士,讲师,研究方向为作物高效用水和水资源综合利用。Email:************
****作物系数降低了约10%~30%[1]。但即使修正后的推荐值与实际值之间仍存在较大误差[7-8]。Li等[9]研究表明,对于覆膜种植的春小麦而言,FAO-56文件提供的作物系数明显小于实际值;Shrestha等[10]研究表明,覆膜种植的西瓜和辣椒的实际作物系数与FAO-56推荐值之间的差异较大。为进一步提高ET a计算精度,很多学者在不同地区采用蒸渗仪试验,通过基于水文过程的物理模型探索特定条件下的作物系数值[11]。但传统试验成本较高,而且基于水文理论模型对复杂的自然环境进行简化,也会导致最终计算精度不理想[12]。随着机器学习算法的发展,一些学者开始使用机器学习代替传统的基于水文理论模型进行ET a计算和模拟,通过机器学习的强大非线性功能,描述复杂的自然环境对作物蒸散量的影响[3,5,13-14]。Shrestha等[3]在佛罗里达州使用支持向量机模型,利用灌水频率、降水频率、气象资料和播种后天数等指标模拟和计算了半个月尺度的作物系数和ET a,结果表明,支持向量机模型能够较为准确地计算作物系数和ET a。然而,该模型缺点是并未考虑作物生长和田间水热环境对耗水的影响。此外,有研究表明,集成多个单一经典机器学习模型能够有效提高模型的模拟精度,尤其是基于Stacking策略的集成学习模型[15]。袁培森等[16]使用Stacking策略融合了支持向量机和随机森林等基础模型对水稻表型组学实体进行分类,发现基于Stacking策略
农业工程学报()2021年96
的集成学习模型相比于基础模型精度平均提高了6.78%。刘波等[17]研究也发现,基于Stacking策略的集成学习模型提高了基础模型对母线负荷的模拟精度。
目前,虽然基于Stacking算法的集成学习模型在机器视觉和自然语言处理等领域应用较广,但基于Stacking 策略的集成学习模型对膜下滴灌玉米耗水和作物系数进行的探索尚不多见。同时,基于机器学习方法对作物蒸散量和作物系数的模拟研究中,所选择的研究尺度多为月尺度或半个月尺度[10],对于作物逐日蒸散量和作物系数的研究较为缺乏。事实上,对于作物蒸散量和作物系数的模拟尺度越小,对于提高农业水利用效率和制定合理的灌溉制度的意义越大[1]。
因此,本文建立基于Stacking策略的集成学习模型对膜下滴灌玉米逐日蒸散量和作物系数进行模拟;并综合评价基于Stacking策略的集成学习模型和经典机器学习模型对膜下滴灌玉米逐日蒸散量和作物系数的模拟精度和可行性;在此基础上探索不同输入特征对模拟膜下滴灌玉米逐日蒸散量和作物系数模拟精度的影响,并最终选定模型的最佳输入特征组合。
1  材料与方法
1.1  田间试验
田间试验于2016-2018年在辽宁省灌溉试验中心(120°30′44 ″E,42°08′59″N,海拔47 m)进行。试验在2个大型称重式蒸渗仪测坑内进行,测坑长和宽分别为2.5 和2 m,深度为3.5 m。测坑内土壤为壤土,耕层0~
20 cm土壤含有机质、全氮、速效钾和速效磷分别为
21.6 g/kg、108.0 mg/kg、142.5 mg/kg和23.1 mg/kg,土壤容重1.37 g/cm3, 田间持水量为21%。试验选用的玉米品种在2016和2017年为郑丹958,2018年为良玉99。蒸渗仪测坑内布置3条垄种植玉米,种植密度为60 000株/hm2,黑色塑料地膜(膜宽120 cm,膜厚0.008 mm)仅覆盖在垄台之上,滴灌带置于地膜和土壤之间,膜下滴灌布置如图1所示。如图1所示,滴灌带布置在垄中间,在测坑中间每隔10 cm深度埋放1个水热传感器(美国),用于自动检测土壤水分和温度。试验期间膜下滴灌的灌水上限设置为田间持水量的90%,下限在玉米苗期设置为田间持水量的65%,在其他生长时期均设置为70%。实际灌水量如图2所示。为排除降雨对蒸渗仪测坑的影响,在试验区设置了遮雨棚。玉米于2016年5月9日播种,9月13日收获;2017年4月27日播种,9月15日收获;2018年4月29日播种,9月12日收获。播种时一次性施底肥,其中氮、磷、钾肥均为66 kg/hm2,其他田间管理同当地农户。
图1 玉米种植模式
Fig.1
Schematic diagram of maize planting pattern
图2 2016-2018年玉米累积灌水量
Fig.2 Irrigation amount of maize in 2016-2018
1.2  特征选取与数据预处理
1.2.1  气象数据特征
气象数据由试验站安装的气象站(FT-QC9)每隔30 min记录1次气温、湿度、风速和日照时数,其中日照时数用以计算实际太阳短波辐射(R s,MJ/(m2·d)),同时根据日序数计算天顶辐射(R a,
MJ/(m2·d))。计算式如式(1)~式(2)[1]所示。
1440
sin()sin()cos()cos()sin()
a sc r s s
R G d
(1)
(
s s s a
n
R a b R
第一次爱的人歌词N
(2)式中G sc为太阳常数0.082 MJ/(m2·min);d r为日地间相对距离的倒数;ωs为太阳时角,rad;φ为所在地区的纬度,rad;δ为太阳磁偏角,rad;n为实际日照时数,h;N为理论日照时数,h。2016-2018年气象变量的统计特征如表1所示。
表1 2016-2018年试验站气象变量统计
Table 1 Statistics of weather variables in experimental station
2016-2018
统计量
Statistics
辞职流程
平均温度
Average
temperature/
风速
Wind
speed/
(m·s-1)
相对湿度
Relative
humidity/%
天顶辐射
Extraterrestrial
radiation/
(MJ·m-2·d-1)
太阳辐射
Solar
radiation/
(MJ·m-2·d-1)最大值
Maximum
33.09    2.10 99.98 41.91 29.00
最小值
Minimum
12.51 0 33.36 29.75    1.63
平均值
大学宣传委员Mean
23.40 0.71 77.03 39.20 17.47
标准差
Standard
deviation
3.71 0.46 1
4.53    2.95    6.85
变异系数
Coefficient of
variation
0.16 0.65 0.19 0.08 0.39
1.2.2  玉米生长指标
试验中使用卷尺定株测量玉米株高;使用直尺测量玉米植株上所有展开叶的叶宽和叶长,并通过式(3)计算叶面积指数,测量频率约10 d/次。
0.75
LAI
N L D
A
()
(3)式中LAI为叶面积指数;N′为玉米种植密度,株/hm2;L 和D分别为展开玉米植株叶片的长和宽,m;A为土地面积,本文取值10 000 m2。
第5期 陈志君等:Stacking 集成模型模拟膜下滴灌玉米逐日蒸散量和作物系数
97
为进一步获得玉米株高和叶面积生长逐日数据,本文使用式(4)[18]拟合玉米株高数据;使用式(5)
[19-20]拟合玉米叶面积指数数据。
()
1e c k t t H
h      (4)
2max
d ()
LAI LAI 1e
b ct dt      (5) 式中h 为玉米逐日株高,cm ;H 最大株高,cm ;LAI max 为最大叶面积指数;LAI d  为逐日叶面积指数;k 、t
c 、b 、c 和
d 为拟合参数;t 为播种后天数,d 。 1.2.3  玉米田间水热情况
考虑到田间表层(0~20 cm )土壤的含水率和土壤温度对土壤蒸发有着显著影响[1],因此本研究将玉米田间表层的平均含水率和温度作为输入特征。表层土壤含水率和土壤温度采用探头自动监测,监测精度分别为0.01 cm 3/cm 3和0.01 ℃,每隔30 min 记录1次数据。将每日由测坑内埋置的自动观测探头记录的48个0~20 cm 土壤含水率和温度数据取平均值作为当日的平均含水率和温度值。
1.2.4  数据预处理
在膜下滴灌条件下玉米蒸散量的模拟研究中,模型的输入特征为平均气温、相对湿度、风速、天顶辐射、短波辐射、株高、叶面积指数、表层土壤含水率、表层土壤温度和日序数共10个特征参数。由于试验期间安装的蒸渗仪和土壤水热探头会有缺失值和异常值出现,本研究在建模之前对数据集中出现的缺失值和异常值进行了剔除,最终数据集中包含的有效样本点为543个。同时,为了降低不同特征
的数量级对模型精度的影响,本研究使用式(6)[21]对所选10个特征参数进行标准化。
min
max min i i X X X X X    (6) 式中X i 为观测数据,X min 为最小值,X max 为最大值。 1.3  研究方法
1.3.1  作物系数计算
本文使用FAO-56推荐的式(7)计算作物系数[1]。  K c =ET a /ET 0 (7) 式中ET a 为作物实际蒸散量,mm ;ET 0为参考作物蒸散量,mm ;K c 为实际作物系数。ET 0采用Penman-Monteith 公式计算得到[22]。本研究中根据蒸渗仪测坑相邻2 d 的差值计算得到玉米实际蒸散量ET a 。 1.3.2  机器学习模型
随机森林模型(Random Forest ,RF ):它是在以决策树为基本学习器,在Bagging 集成学习算法的基础上,进一步采用自助采样法对特征进行随机选择[23-25]。支持向量机模型(Support Vector Machine ,SVM ):它可将给定的数据集正确分开,同时使得不同类别之间的间隔最大化[26-27]。神经网络模型(Back Propagation Neural Network ,BP ):本文采用含有3层隐含层的BP 神经网络模型。前一层和后一层之间通过全连接层连接(图3a ),激活函数使用Relu 函数[20]。Adaboost
集成学习模型(Adaboost ,ADA ):它的基本思路是首先建立一个基础学习器,然后根据基础学习器在给定数据集上的表现将数据集重新划分。将学习器表现不好的数据重新建立学习器,以此类推,直到学习器数量达到设定的数量为止,最终通过权重将所有学习器进行加权结合[28-29]。
基于Stacking 算法的集成学习模型(Linear Stacking Model ,LSM ):为提高上述经典机器学习对膜下滴灌玉米逐日蒸散量和作物系数的模拟精度,本文使用Stacking 集成学习算法[15],融合上述经典机器学习模型。LSM 模型基本结构如图3b 所示。如图3b 所示,LSM 模型的基本思路是:1)使用观测数据对上述4个经典机器学习模型进行参数率定和验证;2)使用率定好的经典机器学习模型对玉米逐日蒸散量和作物系数进行模拟;3)将上述4个经典机器学习模型的对玉米逐日蒸散量和作物系数的模拟输出结果作为LSM 模型中线性层的输入,对线性层参数进行训练,最终训练好LSM 模型并对玉米逐日蒸散量和作物系数进行模拟。
注:BP 、SVM 、RF 和ADA 分别为BP 神经网络、支持向量机、随机森林和Adaboost 集成学习模型。
Note: BP, SVM, RF and ADA are back propagation neural network, support vector machine, random forest and Adaboost enmble learning model, respectively.
图3  神经网络和Stacking 集成模型结构图
Fig.3  Structure of neural network and Linear Stacking Model
(LSM)
1.3.3  特征参数重要性评估
为评估平均气温、相对湿度、风速、天顶辐射、短波辐射、株高、叶面积指数、表层土壤含水率、表层土壤温度和日序数与膜下滴灌玉米日蒸散量之间的相关程度,确定这些特征对于上述机器学习模型模拟膜下滴灌玉米日蒸散量的重要性。本研究选用最大互信息系数(Maximal Information Coefficient ,MIC )来衡量所选特征与膜下滴灌玉米日蒸散量之间的线性或非线性的强度。MIC 是用来度量特征和响应变量之间的相关程度,与相关系数相比,MIC 值可以有效体现特征和响应变量之间的非线性关系。MIC 值越大,说明特征对响应变量的重要程度越高[20]。本研究使用Python 3.0软件中MINE 函数包计算所选特征与膜下滴灌玉米日蒸散量之间的MIC 值,并以MIC 数值评估所选特征对模拟蒸散量时的重要程度。 1.4  模型建立与评估
本研究采用Python 3.0软件中Scikit-learn 库进行模型的建立和训练。将上述543个样本点分成训练集和测试集2个部分,其中考虑到2017年2号测坑中数据缺失
农业工程学报( )                                2021年
98
最少,共有94个样本(2017年6月1日—2017年9月15日)。因此选择2017年2号测坑中共数据作为测试集,其余449个样本为训练集。在此基础之上将训练集再随机平均分成3份,依次随机选择其中一份作为验证集,剩下两份作为训练集(3折交叉验证)。该研究采用决定
系数(R 2)[14]
、相对均方根误差(Normal Root Mean Square Error ,NRMSE )[20]、均方误差(Mean Square Er
ror ,MSE )[14]和平均绝对误差(Mean Absolute Error ,MAE )[23]这4个指标判断模型模拟精度好坏的评价指标。
2  结果与分析
2.1  玉米田基本情况与玉米株高叶面积指数拟合结果
2016-2018年0~20 cm 土壤水热变化动态如图4所示。从图4中可以看出,2016年、2017年和2018年,在生育期内0~20 cm 土层中的温度分别为16~28.9 、22.4~30.7 和17~30.7 ℃。3 a 的含水率分别为16~16.3、11.6~20.5和12.5~23.7 cm 3/cm 3。2016-2018年膜下滴灌玉米日实际蒸散量与作物系数动态如图5所示。
图5表明,3 a 的膜下滴灌玉米蒸散量和作物系数均随着生育期的进行,呈现先增加后降低的趋势,在玉米生育中期达到最大值。3 a 的膜下滴灌玉米生育期内蒸散量变化范围分别为0.3~9.1、0.3~7.3和0.1~7.8 mm ;玉米实测逐日作物系数变化范围分别为0.12~2.8、0.19~1.6和0.02~2.01。
图4  2016-2018年0~20 cm 土层含水率和温度动态 Fig.4  Dynamics of soil water content and temperature at soil
depth of 0-20 cm in 2016-2018网络任务
图5  2016-2018年玉米实际蒸散量和作物系数
Fig.5  Actual evapotranspiration and crop coefficient of maize in 2016-2018
采用经典生长模型拟合株高和叶面积指数拟合效果如图6所示,玉米株高拟合的R 2为0.978~0.999而叶面积指数拟合R 2均不小于0.972,说明经典生长模型拟合精度非常高,可将拟合获得的玉米株高和叶面积指数作为机器学习模型模拟膜下滴灌玉米日蒸散量和作物系数的输入特征变量。 2.2  特征变量选择
本文所选的10个特征变量与膜下滴灌玉米蒸散量之间的MIC 值按大小顺序排列如下(表2):日序数、平均温度、株高、叶面积指数、短波辐射、天顶辐射、相
对湿度、表层土壤温度、表层土壤含水率、风速。其中,排名前五位的特征变量对应的MIC 值分别为0.99、0.86、0.86、0.75和0.65,说明日序数、平均温度、株高、叶面积指数和短波辐射是对膜下滴灌玉米日蒸散量影响最大的5个特征变量。
为了提高模型模拟玉米蒸散量和作物系数的精度,同时降低获取相关特征的难度,本文选择MIC 值排名靠前的3~10个特征作为输入特征,设置了8个模拟情景,用于模拟玉米蒸散量,如表3所示。
电脑怎么连接网络第5期陈志君等:Stacking集成模型模拟膜下滴灌玉米逐日蒸散量和作物系数
雷锋的资料
99
图6 2016-2018年玉米株高和叶面积拟合
Fig.6 Simulation of plant height and leaf area index of maize in 2016—2018
表2 特征变量与玉米实际蒸散量之间的最大互信息系数
Table 2 Maximal information coefficient between feature
variables and actual evapotranspiration of maize
特征变量Feature variables
最大互信息系数Maximal information coefficient
日序数Days after sowing 0.99 平均温度Average temperature 0.86
株高Plant heigh 0.86 叶面积指数Leaf area index 0.75
短波辐射Solar radiation 0.65 天顶辐射Extraterrestrial radiation 0.56 相对湿度Relative humidity 0.54
表层土壤温度Surface soil temperature 0.51
表层土壤含水率Surface soil water content 0.39
风速Wind speed 0.12
表3 模拟玉米蒸散量和作物系数的情景
Table 3 Scenarios for simulating evapotranspiration and crop
coefficient of maize
情景Scenarios
变量Variables
S1 日序数、平均温度、株高
S2 S1、叶面积指数
高考数学真题及答案
S3 S2、短波辐射
S4 S3、天顶辐射
S5 S4、相对湿度
S6 S5、表层土壤温度
S7 S6、表层土壤含水率
S8 所有10个特征
2.3  玉米蒸散量模拟结果
各模型采用验证集和测试集进行玉米蒸散量模拟的精度比较如表4所示,模拟玉米蒸散量时的主要参数率定结果如表5所示。
由表4可知,验证集上,在S1~S8情景中,LSM 模型相比于ADA、RF和SVM模型,提高了模拟蒸散量的R2约0.1~0.32,分别降低了NRMSE、MSE和MAE约0.11~0.31、0.45~1.79和0.19~0.79 mm。另外,在8个情景中,BP模型模拟蒸散量精度均是最低,其R2明显低于其他4个机器学习模型,而且NRMSE、MSE和MAE高于另外4个模型。上述结果表明,在S1~S8情景中均是LSM模型模拟蒸散量精度最高,ADA、RF和SVM模型次之,BP模型最差。除此之外,从S3到S8情景,特征数据从5个增加到10个,但是LSM、ADA、RF和SVM模型模拟蒸散量的精度变化并不大,它们模拟蒸散量的R2增加不到0.05、NRMSE 降低不到0.05。其中LSM、ADA和RF模型模拟蒸散量的MSE和MAE减少均不到0.1 mm。
对于模拟ET a的测试集,在S1~S8情景中,与4个经典机器学习模型相比,LSM模型使R2提高了0.05
~0.5,使得NRMSE、MSE和MAE值分别降低了0.08~0.33、0.21~1.82和0.17~0.73 mm。可见,在S1~S8情景中,LSM模型对膜下滴灌玉米蒸散量模拟精度最高,其R2为0.88~0.98,NRMSE为0.1~0.23。除此之外,与在验证集中类似,从S3到S8情景,各模型模拟蒸散量的R2、NRMSE变化并不大,尤其是LSM、RF、SVM 和ADA模型,R2增加不到0.1,而NRMSE减低不到0.05,说明使用S3情景中的5个特征进行日蒸散量模拟便可获得较高精度。
综上,考虑到LSM模型模拟精度最高且S3~S8情景中LSM模型精度变化不大,因此该研究仅对LSM模型在S1、S2、S3和S8情景中对膜下滴灌玉米日蒸散量的模拟值和实际值进行了对比,结果如图7所示。在S1情景中,实测值和LSM模拟值之间的差异较大。在S1

本文发布于:2023-05-24 10:09:32,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/756953.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:作物   模型   系数
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图