一种基于人工神经网络的大气可降水量数据融合方法
1.本发明涉及地学数据校准与融合方法,具体地说它是一种基于人工神经网络的大气可降水量数据校准与融合方法。更具体地说它是利用广义回归神经网络对多源地学数据进行空间融合,属于地球科学和测绘科学与
技术领域:
:的数据处理方法。
背景技术:
::2.水汽在天气和气候过程以及能量传输中发挥着重要作用,同时也会对对地观测技术产生不利影响,因此,精准监测水汽对于提升天气预报水平和改善对地观测精度等都具有重要意义。然而,由于水汽的高度动态性和当下有限的观测技术,监测水汽状态并预测其变化仍然存在很多不足。大气可降水量(precipitablewatervapor,pwv)是最常用的衡量大气中水汽总量的物理量,它被定义为单位横截面积的垂直柱体中所含的水汽全部凝结为液体时的高度,传统的水汽监测手段包括无线电探空仪(radiosonde,rs)、水汽辐射计(watervaporradiometer,wvr)、微波遥感等,但它们存在着时空分辨率低、运行成本高、易受天气影响等缺点。近20年以来,现代对地观测技术的蓬勃发展使得水汽观测技术空前丰富,如gnss和合成孔径雷达技术等,尤其是gnss技术不仅具有与无线电探空同等的高精度,而且具有连续运行、时间分辨率高和不受天气影响等优点,在很大程度上弥补了传统观测手段的不足,也使得水汽观测数据海量激增。此外,国际上多个机构的数值天气预报模型,如ecmwf、ncep等,亦可提供大气可降水量数据。对地观测数据和模型数据的空前丰富为地球科学的发展提供了巨大契机,但也提出了新的挑战,包括不同技术得到的水汽观测值之间普遍存在多源异构(点状、面状和网状分布)、精度不等、分辨率不一致以及严重的系统偏差等问题,这严重妨碍了多源数据的联合利用,数据融合是解决上述问题的有效途径。li(liz,2004,productionofregional1km×1kmwatervaporfeldsthroughtheintegrationofgpsandmodisdata.in:proceedingsofthe17thinternationaltechnicalmeetingofthesatellitedivisionoftheinstituteofnavigation(iongnss2004),longbeach,california,usa,21-24sep2004,pp.2396-2403)提出了一种基于线性模型利用gnsspwv校准中分辨率成像光谱仪(moderate-resolutionimagingspectroradiometer,modis)pwv的方法。lindenberghetal.(lindenbergh,r.,vandermarel,h.,keshin,m., amp;dehaan,s.(2009).validatingtimeseriesofacombinedgpsandmerisintegratedwatervaporproduct.inproceedings2ndmeris/(a)atsruserworkshop,september22–26,2008esa/esrinfrascati(rome),2009(nb:smallcorrectionappliedwrtproceedingsversion))提出了一种基于克里金插值来融合gnsspwv和中分辨率成像光谱仪(mediumresolutionimagingspectrometer,meris)pwv方法。alshawafetal.(alshawaff,ferschb,hinzs,kunstmannh,mayerm,meyerfj(2015)watervapormappingbyfusinginsarandgnssremotesensingdataandatmosphericsimulations.hydrolearthsystsci19(12):4747–4764)提出了一种固定秩克里金插值方法来融合gnsspwv、干涉合成孔径雷达(insar)pwv和wrf模型pwv。然而,上述融合方法都是基于插值的,现有的少量关于多源pwv数据融合的方法大多是直接进行插值的,并未实现真正的数据融合;其次,现有方法的假设简单,未考虑不同来源数据的精度问题,等权使用会造成精度受损;再次,现有方法难以实现不同源数据的综合利用;因此,开发一种实现多源pwv数据的高精度融合的大气可降水量数据融合方法很有必要。技术实现要素:3.本发明的目的是为了提供一种基于人工神经网络的大气可降水量数据融合方法,为一种基于广义回归神经网络的多源pwv数据融合方法,利用本发明方法具有校准pwv系统偏差和改善pwv精度的作用,可实现多源pwv数据的高精度融合,进而生成高精度高时空分辨率的pwv数据产品,方法简单,精度高,数据利用率高;解决了多源pwv数据间的偏差校准、加权融合等问题。4.为了实现上述目的,本发明的技术方案为:一种基于人工神经网络的大气可降水量(precipitablewatervapor,pwv)数据融合方法,其特征在于:通过构建高-低精度大气可降水量数据间的人工神经网络模型,实现高精度pwv对低精度pwv的系统偏差校准与精度优化;具体融合方法,括如下步骤,步骤一:采用一维插值方法将不同来源的pwv数据(不同来源的pwv数据是指多个pwv数据间存在精度不等和/或系统偏差和/或时空分辨率不一致)内插到相同的时间,使不同来源的pwv数据时间上保持一致;步骤二:使用三维空间插值方法将不同来源的pwv数据内插到相同的采样点上,使不同来源的pwv数据在空间上保持一致;步骤三:进行质量控制,去除不良pwv样本,生成高质量的pwv样本数据集,每一个高质量的pwv样本都包括经纬度、高程、时间、低精度pwv和高精度pwv;步骤四:构建广义回归神经网络(generalizedregressionneuralnetwork,grnn)模型,grnn模型的输入层为经纬度、高程、时间和低精度pwv,输出层为高精度pwv;步骤五:利用10倍交叉验证法进行模型的训练和测试,以测试结果的均方根误差最小为依据确定最优的grnn模型参数,并得到最终的grnn模型及其精度评价信息;本发明在步骤四-五中,构建了一个广义回归神经网络模型用于校准不同源pwv数据间的系统偏差和改善pwv精度,且通过对应的检验和评价方法,生成高精度高时空分辨率的pwv数据产品,精度高,数据利用率高;步骤六:利用训练好的grnn模型对多个低精度pwv进行校准和优化,该训练好的grnn模型输出的低精度pwv即为校准和优化后的低精度pwv;步骤七:当经grnn校准和优化后的低精度pwv与高精度pwv已无系统偏差并具有相当的精度,将经grnn校准和优化后的低精度pwv与高精度pwv合并,得到融合pwv。5.在上述技术方案中,在步骤一中,时间上的一维插值方法至少包括线性插值、最邻近插值、样条曲线插值法,实现不同来源数据的时间配准。6.在上述技术方案中,在步骤二中,三维空间插值是利用球冠谐模型或克里金插值方法将高空间分辨率的pwv数据内插到低分辨率数据的采样点上,实现不同数据的空间配准。7.在上述技术方案中,广义回归神经网络模型用来构建高-低精度大气可降水量数据间的非线性回归关系,是本发明的核心创新点;在步骤四-步骤六中,构建的广义回归神经网络模型用于校准不同源pwv数据间的系统偏差(即校准低精度pwv的系统偏差,使经grnn校准和优化后的低精度pwv与高精度pwv无系统偏差)和改善低精度pwv精度、使经grnn校准和优化后的低精度pwv与高精度pwv相当的精度,并通过步骤五的检验和评价方法获取最优模型,并通过步骤六获取校准和优化后的低精度pwv。8.在上述技术方案中,在步骤五中,精度评价信息包括系统偏差、中误差、均方根误差、相关系数等。9.本发明具有如下优点:本发明提出了一种基于广义回归神经网络的多源pwv数据融合方法,与已有方法相比,本发明方法无需施加平滑约束或假设(即无需先验信息或假设),利用人工神经网络能够自适应地构建高精度pwv与低精度pwv之间的非线性回归关系,利用训练好的神经网络可空间差异化地校准低精度pwv的系统偏差,并优化低精度pwv的精度,并且不会人为引入系统性偏差;此外,本发明方法也可以保持原始数据的分辨率并纠正局部偏差;本发明所述方法作为一种新型地学数据融合方法,本发明所使用的人工神经网络模型架构还可以拓展到其他地学数据(包含时间、地理和属性信息的数据),适合多种地学数据的系统偏差校准、精度优化和数据融合等。附图说明10.图1为本发明中的pwv融合设计的grnn模型架构图;图2为本发明构建grnn模型和pwv融合的工作流程;图3为本发明实施例优化前后modispwv和era5pwv的每日偏差(bias);图4为本发明实施例优化前后modispwv和era5pwv的每日标准差(std);图5为本发明实施例优化前后modispwv和era5pwv的每日均方差(rmse)。具体实施方式11.下面结合附图详细说明本发明的实施情况,但它们并不构成对本发明的限定,仅作举例而已。同时通过说明使本发明的优点更加清楚和容易理解。12.本发明提出了一种基于广义回归神经网络(generalizedregressionneuralnetwork,grnn)的多源pwv数据校准和融合方法。grnn是建立在数理统计基础上的径向基函数网络模型,其理论基础是非线性回归分析。grnn具有很强的非线性映射能力和学习速度,比径向基函数更有优势,样本数据少时的预测效果尤佳,还可以处理非平稳数据;本发明方法可实现不同pwv数据集的无偏融合,不需要先验信息或假设,可以避免人为施加约束导致引入系统偏差,此外,本方法也可以保持原始数据的分辨率并纠正局部偏差。13.实施例:现以本发明试用于某地区进行大气可降水量数据融合为实施例对本发明进行详细说明,对本发明应用于其他地区进行大气可降水量数据融合同样具有指导作用。14.本实施例在某地区(30°n-50°nand126°w-102°w)采用本发明方法开展了利用gnsspwv(全球导航卫星系统测量的大气可降水量)校准和优化modispwv(中分辨率成像光谱仪测量的大气可降水量)和era5pwv(欧洲中尺度天气预报中心的第五代大气再分析资料大气可降水量)的实验,实验数据是2018年的36,976个gnss-modis样本和56,291个gnss-era5样本,最后采用本发明方法实现三种pwv数据的融合,具体实施方式如下:a.将高时间分辨率的gnsspwv(全球导航卫星系统测量的大气可降水量)数据内插到低分辨率的era5pwv(欧洲中尺度天气预报中心的第五代大气再分析资料大气可降水量)和modispwv(中分辨率成像光谱仪测量的大气可降水量)的采样时刻,实现不同数据的时间配准;b.在时间配准的基础上,使用球冠谐模型将更密集的modis(era5)pwv内插到稀疏的gnss(全球导航卫星系统)站点,实现不同数据的空间配准;c.利用三倍中误差法进行质量控制,去除不良样本;d.构建输入为(经度、纬度、高程、时间、modis或era5pwv),输出为(gnsspwv)的样本对,并对所有变量进行归一化处理;e.利用十倍交叉验证法确定最优的平滑参数,训练和测试grnn模型,得到最优模型及其精度信息;f.利用训练好的grnn模型分别对modispwv和era5pwv进行校准和优化,并将优化后的modispwv和era5pwv与gnsspwv进行融合,得到融合pwv;需要注意的是:本实施例的上述过程需要分别对modispwv和era5pwv进行,即分别用gnsspwv来校准和优化modispwv和era5pwv,最终将得到两个grnn模型;其中,era5为欧洲中尺度天气预报中心发布的第五代大气再分析资料;era5pwv为来源于era5的大气可降水量数据;gnss为全球导航卫星系统;gnsspwv为全球导航卫星系统测量的大气可降水量;modis为中分辨率成像光谱仪;modispwv为中分辨率成像光谱仪测量的大气可降水量;gnss-modis样本为全球导航卫星系统和中分辨率成像光谱仪测量的大气可降水量时空配准后的数据样本;gnss-era5样本为全球导航卫星系统和来源于era5的大气可降水量时空配准后的数据样本。15.本实施例利用均方根误差(rootmeansquareerror,rmse)、标准偏差(standarddeviation,std)、偏差(bias)和相关系数(r)来评价本发明在数据融合方面的表现。在某地区开展了利用gnsspwv校准和优化modispwv和era5pwv的实验,进而评估该方法的表现,利用gnsspwv校准和优化的具体精度信息如下表1所示;表1优化后的pwv与原始modis和era5pwv的精度信息(单位:毫米)上表1显示modispwv(中分辨率成像光谱仪测量的大气可降水量)的偏差bias为-2.1mm,era5pwv(来源于era5的大气可降水量数据)的偏差bias非常小,为0.1mm。经过grnn模型校准和优化后,两个偏差都减小到0mm,表明grnn模型有效地校准了偏差。std(标准偏差)评估不受系统偏差影响的数据精度,结果显示:经grnn优化后,modispwv(中分辨率成像光谱仪测量的大气可降水量)的标准偏差std由2.8mm减小到了2.1mm,era5pwv(来源于era5的大气可降水量数据)的标准偏差std由1.9mm减小到了1.6mm。偏差bias和标准偏差std结果的改善表明本发明所提方法不仅可以校准偏差,而且可以提高精度。在grnn校准和优化之后,modispwv(中分辨率成像光谱仪测量的大气可降水量)的均方根误差rms从3.5mm降低到2.2mm,era5pwv(来源于era5的大气可降水量数据)从1.9mm降低到了1.6mm,总体精度分别提高了37.1%和15.8%。鉴于gnss或无线电探空仪pwv的精度约为1-2mm(当前技术测量pwv的最高精度),结果改善非常显著。modispwv(中分辨率成像光谱仪测量的大气可降水量)的相关系数r从0.95增加到0.96,era5pwv(来源于era5的大气可降水量数据)的相关系数r从0.97增加到0.98;图3、图4和图5分别展示的是本实施例采用本发明方法优化前后modispwv和era5pwv每天的偏差bias、标准偏差std和均方根误差rmse;图3中的(a)图表示优化前、后modispwv每天的偏差;在图例中,modis数据(见图3中的(a)图中的实心圆部分)表示原始modispwv数据(即originalmodis,为优化前的modispwv数据);优化后的modis数据(见图3中的(a)图中的空心三角形部分)表示为modifiedmodis,即优化后的modispwv数据;图3中的(a)图的横坐标表示2018年的年积日,单位为:天;纵坐标表示系统偏差,单位为:毫米;图3中的(b)图表示优化前、后era5pwv每天的偏差;在图例中,era5数据(见图3中的(b)图中的实心圆部分)表示原始era5数据(即originalera5,为优化前的era5pwv数据);优化后的era5pwv数据(见图3中的(b)图中的空心三角形部分)表示为modifiedera5,即优化后的era5pwv数据;图3中的(b)图的横坐标表示2018年的年积日,单位为:天;纵坐标表示系统偏差,单位为:毫米;图4中的(a)图表示优化前、后modispwv每天的标准偏差;在图例中,modis数据(见图4中的(a)图中的实心圆部分)表示原始modispwv数据(即originalmodis,为优化前的modispwv数据);优化后的modis数据(见图4中的(a)图中的空心三角形部分)表示为modifiedmodis,即优化后的modispwv数据;图4中的(a)图的横坐标表示2018年的年积日,单位为:天;纵坐标表示标准差,单位为:毫米;图4中的(b)图表示优化前、后era5pwv每天的标准偏差;在图例中,era5数据(见图4中的(b)图中的实心圆部分)表示原始era5pwv数据(即originalera5,为优化前的era5pwv数据);优化后的era5数据(见图4中的(b)图中的空心三角形部分)表示为modifiedera5,即优化后的era5pwv数据;图4中的(b)图的横坐标表示2018年的年积日,单位为:天;纵坐标表示标准差,单位为:毫米;图5中的(a)图表示优化前、后modispwv每天的均方根误差;在图例中,modis数据(见图5中的(a)图中的实心圆部分)表示原始modispwv数据(即originalmodis,为优化前的modispwv数据);优化后的modis数据(见图5中的(a)图中的空心三角形部分)即modifiedmodis,为优化后的modispwv数据;图5中的(a)图的横坐标表示2018年的年积日,单位为:天;纵坐标表示均方根误差,单位为:毫米;图5中的(b)图表示优化前、后era5pwv每天的均方根误差;在图例中,era5数据(见图5中的(b)图中的实心圆部分)表示原始era5pwv数据(即originalera5,为优化前的era5pwv数据);优化后的era5数据(见图5中的(b)图中的空心三角形部分)即modifiedera5,为优化后的era5pwv数据;图5中的(b)图的横坐标表示2018年的年积日,单位为:天;纵坐标表示均方根误差,单位为:毫米;在图3、图4和图5中,空白部分均由于原始观测数据缺失。图3、图4和图5可以很直观地看到,经过本发明方法优化后,modispwv和era5pwv的bias、std和rmse在绝大多数时候都显著减小,这进一步证实了本发明在削弱系统偏差、提升精度方面的有效性;在图1中,pwv为大气可降水量;x1、x2、x3、x4和x5分别表示纬度、径度、高程、时间和低精度pwv(即低精度大气可降水量);在图2中,pwv为大气可降水量;modispwv为中分辨率成像光谱仪测量的大气可降水量;gnsspwv为全球导航卫星系统测量的大气可降水量;era5pwv为来源于era5的大气可降水量。16.其它未说明的部分均属于现有技术。当前第1页12当前第1页12