集合滤波和三维变分混合数据同化方法研究
吴新荣;韩桂军;李冬;李威
【摘 要】发展了一种新的混合数据同化方法——基于集合滤波和三维变分的混合数据同化方法.该方法将集合调整卡尔曼滤波(enmble adjustment Kalman filter,EAKF)得到的集合样本扰动通过一个转换矩阵的形式直接作用到背景场上,利用顺序滤波的思想得到分析场的一个扰动;然后在三维变分(three dimensional variational analysis,3D-Var)的框架下与观测数据进行拟合,从而给出分析场的最优估计.文中以Lorenz63模型为例,开展了理想数据同化试验,结果表明,相比于集合调整卡尔曼滤波,这种新的混合同化方法可以给出更好的同化结果.%A new hybrid data assimilation scheme bad on enmble adjustment Kalman filter (EAKF) and three-dimensional variational (3D-Var) analysis is developed. In this assimilation scheme, the perturbation of enmble from EAKF is applied to the background field by using a transformation matrix, thus the perturbation of the analysis field can be obtained by taking advantage of a quential filter, which will then be optimized by being combined with obrvations under the framework of 3D-Var. The data assimilation experiment in a perfect
ca is carried out by using Lorenz-63 model. The results demonstrate that the hybrid data assimilation scheme performs better than EAKF.
【期刊名称】《热带海洋学报》
【年(卷),期】2011(030)006
【总页数】7页(P24-30)
微信头像图片花【关键词】混合数据同化方法;集合调整卡尔曼滤波;三维变分
【作 者】吴新荣;韩桂军;李冬;李威
【作者单位】中国科学院南海海洋研究所,广东广州510301;国家海洋信息中心,天津300171;中国科学院研究生院,北京100049;国家海洋信息中心,天津300171;国家海洋信息中心,天津300171;国家海洋信息中心,天津300171
【正文语种】中 文
【中图分类】P731
基于最优控制论的变分方法[1]和基于估计理论的集合滤波方法[2] 是两类主要的现代数据同化方法。三维变分数据同化方法(three-dimensional variational analysis, 3D-Var)是一种经济、灵活以及统计可靠的变分数据同化方法, 其假定预报和观测的误差不随时间变化且服从高斯分布。四维变分(four-dimensional variational analysis, 4D-Var)是在模式的动力约束下, 寻求拟合给定时间窗口内的观测的最佳模式轨迹。4D-Var的主要问题在于切线性模式和伴随代码的编写, 目前业务化运行时一般都采用简化的增量形式[3], 而且其背景场误差协方差矩阵需要其他方法给定。集合滤波(enmble filter)是广泛使用的基于集合的数据同化方法, 其利用随模式非线性演化的集合成员对流相关(flow-dependent)的误差分布进行估计。如何将变分同化方法和集合滤波方法结合起来, 利用其各自的优点, 得到研究者越来越多的关注。Hamill等[4]将3D-Var和集合均方根卡尔曼滤波(enmble square root Kalman filter,EnSRF[5])结合起来, 指出如果样本足够大, 那么根据集合计算出的背景误差协方差可以完全代替3D-Var的静态背景误差协方差。Corazza等[6]提出了另一种混合机制, 即利用集合样本对3D-Var的背景误差协方差进行膨胀, 从而将流相关的背景误差引入3D-Var中。Zupanski[7]发展了最大似然集合滤波(maximum-likelihood enmble filter, MLEF), 其使用集合样本计算 Hessian矩阵和目标泛函的梯度,改进了集合滤波中非线性观测算符的处理方
法。Lorenc[8]将 3D-Var和集合卡尔曼滤波(enmble Kalman filter, EnKF[2])结合起来, 利用这种混合机制来确定流相关的背景误差协方差。Buehner[9]采用了类似的混合机制, 指出这种混合数据同化方法的同化效果类似于EnKF, 优于3D-Var。Wang等[10]将集合转换卡尔曼滤波(enmble transform Kalman filter,ETKF[11])和最优插值(optimum interpolation, OI)结合起来, 将由集合样本计算出的背景误差协方差和静态背景误差协方差进行加权, 从而获得流相关的背景误差。Hunt[12]和Fertig等[13]提出了四维集合卡尔曼滤波(four dimensional enmble Kalman filter,4DEnKF), 试验表明根据集合样本计算出的背景误差协方差可以应用于变分算法中。Liu等[14]发展了集合四维变分(enmble four dimensional variation analysis, En4DVAR),根据集合样本构建流相关的背景误差协方差, 然后在避免切线性和伴随模式的前提下进行 4D-Var同化。Zhang等[15]将 EnKF和4D-Var相耦合, 即EnKF为4D-Var提供流相关的背景误差协方差, 4D-Var用来优化集合平均, 达到防止滤波发散的目的。理想试验表明, 耦合同化方法的同化效果比EnKF和4D-Var好。Wan等[16]发展了覆裹集合卡尔曼滤波(dresd enmble Kalman filter,DrEnKF), 利用10个动力样本以及90个由模式积分获得的静态集合成员计算背景误差协方差, 从而更新10个动力样本, 结果表明DrEnKF与100个动力样本的 EnKF的同化效果相近, 且误差协方差吻合较好。
上面提到的集合滤波和变分同化方法混合机制的切入点都在背景误差协方差上, 即利用先验集合样本为变分方法提供流相关的背景误差协方差, 或利用由动力样本和静态样本计算的误差协方差的加权平均作为背景误差协方差矩阵。本文将集合滤波方法和3D-Var结合起来, 发展一种新的混合同化方法, 即得到的预报样本扰动通过一个转换矩阵的形式直接作用到背景场上, 得到分析场的一个扰动;然后在三维变分的框架下与观测数据进行拟合, 从而给出分析场的最优估计。
本文的结构安排如下: 第一部分介绍本文所发展的混合数据同化方案; 第二部分为理想数据同化试验和结果分析; 第三部分为总结。
一般情况下, 3D-Var的目标泛函表达式[17,18]为:
其中, X表示由控制变量构成的向量, Xb表示背景场,B表示背景场误差协方差矩阵, H表示观测算符,Yobs表示观测向量, R表示观测误差协方差矩阵, Jb和Jo分别表示背景项和观测项。
目标泛函关于控制变量的梯度为:12月的节日
对应的分析场为:
日分
本文采用的集合滤波方法是 Anderson[19]提出的集合调整卡尔曼滤波法(enmble adjustment Kalman filter, EAKF), 其定义联合状态-观测向量
其中, X是模式状态向量, Xt是状态变量的真值, H是观测算符, Y表示观测向量的真值; Z的维数为n+m,其中n是控制变量的维数, m是观测向量的维数。观测是模式状态变量的函数, 并且包含相应的观测误差
其中, ε是m维服从均值为0、协方差为R的高斯分布的观测误差。
根据贝叶斯理论, Z的后验分布可以表示为
其中, Zu和Zp分别表示Z的后验和先验取值, D是标准化因子。在高斯分布的假定下, Zu也服从高斯分布,其均值和协方差分别为新公共管理理论
其中,和分别表示X的后验和先验误差协方差矩阵, 和分别表示 Z 的后验和先验均值,H'是联合状态空间中的观测算符。(7)和(8)式的推导过程详见文献[19]。
凤翥鸾翔
通过对 以及 H 'T R− 1H '进行相关变换以及奇异值分解(singular value decomposition, SVD), Σu可以写成下式
上式的推导以及 A的表达式详见文献[19]中的附录A。
这样, 集合样本即可利用下式进行更新青春心
其中, i表示集合成员。
Houtekammer等[20]指出, 如果观测之间是不相关的, 那么可以顺序地对其进行同化而不改变(6)式的结果。EAKF正是采用了这种顺序同化的思想。对于单个观测 Yo, 在全局(局部)最小二乘意义下,EAKF主要包括如下2个步骤:
首先, 利用观测算符计算观测的集合成员, 并计算每个成员的增量ΔYi;
其次, 计算每个状态变量的每个集合成员的增量
其中, i表示集合成员, j表示状态变量, 表示第j个状态变量与观测之间的先验协方差, 表示观测的先验方差。方程(10)是两步法的向量形式。
下面推导该两步法框架下状态变量集合成员的更新表达式。
根据文献[21]中的方程(24)
此即第 j个状态变量的第 i个集合成员的更新表达式。
对 m 个观测, 利用(14)式顺序进行同化, 这样更新后的状态变量的集合成员严格地服从后验高斯分布。另外, EAKF上述两步法中仅使用了一阶和二阶矩(线性), 因此先验分布的高阶矩(非线性)结构得以保留。
小学数学概念
本文将EAKF的机制引入3D-Var的背景项中,用集合样本来构建流相关的背景误差协方差; 用顺序滤波来继承状态变量先验分布的非线性信息; 用3D-Var来给出状态场的最优估计, 这样就得到了一种新的混合同化方法, 本文称之为集合滤波和三维变分混合数据同化方法(hybrid enmble filter –3D-Var)。
由于背景场变量之间是相关的, 为了实施EAKF算法, 需要通过一个转换矩阵的形式, 将其旋转到变量独立空间; 然后利用3D-Var对观测进行同化, 得到最优分析场; 最后通过反旋转得到一个新的状态变量的分析场。
下面讨论如何将背景场转换到变量独立空间。
令其中N表示集合样本大小, Xi (i=1, …, N)表示由模式格点组
成的控制变量的第 i个集合成员, 其维数为n×1, 其中n表示模式格点数; Xb,i (i=1, …, N)表示由模式格点组成的第 i个背景集合成员, 其维数为n×1。另外, 假设观测向量Yobs的维数为m×1; H为观测算符; R为观测误差协方差矩阵。根据Xb, 可以计算出背景误差协方差矩阵
其中, Q和G是正交矩阵, T和S为对角矩阵。
对控制变量 Xi、背景场 Xb,i以及观测场 Yobs进行如下变量代换:
将(17)代入(18), 并根据(16)以及 Q 的正交性,容易得出:
因此 B′是对角矩阵, 即 xb,i中各个模式格点之间是不相关的。
在每一个分析步, 混合数据同化方法主要包含以下步骤。
第一步, 利用先验集合样本计算背景误差协方差矩阵B;
第二步, 对背景误差协方差矩阵 B以及观测误差协方差矩阵R进行SVD分解;
第三步, 利用(17)式进行变量代换, 将背景场以及观测场转换到独立空间中;
台北国父纪念馆第四步, 对第i=1, …, N个集合成员, 依次执行下面3步:
首先, 利用(14)对背景场xb,i进行顺序滤波
其中Γj表示第j个状态变量的Γ; rj表示第j个状态变量的“观测”误差; 、xik、xb,ij以及分别表示分析场、控制变量 xi、背景场 xb,i以及先验均值的第k、k、j以及j个分量;
其次, 利用3D-Var对观测场yobs进行同化。目标泛函采用下式
其中 是的向量形式, xi是xik的向量形式, H是当前空间下的观测算符。计算出目标函数关于xi 的梯度, 进而利用拟牛顿法[22]搜索最优解 ;
最后, 对 进行反正交变换, 从而得到原始空间里第i个集合成员的分析场
采用 Lorenz-63模型[23]作为理想试验模型, 其控制方程为
其中, x1、x2和x3分别表示对流运动的强度、水平方向以及垂直方向的温度梯度, σ、b以及κ分别取为10、8/3以及 28, 时间步长为 0.0001s, 差分方案采用双逼近方案[23]。