改进的MCMC方法及其应用

更新时间:2023-06-19 18:25:41 阅读: 评论:0

2009年8月
水  利  学  报
SHUILI  XUEBAO 第40卷 第8期
chillax收稿日期:2008-06-16
基金项目:973课题(2005CB724202);国家自然科学基金项目(50609024);浙江省自然科学基金(Y506138)
作者简介:朱嵩(1981-),男,安徽人,博士后,主要从事环境水力学反问题研究。E -mail:migao@zju.edu
文章编号:0559-9350(2009)08-1019-05改进的MCMC 方法及其应用
朱嵩1,毛根海1,刘国华1,黄跃飞2
(1.浙江大学建筑工程学院,浙江杭州 310058;2.清华大学水利水电工程系,北京 100084)
my job>考研政治预测
六级准考证打印摘要:概率反演中,马尔科夫链蒙特卡罗是一类重要的后验概率抽样方法,但由于该算法的搜索往往会
陷入局部最优解,因而限制了其在具有非唯一解反问题中的应用。鉴于此,本文对基于Metrop olis -Has tings 算法的多链搜索的方法进行了改进,改进后的方法可以根据搜索结果实时调整链的个数,因而可以在搜索到尽可能多的解的同时节省了多链搜索的时间。最后将该算法应用于一个地下水污染源反问题的求解,计算结果表明改进后的算法对求解非唯一性反问题具有较好的效果。
关键词:马尔科夫链蒙特卡罗;概率反演;Metropolis -Has tings 算法;非唯一性;环境水力学
中图分类号:O242;TV13文献标识码:A
1 研究背景
一般而言,环境水力学正问题主要研究地表及地下水中污染物的输移、扩散和转化规律,建立相关的分析计算方法,确定污染物浓度的时空分布及其应用[1]。与此对应,环境水力学反问题是指根据有限且离散的实测水动力、水质数据来估计环境水力学模型参数、边界条件、初始条件以及污染源位置和强度等信息。与正问题的适定性相反,环境水力学反问题是一种不适定问题,主要表现为解的不唯一性,这给反问题的求解带来了较大的困难[2]。
目前,反问题求解方法主要包括正则化方法、最优化方法、概率统计方法等[3]。在环境水力学反问题研究领域中,这些方法都得到了应用[4-9]。然而针对环境水力学中广为存在的测量噪声,以及先验信
息等不确定性因素,概率统计类方法相比较优化类方法能更好地描述和求解此类问题[10]。贝叶斯推理
(Bayesian inference)是处理非线性、不确定性系统反问题一种行之有效的概率反演方法,它通过对未知参数的后验概率进行抽样来获得参数的估计。马尔科夫链蒙特卡罗(Markov chain Monte Carlo,MC MC)目前是贝叶斯推理的标准抽样方法,但由于非线性不确定性系统的复杂性及MC MC 算法中计算参数设置的人为性(如计算步长和计算终止条件的选择等),抽样结果是否具有对后验概率分布的代表性与Markov 链设计者的经验有很大关系。由于对一次计算结果的可靠性很难做出判断,因而采用多链搜索方法对其进行改进是一种有效的办法,例如Metropolis -coupled MC MC 算法[11]等。
本文亦对基于Metropolis -Hastings 算法的MC MC 抽样方法进行改进,提出了一种动态多链方法(Dynamic Mult-i chain Metropolis -Hastings,DMMH),该方法在不改变Metropolis -Hastings 算法核心机制上能通过增加搜索结果对链数目的反馈机制,从而保证每条Markov 链收敛性的同时提高抽样的全局能力和多链抽样的效率。最后将该算法应用于求解地下水污染源估计反问题,计算结果表明改进后的算法显著增强了MC MC 搜索的全局能力,同时降低了多链搜索的总时间。
2MCMC算法及其改进
MC MC是利用Markov链机制探索状态空间以生成样本的方法,这种机制能够保证Markov链能花更多
的时间在最重要的区域,尤其它能够被构造,以致它产生的样本能够模仿目标分布的样本[12]。Markov 链的重要特性是无后效性,它指事物本阶段的状态只与前一个阶段的状态有关,而与以前其他任何阶段的状态无关。Metropolis-Hastings算法[13-14]是应用最为广泛的MC MC抽样方法。大多数实际的MC MC算法可以解释成Metropolis-Hastings算法的特例或扩展。关于Metropolis-Hastings算法可参见文献[12-14],限于篇幅这里不再赘述。
由于计算时间有限和随机游走设计的不当,对于一个较为复杂的参数空间,一个基于Metropolis-Hasting算法的实际随机游走往往不能对其充分搜索。因此对于一个具有潜在非唯一解的反问题,采用一个陷入局部最优解的随机游走产生的样本来对反问题的解进行评价是不全面的,甚至可能是误导的。如图1所示,对于一个多峰值的概率密度函数,传统的Metropolis-Hastings算法往往会陷入一个局部高密度区域。
为了提高MCMC抽样的全局能力,本文提出动态多链的抽样方法DMMH。算法如图2所示:
图1一个多峰值的后验概率密度函数图2D MM H算法流程
该算法对经典的Metropolis-Hastings算法的改进如下:(1)设置了多条初始点不同的Markov链对整个后验空间进行搜索,起始点的位置在参数的先验空间内随机产生,这样尽可能提高了早期Markov链的多样性,进而提高了抽样的全局能力;(2)在每条链进入统计平衡阶段后,通过判断链与链之间的接近程度(根据反演参数的统计特征)来实时调整(减少)多链的数目,以尽可能提高计算效率。
初始链数的数目亦与局部最优解的数目相适应,太大则会影响早期的计算效率,太小则多链搜索的优势难以体现。链与链之间的接近程度,可以由当前代每条链的当前值或统计平均值的欧氏距离等来表达。例如对于参数X第i代时第j条链和第k条链,其距离可以表达为+X(j)i-X(k)i+2。
3算例验证
为验证DMMH算法的可靠性和相对于经典Metropolis-Hastings算法的优点,本文选取了一个地下水污染源识别问题作为算例。为了便于说明问题,假设水动力-水质场的参数均已知,而污染源的位置未知。
设在无限展布、水平、等厚的均质含水层中存在着均匀单向流动,取x轴方向为流动方向,在t=0开始在污染源处(x0,y0)向含水层连续注入含示踪剂流体。
根据文献[15]并加以推导,可得在任意一点(x,y)上,t时刻的污染物浓度值,如式(1):
c (x ,y ,t )=c 0q 4P D L D T exp V (x -x 0)2D L Q ]a 4t
exp -u -ab u d u u (1)式中:c 0为示踪剂浓度;q 为示踪剂的注入速率;D L 、D T 分别污染物纵向弥散系数和横向弥散系数:V 为水体在x 轴方向上的流速;a 、b 分别为两个系数:a =(x -x 0)2D L +(y -y 0)2D T ,b =V 24D L
。算例中流动及扩散参数如下:流速V =011m/s,示踪剂注入速率点源强度c 0=100mg P L,纵向扩散系数D L =1m 2P s,横向扩散系数D T =013m 2P s,q =1m 2P s 。
设该问题唯一的浓度观测点为P (300m,150m),由于对称性可知,污染源的潜在位置关于过P 点的水平轴对称,因而该问题是一个具有非唯一解的反问题。设污染源位置(x 0,y 0)的两个/真值0为(200m,100m)及(200m,200m)。通过式(1)可以计算得到测点P 上的浓度值作为观测值,共取了t =1、2、3、4、5和6min 时的浓度计算值,如表1所示。此外,假设测量噪声为白噪声N (0,R 2),R =1E-6。
家严表1 观测点上污染物浓度/测量值0
t P min
123456c P (mg P L)01000133173010109945010541786011268840121763101317398  下面分别采用Metropolis -Hastings 算法和DMMH 算法对污染源进行反演计算。
图3 污染源位置迭代曲线(Metropolis -Has tings 算法)311 应用Metropolis -Hastings 算法 模型参数的先验分布为x
I [150,250]m,y I [50,250]m 上的均匀概率分布。随机游走的
proposal 分布为g (x *|x (i ))=U (x (i )-step,x (i )+step),步长step
为参数先验范围的40%,即参数x 的搜索步长为40m,y 的搜索
步长为80m 。迭代进行1000次。图3为两个参数的迭代曲线,
从图中可以看出,Metropolis -Hastings 算法只搜索到一个污染源位
置(200m,100m)附近。
312 应用DMMH 算法 其他条件不变,采用DMMH 算法进行
计算。起始链数取为4条,采用当前值作为2条链接近的度量方
式,当式(2)所示条件满足时删除编号较小的那条链:
|x (j )i -x (k )i |<50m
|y (j )i -y (k )i
|<50m i \200
(2)
图4)7为4条链的迭代曲线,表2为各链的运行过程及迭代2000步时的搜索结果。从图4)7和表2中可以看出,DMMH 算法搜索到了2个污染源的潜在位置(200m,100m)及(200m,200m)附近。若采用迭代运行终点计算值作为污染源的估计值,则两条链的搜索的相对误差分别1915%和1013%(见表
2)。需要指出,本算例中由于测量噪声相当小,使得参数/真值0影响区域只占整个后验参数空间中一个极窄的区域,因而随机游走进行得相对较慢。从图6)7中我们也可以看出,在迭代过程中搜索曲线在相当长的范围内没有变化。尽管如此,MC MC 搜索机制能够保证搜索向高概率密度区域(真值附近)方向搜索。若要进一步提高搜索精度,需要进一步增加Markov 的迭代步数。
表2 Markov 链运行状态及搜索结果
链编号
运行状态搜索到污染源的位置搜索值距真值的距离相对先验范围的误差1雅思听力真题
与链2较接近,200步时被删除2
与链4较接近,201步时被删除3
迭代至终点(18215m,10816m)1915m 1915%4迭代至终点(21916m,20613m)2016m 1013%跟踪4条链的运行状态,可以发现当迭代至200步时,链1和链2接近,因而链1被删除;迭代至201步时,链2和链4接近,因而链2被删除。假设每条链的总计算时间为T,则DMMH 算法的计算时间
为200T P2000+201T P2000+T+T=212005T,约为4条链数固定条件下多链搜索时间(4T)的55%,表明DMMH算法相对于常规的多链搜索具有较高的计算效率。
混蛋英语
图4链1中参数的迭代曲线(D MM H算法)图5链2中参数的迭代曲线(DM MH算法)
tutu
图6链3中参数的迭代曲线(D MM H算法)图7链4中参数的迭代曲线(DM MH算法)
4结论与讨论
本文针对具有非唯一解的反问题,在经典Metropolis-Hastings算法的基础上提出了一种动态多链的蒙特卡罗方法DMMH。该方法由于设置了多链的搜索结果与链的数目之间的反馈机制,因而实现了Markov链的搜索的时间复杂度与反问题复杂性(主要表现在非唯一解的特性)之间的一个较为合适的平衡。对于具有潜在非唯一解的反问题,DMMH算法将在一个合适的计算时间内搜索到尽可能多的非唯一解。
由于参数的后验空间往往是相当复杂的,因而在有限的时间内寻找到所有的可行解是相当困难的,充分利用高性能计算是解决此类问题的一个十分重要的途径。
参考文献:
[1]李玉梁,李玲.环境水力学的研究进展与发展趋势[J].水资源保护,2002(1):1-6.
[2]Kirsch Andreas.An Introduction to the Mathematical Theory of Inver Problems[M].New York:Springer,1996.
[3]王彦飞.反演问题的计算方法及其应用[M].北京:高等教育出版社,2007.
[4]Isakov Victor,Ki ndermann Stefan.Identification of the di ffusion coefficient in one-dimensional parabolic equation[J].
Inver Problems,2000,16(3):665-680.
[5]闵涛,周孝德,冯民权.非线性布西尼斯克方程的直线解法及渗透系数反演计算[J].水利学报,2004(7):21-
25.
[6]Liu Shuming,Butler David,Brazier Richard,et al.Using genetic algorithms to calibrate a water quality model[J].
Science of the Total Environment,2007,374,(2-3),15:260-272.
[7]闵涛,周孝德,冯民权.河流水质多参数识别反问题的演化算法[J].水利学报,2003(10):119-123.
[8]Liu Yong,Yang Pingjian,Hu Cheng,et al.Water quali ty model for load reduction under uncertainty:A Bayesian
approach[J].Water Rearch,2008,42(13):3305-3314.
[9]朱嵩.基于贝叶斯推理的环境水力学反问题研究[D].杭州:浙江大学,2008.
[10]Albert Tarantola.Inver problem theory and methods for model parameter estimation[M].Philadelphia:SIAM,2004.
[11]Geyer C J.Markov chai n Monte Carlo maximum likelihood[C]P P In Keramidas(ed.),Computing Science and Statistics:
Proceedings of the23rd Symposium Interface.Washington:Institute of Mathematical Statistics,1991:156-163. [12]Andrieu Christophe,De Frei tas Nando,Doucet Arnaud,et al.An introduction to MCMC for Machine Learni ng[J].
Machine Learning,2003,50:5-43.
[13]M etropolis N,Ronbluth A W,Ronbluth M N,et al.Equati ons of state calculations by fast computing machines[J].苔丝英文读后感
Journal of Chemical Physics,1953,21:1087-1091.
[14]Hastings W K.Monte Carlo sampling methods using Markov chains and their Applications[J].Bi ometrika,1970,57:97
-109.
[15]孙讷正.地下水污染一数学模型和数值方法[M].北京:地质出版社,1989:60-61.
Improved MCMC method and its application
ZHU Song1,MAO Gen-hai1,LIU Guo-hua1,HUANG Yue-fei2
kake(1.Zhe jiang Unive rsit y,Hangzhou310058,China;  2.Tsinghua Universit y,Be ijing100084,China)
Abstract:A mult-i chain sampling method bad on Metropolis-Hastings algorithm was ud to improve the Markov C hain Monte Carlo(MC MC)method in order to prevent from trapped into the local optimal solutions that often occur to probability inversion by using current MC MC algorithm.The improved MC MC method can adjust the number of chains acc ording to the feedback results from sampling process in real time,so that it can arch out the non-unique solutions as much as possible while saving the time of mult-i chain arch.As an e xample an inver problem of groundwater flow was solved by using the improved MC MC algorithm.The computational results indicate the improved method performs well in solving inver problems with non-unique solutions.
Key words:Markov Chain Monte Carlo;probability inversion;Metropolis-Hastings algorithm;non-uniqu
eness;environmental hydraulics
(责任编辑:韩昆)

本文发布于:2023-06-19 18:25:41,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/78/992765.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:问题   搜索   算法   方法   计算   参数   污染源   抽样
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图