基于隐马尔可夫模型的机器人足球赛场态势评估

更新时间:2024-03-15 07:43:13 阅读: 评论:0

2024年3月15日发(作者:怎么制作新年贺卡)

基于隐马尔可夫模型的机器人足球赛场态势评估

第12卷第4期2012年2月 

科学技术与工程 

Vo1J 12 No.4 Feb.2012 

1671—1815(2012)04-0789—05 

Science Technology and En ̄neefing 

⑥2012 Sci.Tech.Engrg. 

计算机技术 

基于隐马尔可夫模型的机器人 

足球赛场态势评估 

李长江李孝安 

(西北工业大学计算机学院,西安710129) 

‘ 

摘要针对机器人足球赛场态势评估问题,提出一种基于隐马尔可夫模型(HMM)的机器人足球赛场态势评估模型。通过 

对赛场信息进行提取和量化,抽象出7个相关态势因素,作为HMM模型的输入数据。通过采用改进的Bauw—Welch算法优化 

HMM的参数,从而获得赛场态势评估结果。实验结果表明,所提出的方法能较好地满足赛场实时性和准确性的要求,可以为 

球场上对应策略的变更提供及时、可靠的依据。 

关键词机器人足球 态势评估 隐马尔可夫模型 Bauw—Welch算法 

中图法分类号TP242.6 T/r311; 文献标志码A 

在机器人足球比赛中,态势评估系统通过传感 针对赛场态势评估存在的实时有效性问题,本 

器或其它途径获得球场上的信息形成当前球场的 文提出一种基于隐马尔可夫模型(Hidden Markov 

特征向量,并以此作为态势评估框架的输入项。通 Model,HMM)的机器人足球赛场态势评估模型。实 

过分析和处理,输出对当前赛场态势的合理评估结 验表明态势评估的结果较好的满足了实时性及准 

果。态势评估结果的实时性和准确性,直接影响策 确性要求,可以为决策层策略的变更提供更加客观 

略变更的有效性,影响球队战法的实施及综合实力 

有效的依据。 

的发挥,体现机器人足球的智能水平。 

二二十多年来,态势评估在军事、网络和语音图 

1赛场态势评估模型 

像等领域中主要理论和技术成果有:态势评估时间 

在机器人足球比赛中,赛场态势评估模型通过 

推理方法、用于军事态势评估的分布式人工智能 

平台获得球场上各种信息参数,经过预处理提取赛 

(DAI)协作知识模型、用于态势特征和态势匹配的 

场态势特征,量化后作为态势评估框架的输入,通 

条件代数方法、模板匹配算法、计划识别理论、贝叶 

过分析和处理,输出对当前赛场态势的合理评估结 

斯网络方法、不确定性因果推理、神经网络、黑板结 

果,提供给策略决策层。 

构、人工势场等方法。目前国内关于态势评估的研 

1.1态势要素 

究主要以信息融合、人工智能、不确定性信息处理 

考虑到机器人足球状态空间的复杂性,如果选 

为主,主要采用计划识别、模糊推理、模板匹配、贝 

取的评判因素过多,将导致状态空间的爆炸。通过 

叶斯网络等技术为主,还有学者提出一些新颖的思 

融入专家的经验和实际的比赛分析验证,确定了影 

路,如人工势场、集对分析等。这些研究成果从不 

响比赛态势的7个关键因素 2 如表1。 

同的侧重,但距离实用化的距离还很远 j。 

1.2态势表示 

在5 5机器人足球仿真比赛中,通常将策略 

2011年11月15日收到 

分为五类:加强进攻、进攻、攻守平衡、防守、加强防 

第一作者简介:李长江(1979一),男,山东嘉祥人,汉族,硕士研究 

守。态势的划分是以策略的划分为依据的,我们定 

生,研究方向:多媒体智能信息处理,E—mml:l ̄zhhr@163.corn。 

义当前赛场应该采取的最佳策略所对应的态势为 

通信作者简介:李孝安(1965一),男,陕西西安人,汉族,硕士导 

当前态势,例如当前赛场应该采取的最佳策略是加 

师,研究方向:自然计算技术、多智能体机器人系统、机器学习、实 

强进攻,那么当前的态势就是非常有利。 

时智能测控技术。 

790 

表1赛场态势关键因素 

关键因素 

比分差 

科学技术与工程 12卷 

表达公式 

AS=S 一S 

双方进球数之差 

~一 一一P一p  一 : 一 一 

备注 

先确定两个状态集合数Ⅳ, ,然后确定HMM的三 

个矩阵参数7r,A,B。 

比赛进行 

0 

时间比率 

,7 

比赛进行时间占总时间的比率 

球的位置 球的横坐标 

控球能力 

C 我方总控球次数 

射门能力 P 我方射门成功率 

场控能力 

t 表示球在我方半场的时间 

拦截能力 [ ( + )+s (一 )表示我方总拦截次数 

Stp

( +I1] 

在机器人足球比赛中,赛场的五个态势分别与 

赛场的五个策略相对应,每个策略都有相应的赛场 

布阵打法也就是场上队形,策略、态势和队形的对 

应关系如表2所示。比赛的实质就是根据态势变化 

调整策略,比赛的关键是要实时准确地调整比赛策 

略来控制场上队形,而比赛策略的调整依据赛场态 

势的变化,赛场态势变化的获取通过态势评估系 

统,由此态势评估系统在比赛中起着举足轻重的 

作用。 

表2策略、态势和队形的对应关系 

2基于HMM的赛场态势评估 

2.1赛场态势的I玎Ⅵ】Ⅵ模型 

HMM可以用一个五元组来描述 J: 

A=(N,M,盯,A,B)。 

其中,隐含状态数目Ⅳ,可观测值数目 ,初始态势 

概率矩阵仃,态势转移矩阵A以及观测值概率矩 

阵 。 

结合机器人足球赛场态势,使用HMM建模,首 

通常足球机器人赛场态势有N=5个,用0= 

{0。,02,…,0 }表示,则机器人足球赛场态势之间的 

转移构成了一个全连接互转Markov链如图1所示。 

我们选取影响比赛态势的关键因素M=7个(如表 

1),组成赛场状态为V={ , ,…, ,…, },1≤ 

m≤7,而每一个状态q 对应的是一个随机观测序列 

为0 ={ 0 ,02,…,0 ,…,07},1≤rn≤7,显然O 

是特征信息 的实时量化表达值,由此采用一个 

离散结构的HMM建模。 

图1赛场态势互转Markov链 

定义一个三元组(7r,A,B),其中初始状态矩阵 

7r,表示计算初始赛场处于各个态势的概率矩阵7r: 

(7『l,7r2,…,7r ,…,7r5),其中7r =P(g1=0 ),1≤ 

i≤5。态势转换矩阵A,即赛场态势之间转换的概 

率,0 表示在t时刻态势为0 ,那么到t+1时刻态势 

为 的概率,即口 f=p(q…= q =0 ),1≤i, ≤5。 

观察矩阵 ,即赛场处于某一个特定态势的时候,感 

知到关键因素的概率,B 表示在时刻t赛场处于q 

状态感知到 的概率,即,1≤m≤7,1≤凡≤5。 

这样,就构建了赛场态势和各特征因素之间的 

各状态互转的离散HMM,A=(仃, ,B)。根据t时 

刻感知的特征因素序列0 ={0 ,0 ,…,0 }和 

HMM模型参数,就可以计算出当前赛场处于各种 

态势的概率即为赛场态势评估结果,也就是在t时 

刻赛场态势的分布为r ={rf(i)},1≤i≤5其中。 

2.2 I-IMM算法优化 

般来讲建立HMM模型,采用三种比较成熟 

的算法来解决HMM的三个基本问题 J:: 

(1)前向一后向算法解决态势评估问题,也就 

4期 李长江,等:基于隐马尔可夫模型的机器人足球赛场态势评估 791 

是概率P(olA)的计算问题:给定观察序列0=0 , 

0 ,…,0 和模型参数A=(7r,A, ,来有效地计算 

给定模型的观察序列的概率P(0IA)。 

(2)Viterbi算法解决解码问题,也就是最佳状 

态链的确定问题:给定观察序列0=0 ,0 ,…,0 

和模型参数A:(7r,A,B),选择另一个状态序列 

式(4)中 

= 

∑ ’( ) 

L—~ (4) 

∑“ ( , 

‘ ( , )=∑ 

L J 

) (.『)V ( √,£)= 

Q =q ,q ,…,q ,使它在当前赛场态势下能最好 

‘ ( ) 

地解释观察情况。 

(3)Baum.Welch算法解决学习问题,也就是 

HMM的参数优化(或参数估计)问题:调整模型参 

数A=(7r, , ),使p(0IA)达最大。这是HMM在 

应用中的关键问题,与前两个问题相比,这也是最 

困难的一个问题。 

但是,在机器人足球赛场环境下,Baum—Welch 

算法还存在着严重的上、下溢问题。这是因为在前 

馈和反馈过程中计算前馈变量式(1)和反馈变量式 

(2)时,它们是由多个小于1的实数连乘得到的,所 

以随着时间的推移,两个变量的值将有可能趋于0。 

但计算机所能表达的数值范围毕竟有限,当状态输 

出概率取较大或较小的数量时,累积计算的结果可 

能超出计算机浮点数范围,而产生上、下溢问题。 

但我们机器人足球比赛过程中又不允许人工介人, 

为解决这一问题采用自动计算比例因子算法|7 与 

Baum.Welch算法相结合。 

口 ( )=P(01,02,…,0 ,q =0 IA),1≤ ≤T (1) 

/3 ( )=P(0 一1,0 一2,…,0 Iq =0 ,A),1≤t≤T一1 

(2) 

依据参数估算公式 为 . 

[∑仅 ) (.J.) ( ,f)] 

专I- ———————一(3) 

=l 

[∑ 

D( ) 

) ( )W‘ ( √, )] 

式(3)中, 为迭代计算模型参数的估算值,它可以 

是HMM的 ,0 或者是态势转移概率P的均值或 

方差,K为训练样本总数,各元素右上角的(k)代表 

该元素对应第k个训练样本, ”(i,_『,t)与 ’( , 

J,t)都是前次迭代值 的函数,曰 ’与D ’分别代表 

相应的求和空间。 

为了描述自动比例因子计算算法,将上式写 

∑∑ 

,t 1 

) ( )V ( , , ) (5) 

( , )=∑ ) ’( ) ( , ,f)= 

曰‘ J 

( ) 

∑∑ ) ’( ) ( , , )(6) 

D) J t 

B‘ 一{tI1≤ ≤ }, ’=D‘ 一{tI1≤ ≤ } 

(7) 

为了防止上、下溢现象,在计算比例因子时,要 

考虑所有将被修整的量,比例因子 的计算式为 

N N N 

.一

1 

I∑ ( √)+∑ ( )+∑∑ ( )I , 

H∈{ l 1≤ ≤ ,T >£) (8) 

式(8)中 (i√)和 (i,j)分别用 一 正规化 (i,J) 

和 (i, )得到, 

( , )= ( , )= ∑ ( , ) (9) 

L ,<t 

( , )= ( √)= ∑ ‘ ( , ) (1o) 

其中 ( √)和五(i,j)分别相当于用 ,t=1,…,t一 

2正规化后的 ‘ ’(i, )和M‘ ’(i,J)。在每次不仅用 

修整五(・),同时也应修整 (i, )和 (i, )。最 

后计算 

= 

(11) 

“ ‘,J, 

2.3 ttMM参数训练 

机器人足球态势评估系统采用离散的隐马尔 

可夫模型,具体实现步骤如下 ]: 

首先要建立各态势的HMM,每种态势用具有5 

种隐状态性质的7个关键因素量化值来描述; 

其次收集整理训练数据形成数据库:赛场状态 

信息必须经过预处理后才能作为隐马尔可夫模型 

的训练数据,预处理主要包含赛场特征即关键因素 

的提取及关键因素的量化。其中关键因素的量化 

是用7个离散的量化值来表示各态势的特征,这样 

简化了赛场状态评估的复杂度,计算量小,同时也 

792 科学技术与工程 12卷 

便于实现: 

然后训练隐马尔可夫模型:模型训练是基于隐 

马尔可夫方法的重要步骤之一,它可以使模型参数 

最为理想地适应观察到的赛场状态训练数据。将 

训练集中的各个矢量序列量化为观察值序列,利用 

Baum—welch算法与自动计算比例因子算法相结合, 

逐步调整离散HMM系统的模型参数,以使得模型 

产生观察序列的概率不断增加并达到一个极大 

值点。 

最后测试评估模型:赛场状态评估系统采集到 

平台输出信号经数据预处理,求解特征向量获取赛 

场7个关键因素值并量化组成一个序列,然后分别 

采用各种态势训练得到的HMM进行概率推理,得 

到各种赛场状态对应的HMM的概率值,HMM对应 

的概率最大的态势即为系统当前赛场状态,验证评 

估结果的准确性。 

直观地来讲,HMM训练是采集某赛场态势的 

系统输出源信息,通过预处理、特征向量(关键因 

素)采集、特征向量的量化、再将量化后特征向量利 

用Baum.Welch算法和自动计算比例因子算法相结 

合训练HMM,得到该态势对应的HMM如图2 

所示。 

采 该 

集 关 关 态 

态 预 键 键 训 势 

输 ◆ 处 ◆ 素 

势 因 

lb. 

因 _

素 

.. 练 ◆ 对 

出 理 采 量 }珏 d 应 

信 集 化 的 

号 d 

图2 HMM赛场态势训练 

2.4赛场态势评估处理流程 

赛场态势提取是利用已经训练好的模型,通过 

HMM的求解得到的,可分为特征提取、态势划分和 

态势提取三个部分如图3所示。赛场态势评估系统 

采集到平台输出信号经数据预处理,求解特征向量 

获取赛场7个关键因素并量化组成一个序列,然后 

分别采用各种态势训练得到的HMM进行概率推 

理,得到各种赛场态势对应的HMM的概率值,HMM 

对应的概率最大的态势即为系统当前赛场态势。 

特征提取 念势划分 

一一 ’’ ’’。。。’’’’ 

1 删 l(非常小剁) 

采 

集 

输 

预 

求 

解 

特 

标 

准 量 

H删2 ,不利) 

出 ■ 处 ■ 征 ■ 化 ■ 标 ●h 

化 

H删3 一般) 

信 理 向 

值 

幅 

豢 H 瑚4 |有利) 

号 曩 

H涮5(非常有利) 

态 

势 

提 

取 

图3赛场态势提取 

3实验 

基于HMM的机器人足球赛场态势评估,在每 

个时间周期内,系统获取赛场信息集,得到大量 

待处理数据,然后进行预处理,提取关键因素,并对 

关键因素进行量化;合并经过量化的赛场态势关键 

因素,利用训练好的HMM进行当前态势的评估,得 

到基于概率的态势分类结果,数值代表当前赛场态 

势属于对应态势的概率,取最大值对应的态势作为 

当前赛场的态势评估结果。 

此项实验中,我们要验证基于隐马尔可夫模型 

建立的态势评估模型评估出的结果与人们观看不 

比赛得出的结果有多少误差。如果误差很小,那么 

我们可以认为该模型对赛场态势的评估真实有效, 

可以为高层决策提供正确的建议。 

在MiroSot5VS5仿真平台下分别用2006年世 

界强队一武科DEMO版作为黄队,西北工业大学基于 

HMM的态势评估版本作为蓝队进行比赛并录像。 

比赛进行到某时刻的HMM数据,包括模型输人数 

据即七个关键因素和模型输出数据即态势评估结 

果,与赛后观看录像人工统计的相应数据相比较, 

经过数据分析来验证态势评估结果的有效性,如表 

3所示。 

为了进一步验证态势评估结果的有效性,我们 

又组织了53场比赛,每场比赛只随机抽取一个时间 

节点,总结这54次不同场次不同时间节点的HMM 

数据分别与我们赛后的客观评价相比较,结果表明 

4期 李长江,等:基于隐马尔可夫模型的机器人足球赛场态势评估 793 

主要存在关键因素微小误差,对态势分析结果的准 

略之间的吻合程度,反映策略变更的有效性,体现 

确率达98.15%,态势评估结果的准确性得到了保 

球队综合实力的发挥。态势评估的实时性决定着 

证,这将为决策层进行策略选择起到很重要的基础 

该模型的生存空间,是态势评估准确性的前提条 

性作用。 

件,而且随着赛场条件的开放,其要求会越来越高。 

表3某时间点态势数据比较 

本文以机器人足球比赛为应用背景展开了基 

于HMM的态势评估研究。结果表明,基于HMM的 

机器人足球赛场态势评估系统能较好地满足实时 

性和准确性的要求,可以为球场上对应策略的变更 

提供及时、可靠的依据。 

参考文献 

1黄玺瑛,赵定海.态势评估研究现状初探.科协论坛,2009;(4) 

(下):94—95 

2王斌.机器人足球比赛态势分析与性能评测系统研究.西安: 

西北工业大学硕士研究生学位论文,2005 

3沈 阳.机器人足球赛场态势评估模型及方法研究.西安:西北 

工业大学硕士研究生学位论文,2009 

另外,该模型采用了离散的隐马尔可夫模型, 

4车 鸣.基于人工免疫机理的赛场态势评估模型.西安:西北工 

业大学硕士研究生学位论文,201 1 

个明显的优点就是计算简单,运算周期短。比赛 

5 Ames A,Vigna V F,Kemmerer G R.A.Using hidden markov mod— 

平台每1/60 S提供一次源信息,策略运行中每1/ 

els to evaluate the risk of intrusions.In:Proceedings of the Interna- 

60 s( 16.7 ms)内都可以自动计算出每个关键因素 

tional Symposium on the Recent Advances in Intrusion Detection 

并量化。而HMM的运算周期,即从七个关键因素 

(RAID 2006):Springer—Verlag,2006:145—164 

量化值输入到态势评估值输出的时间为252 ms至 

6 Rabiner L R.A tutorial on hidden Markov models and selected appli- 

cations in speech recognition.In:Proceedings of hte IEEE.1989;77 

347 Ins,取最大值347 ms也远小于通常情况下态势 

(2):257—.286 

评估的计算周期5/6 s(833.3 ms),模型系统的实时 

7王玉洁.基于人工心理的情感建模及人工情感交互技术研究.北 

性得到了保证。 

京:北京科技大学博士学位论文,2007 

8贾宾,朱小燕,罗予频,等.消除溢出问题的精确Bantu.Welch 

4结论 

算法.软件学报,2000;11(5):7o7—71O 

赛场态势评估是机器人足球比赛系统重要的 

9周书仁.人脸表情识别算法分析与研究.长沙:中南大学博士学 

位论文,2009 

决策依据。态势评估的准确性决定球员与决策策 

HMM Based Situation Assessment for Robot Soccer 

LI Chang-jiang,LI Xiao—an 

(School of Computer Science,Northwestern Polytechnical University,Xi’an 710129,P.R.China) 

[Abstract] For robot soccer stadium situation assessment problem,a novel model of robot soccer stadium situa. 

tion assessment based on the Hidden Markov Model(HMM)is proposed.First,seven key factors through the char- 

acteristics of game environment as the inputs of HMM are abstracted.And then the parameters of HMM using the 

improved Bauw・Welch algorithm based on the existing experimental database are optimized.Finally,the result of 

the model is got.The experiment result shows model can satisfy real—time and accuracy demands and provide timely 

and reliable references for the change of the corresponding strategy for current soccer situation. 

[Key words] robot soccer situation assessment HMM Bauw—Welth algorithm 

基于隐马尔可夫模型的机器人足球赛场态势评估

本文发布于:2024-03-15 07:43:13,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/zhishi/a/1710459793286401.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

本文word下载地址:基于隐马尔可夫模型的机器人足球赛场态势评估.doc

本文 PDF 下载地址:基于隐马尔可夫模型的机器人足球赛场态势评估.pdf

标签:态势   评估   赛场   模型   机器人   计算   算法
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 实用文体写作网旗下知识大全大全栏目是一个全百科类宝库! 优秀范文|法律文书|专利查询|