多智能体系统协调控制一致性问题研究
摘要:本文首先给出了多智能体系统协调控制一致性问题的发展情况, 介绍了解决一致性问
题的主要原理和适用范围,对一致性协议进行了总结,对一致性问题研究的主要领域进行了 简单的概括。文章最后对多智能体系统未来的发展方向进行了探讨和分析, 提出几个具有理
论和实践意义的研究方向。
关键词:分布式人工智能;多智能体系统;协调控制;一致性问题
1.引言
多智能体系统在20世纪80年代后期成为分布式人工智能研究中的主要研究 对象。研究多智能体系统的主要目的就是期望功能相对简单的智能体之间进行分 布式合作协调控制,最终完成复杂任务。多智能体系统由于其健壮、可靠、高效、 可扩展等特性,在计算机网络、机器人
、电力系统、交通控制、社会仿真、虚拟 现实、军事等方面有着广泛应用[1-3]。智能体的分布式协调合作能力是多智能体 系统的基础,是发挥多智能体系统优势的关键,也是整个系统智能性的体现。
在多智能体分布式协调合作控制问题中,一致性问题作为智能体之间合作协 调控制的基础,主要是研究如何基于多智能体系统中个体之间有限的信息交换, 来设计的算法,使得所有的智能体的状态达到某同一状态的问题。 一致性协议问
题作为智能体之间相互作用、传递信息的规则,它描述了每个智能体和与其相邻 的智能体的信息交换过程。
近年来,一致性问题的研究发展迅速,包括生物科学、物理科学、系统与控
制科学、计算机科学等各个领域都对一致性问题从不同层面进行了深入分析, 一
致性问题作为智能体之间合作协调的基础, 受到越来越多研究者的关注,成为系 统与控制领域的一个重要研究课题。
2.多智能体系统协调控制中一致性问题阐述
lobster2.1图论基础知识
图论和矩阵论是一致性问题研究分析中非常重要的工具, 很自然的会想到用 图论相关知识来表示多智能体相互间传递信息的过程。如果用 G = (V ,E)来表示 一个图,其中V表示非空顶点的集合,E V2表示节点对组成的边的集合。 假设 集合V中共有n个节点,切编号为i・口2,..., n?。如果第icimigo个节点和第j个节点之
间有信息传递,则该节点对有连边。在无向图中,节点对是无序的,即节点对间 连边没有方向,pvccVi,Vj E= Vj,Vi E。然而在有向图中,第i个节点有边指向
第j个节点并不代表第j个节点有边指向第i个节点,即边是有向的。顶点集V和 边集冰河世纪 猛犸象的圣诞节E通常决定了网络拓扑图的序与尺寸。 在动态网络系统中,边集E统称为系 统的通信复杂度。
2.2矩阵论基础
为了表示节点与边的关系,通常采用邻接矩阵 A =「aij]来表示。具体定义如
下:
mechanic
剛」 i,je E ⑴
」- .0 otherwi ()
对于无向图G ,其邻接矩阵是对称的。
对于每一个智能体,采用的是分布式控制策略,能够通信的范围是有限的, 主要通过自身的状态和能够进行通信的邻居状态来进行状态的变化。 通常用邻域
集N来表示智能体的邻域集。第i个智能的邻域集定义如下:
Ni 二打 V;aj =0, j V;(i, j)・ El (2)
如果智能体j是i的邻居,且aj -0,则表示智能体i可以接收j的信息。如 果网络拓扑结构时变,为切换拓扑网络结构,则 G=(V,E)为动态图,记为
G(t) =(V,E(t))。其中边集E(t)、邻接矩阵A(t)及每个智能体i的领域集M(t)均
时变。在许多应用中,网络拓扑结构经常为切换拓扑,如移动机器人通信网络。
2.3 一致性问题数学描述
对于多智能体系统中的单个智能体i的状态可以表示为z/t)二ui,若所有智能 体的状态最终趋于相等,则表示为
|z(t) — Zj(t)||T 0"i 式 j 且 tsm什么意思 T (3)
3.多智能体系统协调控制一致性问题理论分析
用z(t)表示第i个智能体的状态信息。状态信息是用来表示智能体进行协调 控制所需要的信息,可以是速度、位置、角度、决策量等信息。
3.1基于连续时间的一致性协议
Offati-Saber等人[4]提出了一种基于连续时间的分布式一致性协议,协议如
下:
Z(t)=送 aj(Zj(t) — z(t)) ⑷
j -Ni(t)
该协议只需通过智能体的邻域信息传递就可达到整个系统趋于一致。 该协议
也可用矩阵的方式表示:
z - -LZ (5)
其中:L为多智能体系统网络图的拉普拉斯矩阵。若系统拓扑结构为无向图, 则系统逐渐收敛到所有智能体初始值的平均值,即 a = (1/n厂Zi (0)这种协议称 为平均一致性协议,该协议在传感器网络信息融合等领域有广泛的应用。
3.2基于离散时间的一致性协议
基于离散时间的一致性协议如下所示:
Zi(k+1)=z(k+1)2 inconsolable送 aj(Zj(k)—Zj(k)) (6)
j 刮(k)
也可用矩阵的方式表示:
Z(k 1) =D(k)Z(k) ( 7)
其中「°为调整因子,一般取(0, f],0—:1 ; D(k)=l-;L(k),I为单位 矩阵,D(k)为非负矩阵。
3.3基于切换拓扑结构的一致性协议
在实际应用当中,多智能体系统的网络拓扑结构时常发生变化, 通常将这种
时变的拓扑结构称为切换拓扑结构。造成网络拓扑动态变化的原因有很多,比如 在车辆编队控制过程中车辆位置发生了变化; 在移动机器人进行通讯过程中,由freight
于网络的故障造成信息传递丢失。通常来说,基于切换拓扑结构的一致性协议能 够很好地应对拓扑结构动态变化的要求,最后使智能体的状态趋于一致。
(8)
网络切换拓扑结构可以用动态图 G(s(t))表示,其中s(t)为切换信号,贝U切换 拓扑的一致性协议可表示为:
Z —L(G(s(t)))Z
3.4带时滞一致性协议
智能体之间进行信息传递交换的过程当中,经常会存在信息传递延时所带来 的时滞问题。目前,带时滞的一致性协议主要分为三类:a)chiefs对称时滞一致性协议, 智能体本身接收和发送信息都有固定时滞;b)非对称时滞一致性协议,智能体本 身接收信息有固定时滞,发送信息没有时滞;C)时变时滞一致性协议,时滞是随 时间动态变化,不是固定的常数。
对称时滞一致性协议为:
Zi(t)二 ' aj(Zj(t - )-Zi(t- )) (9)
j-叫(t)
不对称时滞一致性协议为:
Zj (t)二 \ aj (Zj (t - •)- Zi (t)) ( 10)
j WN 师德演讲稿j (t)
时变时滞一致性协议为:
乙(t)=為 aj (Zj (t - j ⑴)- Zi (t - j (t))) (11)
j ■ N i (t )
其中:■ j (t)为时变时滞,其"(t)—曲)。
4.一致性问题的研究应用进展
目前,一致性问题的研究发展迅速,国内外学者研究了一致性问题在具体应 用中的性质,取得了一定的成果。在这里简要介绍在蜂涌问题、聚集问题和编队 控制中的研究成果。
4.1蜂涌问题
在一个多智能体系统中,所有的智能体最终能够达到速度矢量相等,相互间 的距离稳定称为蜂涌问题。蜂涌行为可以认为是群集的一种特殊情况。Reynoldd5] 于1987年提出了关于
蜂涌运动的基本模型---Boid模型。该模型包含了三条启 发 式规则,用于描述单智能体如何依赖群中其他智能体的速度和距离而运动: a)
分离性,各成员之间避免碰撞;b)内聚性,各成员朝着一个平均的位置进行聚合; c)排列性,各成员沿着一个平均的方向共同运动,尽量与邻居范围内的群体成员 保持速度匹配。
Vick等人⑹于1995年从统计力学的角度提出了 Vick模型,该模型中智
能体的方向是其邻域内智能体方向值的平均值。 Jadbabaie等人⑺将Vick模型
进行了理论证明分析, 证明了最近邻法则能够让所有的智能体能最终向相同的方 向移动并趋于一致。
Olfati — SabeP给出了设计和分析分布式蜂涌协议的理论框架,证明群体的 迁移行为可用对等的智能体网络来表示,还给出群的 Lyap u nov稳定性分析。
Su等人[9]重新研究了在缺少以上两个关键假设情况下多智能体蜂拥的问题。 作者对 Olfati-Saber 的算法进行了改进,实现了对虚拟领航者的渐近跟踪,给出 了收敛的速度, 所有智能体的中心位置和速度将指数收敛到虚拟领航者的中心位 置和速度。
4.2聚集问题
Ando 提出了一种用于向单点运动、有限视力的自治移动机器人的聚集的分 布式协议。 Ando 的算法要求所有机器人相互之间能全局通信,这种要求过高, 机器人的通信负担也很重。
Lin 等[10,11]研究了自治的移动智能体编队时聚集在一点的一致性问题,提出 了三种编队协议以及聚集的必要条件, 通过分布式控制, 使得一群自治的移动智 能体获取特定的编队, 并聚集到一点。 作者还研究了编队过程中碰撞发生、 队形 进化的问题。
Fan g12]设计了一种新分布式移动协议,使得所有的智能体在局部通信的情 况下,在给定的感应范围内聚集。 Con tem[13]提出了一种新的用于保证聚集的分
布式协议充分条件, 提出的条件要比之前相关的文献都宽松些, 尤其是提出了用 于代替连续情况的不连续点的协议所需较为宽松的条件。
4.3编队控制
多平台编队控制是一致性策略应用的典型领域之一,文献 [14]设计了编队控 制律,用来保持空间飞行器高度一致;文献 [15]考虑输入约束情况下,采用了非 线性无中心一致性协议研究了无人机编队中高度保持问题。此外,文献 [16]采用 一致性策略分析了轮式小车追捕问题中的编队稳定性, 并且认为该问题可以看作 是连续时间系统线性一致性问题的特例。 在网络条件下, 引入随机通信噪声和信 息丢包问题,文献 [17]采用一致性策略研究了基于信息交换的多边形编队控制方 法。文献 [18]给出了分析一致性和编队稳定性的基本框架,并基于此框架解决了
单积分器和广义动力学模型的编队变换问题。
5.结束语
多智能体系统协调合作控制中的一致性问题研究需要以图论、 矩阵论、控制 论、人工智能为理论依据, 以一致性协议为主要的研究对象, 要求一致性协议在 满足实时性、 鲁棒性的同时又能使系统体现智能性。 未来研究的内容可集中在以 下几个方面:
(1)在不对称时变时滞环境下保持收敛和稳定的一致性协议,并能应用到智 能群体成员之间
共同作用、协调运作的群集运动控制问题中。