机器博弈研究面临的各种挑战
徐心和,邓志立,王骄,徐长明,刘纪红,马宗民
(东北大学信息学院机器博弈研究室,沈阳110004)
xuxinhe@
摘要:让计算机学会下棋打牌,尤其要和人类的精英对决,这是机器博弈领域长期的奋斗目
标,也是人工智能学科极富挑战性的研究课题。为了能够在这一新兴的研究领域取得更快更
多突破性进展,有力发挥机器博弈的“果蝇”作用,需要很好地明确机器博弈研究当前面临
哪些挑战性问题。本文从学术观念、实战博弈、理论发展、军事应用、国际接轨、普及提高
及学生创新性培养等多角度阐述了当前在机器博弈领域急需解决的主要问题,期望有更多的
青年学者能够投身到这一极富挑战性的研究领域。
关键词:机器博弈人工智能博弈论事件对策兵棋推演果蝇
VariousChallengingIssuesFacedto
ComputerGameRearch
XUXinhe,DENGZhili,WANGJiao,XUChangming,LIUJihong,MAZongmin
(ComputerGameGroup,InstituteofInformationScienceandEngineering
NortheasternUniversity,Shenyang110004,China.)
xuxinhe@
Abstract:Alongtermgoalofcomputergamesistomakecomputerplayboardandcardgames,
rtofastenthedevelopmentofthenew
rearchdomainwithbreakthroughresultsanddrosophilaeffectsinartificialintelligence,itis
necessaper
describesthekeyimportantproblemsinacademicconcept,realgames,theoreticdevelopment,
militaryapplication,internationalcompetition,popularizationandelevation,cultivatingthe
creativityofstudentsandsoon,whichcomputergamehastosolve,inordertocallmoreandmore
pioneerstojointhechallengingfields.
Keywords:ComputerGameArtificialIntelligenceGameTheoryEventGameTheoryWar
GamingDrosophila
1.引言
ComputerGame(CG)的中文内容十分丰富。计算机游戏,这是最为直白的翻译,也是
当今最为流行和普及的软件成果,是发展前景远大的软件产业。计算机游戏可以称为CG的
“广义”翻译。在计算机出现之初,人们提出“ComputerGame”就是让计算机下棋,下国
际跳棋、国际象棋,设法学习人的思维模式,努力让计算机具备人一样的博弈能力。对于这
种“狭义”的理解,在中文中便翻译为机器博弈。本文便是从“狭义”的角度探讨问题。
机器博弈是人工智能学科和计算机学科的研究方向之一。自从计算机诞生以来,许多著
1
名学者都曾经涉足这一领域的研究工作。计算机之父冯·诺依曼(WonNeunann)就提出了
用于博弈的极大极小定理[1],信息论的创始人香浓(n)教授,又给出了极
大极小算法[2],著名的计算机学家阿兰·图灵()也曾做过机器博弈的研究[3]。伴
随着计算机硬件的飞速发展,α-β剪枝算法的提出[4]、极小树的证明[5]、负极大值算法的
给出[5]、迭代深化思想的实现[6],都使得机器博弈有了长足进展。以IBM“深蓝”为代表的
划时代成果,表明计算机的弈棋能力已经可以和人类精英较量。如今,机器博弈已经成为一
个独立而重要、颇有发展前途的学术研究领域,但是它在中国的发展还很落后。
可喜的是,机器博弈在中国已经起步,并初具规模。象棋、围棋、六子棋等棋类开发队
伍在不断壮大,国内外的比赛也引起了社会的关注。但是人们经常关注的问题还是参加哪个
比赛项目,能不能够拿到奖牌,计算机又能挑战哪一级的棋手。人们看到的也常常是失败和
胜利,却不太注意机器博弈自身还有许多更深的内涵,还面临多方面的严峻挑战。
于是机器博弈通常只被看作是一种科技活动,而常常被学术界所忽视,也正是由于缺少
学术研究的有力支持,才使得这一方向的发展比较缓慢,尤其是在中国内陆。机器博弈作为
计算机学科的一个分支,在吸收其他学科的成果方面明显不够,如对策论、系统论、控制论
等。作为人工智能学科的“果蝇”,机器博弈由于缺少计算机学科的有力支持,其研究成果
也只能作为初级的游戏产品。本文则是要剖析机器博弈中的学科问题和科学技术问题,从学
术观念、实战博弈、理论发展、军事应用、国际接轨、普及提高及学生创新性培养等多角度
阐述当前在机器博弈领域急需解决的主要问题,期望有更多的青年学者能够投身到这一极富
挑战性的研究领域。
2.学术观念的分歧
机器博弈在中国大陆没有受到应有关注的原因比较复杂。其中重要一点便是它属于“游
戏”的范畴,好像只能是软件开发商经营的业务,而不是高等院校与研究院所涉足的领地。
认为:“不就是下下棋吗?”,“简单”,“玩玩而已”,没有多大的学问,因此不屑一顾,导致
在人工智能这一重要的研究方向上与国外拉开了很大的距离。
对比之下,让机器人踢足球,名为游戏,实为小型高科技对抗平台。许多机器人研究
的权威机构,不也就是要让机器人“站立、行走、跑步”,如果能让双足机器人跳起来,那
就是了不起的成就了。另外,研究运筹学的,不就是研究“旅行商问题”,“背包问题”,n
个机床m种产品的调度问题等。其实许多基础性的研究工作就是应该从这些“简单”的问
题和典型的范例入手,这样的成果才能有很强的泛化能力。
机器博弈丰富的学术内涵与理论价值在后面还要阐述,而机器博弈的实现难度却是毋
庸置疑的。下棋是硬碰硬的较量,行就是行,不行就是不行,非常实际,来不得什么假设和
宽容,很难搞些华而不实的花架子,也不是几条仿真曲线就可以交差的。因此,机器博弈才
是对学术、技术和能力的综合考验。
3.计算机棋类博弈分析
尽管目前有的棋类的计算机水平已经高出了人类大师,如国际象棋,但是计算机间的
较量仍然持续不断,各种人机大战也接二连三。因为计算机的智能也需要不断地提高。而那
些水平还不高的计算机博弈项目,如中国象棋、日本将棋和围棋,更是倍受人们的青睐。
计算机棋类博弈基本属于完全信息的动态博弈。也就是对弈双方不仅清楚当前的局面,
了解对手以往的着数,而且了解对手接下来可能采取的着数。尽管双方可能采取的着法数以
十计、百计,但毕竟还是有限的。计算机可以通过展开一颗根在上、叶在下的庞大的博弈树,
2
描述这一对弈过程。再利用自身在时间和空间上的强大能力,进行巧妙的搜索,从而找到可
行解及近优解,亦即给出当前的着法。
显然,计算机的搜索能力是计算机智力水平的重要体现。其实,人类在求解各种问题
的时候,解析求解还是次要的。人们大量采用的方法,人类智能的体现,主要也是在头脑里
搜索。脑袋转的快、主意多,智商就高。
机器博弈软件的设计,首先遇到的难题便是数据结构的选择。其中包括棋盘、棋子、
棋局和着法的编码与存储。良好的数据结构可以节省大量的存储空间,可以提高存取的效率。
为了适应博弈树的展开与搜索,常常还要同时给出棋局的多种数据格式。如棋局状态、棋子
位置、比特棋局和比特向量,还要用到哈希变换和哈希表等。
棋局的静态评估是机器博弈的另一个难点,它不仅需要棋类对弈的基本知识,而且用到
直接量化、模式量化、随机评估、模糊评估等一系列手段。对于象棋可以给每个棋子和棋位
打分,而对于围棋则要进行定式的抽取和模式的匹配。棋类博弈的高手主要应在这方面提供
更多的专业知识。
搜索算法是机器“思维”的核心。包括着法生成,博弈树展开,各种剪枝搜索和各种启
发式搜索。现有的成果非常丰富,也是今后研究工作的重点。
编程语言、程序设计方法、软件工程、并行计算等都是算法实现的重要技术,需要和博
弈原理有机结合,才能编写出高水平的博弈软件[7]。
4.计算机牌类博弈分析
众所周知,棋类游戏和牌类游戏有很大不同。棋类游戏属于完备信息博弈,游戏双方
清楚知道当前对弈的所有情况,包括自己有多少子力,对手有多少子力,可能有哪些着法,
通过构造博弈树,利用计算机非凡的计算能力和巧妙的搜索算法,就容易看到若干步以后的
局面,从而选出近乎高手的着法。
但是对于牌类博弈来说,存在太多的不完备信息和不确定性因素。牌类游戏的多数重
要信息都是隐藏的。每个玩家只能看到其中的一部分,他们必须通过观察其他玩家的行为,
把各种信息拼在一起,才能获得更多信息。因为比赛的这种不确定性,必将导致近于无穷种
态势的可能。另外牌类比赛在很多情况下并没有所谓的“最佳着法”,因此博弈树型的建模方
法对于牌类机器博弈并不适用。
以扑克为例,顶级的扑克选手会在比赛中察言观色,并根据对手的反应调整自己的策
略。但是计算机不可能做到这一点,它们只会按照一定的程序出牌。虽然计算机无法像人那
样去观察对手的一举一动从而做出判断,但它却能记录下对手的比赛套路和方法,通过统计
其出牌和不出牌的次数为比赛积累经验。显然,尽早绘制出对手比赛套路是取胜的关键。
因此,牌类博弈的关键技术在于统计建模、模式识别和机器学习。既要以大量高手的
出牌规律作为基础知识,又要及时“绘制”当前对手比赛的套路。显然这不是一般简单智能
所能处理的事务。
值得提及的是在机器博弈方面世界领先的加拿大艾伯塔大学(rta)设计的
扑克程序在与知名扑克玩家菲尔·拉克的对弈中(2007.7.22-24)虽然未能取胜,但对手也
不得不承认,和电脑的比赛比他职业生涯中此前任何一场都要绞尽脑汁,“电脑现在就如此
先进,未来将越来越难战胜。”[8]
5.机器博弈的理论提升——对于博弈论的挑战
通过以上的分析,不难看出机器博弈是一类实践性很强的计算机应用技术的综合。那么
3
如果要在理论上加以提升,机器博弈应该具有什么样的理论体系呢?
机器博弈既然属于博弈的范畴,必然应该和博弈论具有一些内在的联系。博弈论(Game
Theory)又称对策论,游戏论,其概念的引出曾提及象棋的博弈。然而纵观博弈论的理论成
果,却没有切实可行的方法能够真正用到象棋博弈之中。
以纳什均衡为代表的博弈论应该属于数学的范畴,是运筹学的一个分支。相关理论都是
通过解析的办法对问题进行求解。根据特定问题的类型,如囚徒困境、智猪博弈、海边摊位、
性别战等建立相应的数学模型,一般以双值矩阵给出收益函数。由于博弈双方都是“理性的”,
都能够解算出对于自己最为有利的解(策略、行动),双方能够取得“一致预测”,于是便存
在了双方都不愿意破坏的“纳什均衡”。“理性—共识—均衡”便成为博弈论处理问题的基本
模式[9]。
对于一大批经济学中的完全信息的静态博弈问题,纳什均衡被证明是有效的。对于不完
全信息的静态博弈问题,对于完全(不完全)信息的动态博弈问题也都存在贝叶斯均衡或子
博弈精炼纳什(贝叶斯)均衡。应用上述理论,一系列经济学问题得到了很好的解决。于是
博弈论已经成为现代经济学的重要组成部分[10]。
棋类游戏都属于动态博弈问题。由于一场对弈的回合都要数以十计,每个回合各方的策
略选择也都数以十计,在如此庞大的博弈树中,即使只考虑有限的几个回合,理性的博弈者
也难建立起“一致预测”并取得共识,更何况事实存在的理性和信息的不对称性。于是,我
们有理由对纳什均衡的普遍性提出怀疑。
显然,博弈论的解析方法无法求解棋牌游戏问题,而机器博弈的成果又在棋类游戏中取
得令人瞩目的成就。这时不由得使人联想起数学分析和数值分析的相互关系。以复杂函数的
积分问题为例。用数学分析的方法大多数函数是给不出积分的(解析)解的,但是应用数值
分析的方法,好像就很少找到不能求出积分值的函数来。
因此可以说,博弈论像数学分析一样是用解析方法求解问题,而机器博弈却像数值分析
一样是以计算机为手段的用数值方法求解问题。两者相辅相成,必然在博弈问题的分析与求
解上开拓出广阔的天地。
事件对策论便是根据博弈论的框架,从离散事件动态系统的角度为机器博弈建立起的形
式化描述[11]。而事件对策问题的求解则必然依靠机器博弈的方式[12]。因此建立《机器博弈
学》,开展事件对策论、机器博弈原理与方法学的研究都是很有意义的研究方向。
现实生活中的动态博弈问题都是非常复杂的。既有时间驱动的连续对策问题,又包含由
事件驱动的离散对策问题。这种混杂对策问题的求解必然呼唤能够将微分对策论与事件对策
论有机结合起来的混杂对策理论的创立[13]。
6.机器博弈的军事应用——兵棋推演
机器博弈最直接的应用应该是在作战模拟领域。因为象棋、围棋都是从两军对阵中抽象
出来的智力游戏,都可以在两军对垒和作战形式上找到相互对应的模式与范例。如兵种的设
计与配合、消灭有生力量、围而攻之夺取地盘等。尽管战争的问题比棋类游戏远远复杂,但
在战略战术思想上还是具有很多的雷同。既然机器博弈系统已经可以和人类的精英进行较
量,那为什么不能将计算机快速而缜密的逻辑思维能力应用到作战模拟当中?
部队的指挥机关在谋划一场战役(斗)之前总是要详细分析双方的兵力部署、战场的自
然环境、对方的可能调动、以及大量难以预见的事件、战斗与结果。早期的战事谋划是在物
理模型上进行的,称之为沙盘推演。近代的战事谋划,包括日军袭击珍珠港,联合国军诺曼
底登陆,美军的海湾战争等都是事先进行过周密的“兵棋推演”(Wargaming,Warsimulation),
以便做到“不打无准备之仗”。二战退役的老兵还专门开发了一种游戏,称之为“兵棋”[14]。
4
现代的兵棋推演已经不是在沙盘和地图上进行,已经实现了数字化,参谋人员可以在计
算机上输入各种兵力的部署与调动,适时做出战斗的决策,并由计算机裁决战斗的结果和给
出形象的显示。
在兵棋推演数字化的情况下,兵棋推演的智能化便是必然的发展趋势。如何实现兵棋推
演的智能化?如何研制无人作战飞机的联合作战策略?如何在未来的无人作战部队中实现
自动指挥与配合?机器博弈的成果必然能够成为诸多关键技术的核心,因为它是人工智能的
高级体现[15]。
7.机器博弈——人工智能学科的“果蝇”
果蝇——水果摊边那些飞来飞去、只有约3毫米长的红眼小“苍蝇”,由于它能在两周左
右的时间繁衍一代,被遗传学家视为最理想的遗传学研究的载体。将果蝇关在牛奶瓶子里,
给些香蕉之类的水果,他们便能“代代相传”。当年摩尔根和他的学生们十年如一日,先后
发现“伴性遗传”、基因重组等现象,确定了基因在染色体上,做出果蝇的第一张染色体图,
使得经典遗传学进入顶峰时期。1933年摩尔根获得了诺贝尔生理学和医学奖[16]。
那么什么是人工智能学科的果蝇——理想的研究载体?应该看到,机器博弈是既简单
方便、经济实用,又丰富内涵、变化无穷的思维逻辑的研究载体。个把小时就可以下一盘棋,
就可以对电脑的“智能”进行测试,而且可以悔棋、重试、复盘,可以一步步地发现电脑与
人脑功能的差距,从而不断提高电脑的智力水平。
¾如何将丰富的残局棋谱,经过抽象与提炼放到博弈程序当中,这是知识工程的典
型课题;
¾如何通过某个象棋大师的大量棋谱,自动归纳这位大师的下棋风格与特点,长项
与弱项。这是知识挖掘的典型课题;
¾如何剖析一盘棋的胜败过程与原因,进而自动修改博弈程序,这是机器学习的典
型例题;
¾如何将围棋的各种定式进行表示和分辨,这是模式识别的典型问题;
¾在模型修改过程中,有数不清的优化计算和进化过程,这又是各种智能算法的用
武之地;
¾如何辅导一个初学者一步步地提高棋艺,切中要害地发现问题,这更是智能教育
的最好课题。
正如人们常说的那样,“人生如棋,世事如棋”,如果能够掌握下棋的本质,也许就掌握
了人类智能行为的核心。
著名数学家、博弈论创始人冯·诺伊曼认为,如果人们想找一种可以解释日常生活的
理论,就必须从解释扑克游戏的理论开始——即博弈论。“现实生活中充满了虚张声势和迷
惑他人的小把戏,而且人们也经常揣摩其他人如何考虑自己的意图。”在扑克游戏中,人工
智能研究人员目前面临的挑战与冯·诺伊曼在80年前所遇到的挑战一样,即如何理解那些
骗人的诡计。这一点得到了强大的计算机程序SparBot的证实——它击败了大多数登陆加拿
大艾伯塔网站想要一试身手的人[17]。
一提到人工智能的研究载体,人们首先想到的就是机器人。然而构造一个机器人,让
机器人完成一次试验,又是何等复杂和消耗巨大的事情。
就像在自动控制系统中,只有构成了计算机的闭环控制,才能谈得上各种先进控制,
如最优控制、自适应控制、鲁棒控制、变结构控制等。在机器智能领域,也只有建立了良好
的计算机博弈系统,才能作为研究和实现高级智能的平台,才能成为人工智能研究的果蝇。
5
8.机器博弈的国际接轨
棋牌类游戏深受群众欢迎,但又有很大的地域局限性,不同的民族、地域有着不同的棋
牌游戏,同一种棋牌游戏也会因地而异。就像中国象棋和韩国象棋,棋盘和棋子一样,但是
下法不同,胜负规则都有很大的区别。
在中国,象棋、麻将十分普及,可谓玩家最多的棋牌游戏之一,但在国际上并不普及。
目前真正全球化的棋牌游戏种类有限:国际象棋(Chess),围棋(I-Go),五子棋(Gobang,
Renju)和桥牌(Bridge)。尽管在国际机器博弈协会(ICGA-InternationalComputerGame
Association)[18]组织的计算机(棋类)奥林匹克大赛(CO-ComputerOlympiad)包括有中
国象棋,但参与者还都是华人。棋子上的汉字本身便将外国人拒之门外。
世界计算机国际象棋冠军赛(WorldComputer-ChessChampionship)历史长久,每年都
在高水平地进行。我们已经难有进入的可能。五子棋因为已经“宣布”被电脑“求解”出来
了,先手必胜,近年已经不再组织电脑的比赛。这样我们与国际接轨的最好途径便在围棋和
桥牌。后者由于属于非完整信息的动态博弈,难度更大。于是,当前我们的前沿阵地便是围
棋和9路围棋(9*9的围棋)。
针对五子棋的退出,台湾交通大学吴毅成教授发明了六子棋(Connect6),目前被认为
是最为公平的棋类[19],正从台湾向大陆和全球推开,这也确实为我们的国际竞争提供了新
的领地。
其实,在ICGA组织的CO大赛的二三十种棋类比赛中,多数还是属于一些民间棋类,规
则并不复杂,参赛队也不多,进入不太困难,争雄也有希望。比如今年在阿姆斯特丹举行的
13th-CO大赛上,就有一些小棋种只有两三个队参赛:Amazons(2队)、Backgammon(3队)、
PhantomGo(2队)、Surakarta(2队)[20]。
在国际赛场上和国际强手较量的另一种方式,就是将优秀的中国民间棋类经过提升后推
向世界,作为一种新的更富挑战性的项目进行比赛,就像吴毅成教授提出的六子棋一样。
9.机器博弈的普及与提高
各种竞赛活动是最能激发人们的创新精神的,因为胜利总是和创新结伴而行的。尽管目
前在国际和国内都有了相应的锦标赛,但是参加计算机棋类大赛,不用说是象棋和围棋,就
是编写五子棋和六子棋的博弈软件也是一项艰巨的软件工程。
为了搞好机器博弈相关知识与技术的普及,可以针对一些简单的民间棋类在青年学生中
开展培训和竞赛活动。比如开展牛角棋的编程培训,开展一字棋、二虎棋、三通棋、四季棋
的竞赛活动,确实受到学生的热烈欢迎[21]。
实践结果表明,学生们给出了各种各样的算法,激发了青年学生的创新热情,提高了学
生学习知识的积极性和运用知识的能力。机器博弈是一项很好的学生科技活动。我们应该在
全国高校中开展民间棋类的电脑博弈竞赛,就像电子大赛、数模大赛那样持久地开展下去。
然而面向机器博弈的普及与提高,我们还缺少合适的培训教材和自学教材,还缺少有针
对性的讲座和课程。这都是我们亟待解决的问题。
10.结语
如何在中国大地上将机器博弈的研究与活动蓬蓬勃勃地开展起来?正确的方针应该是:
以比赛引起公众的注意,调动青年的创新热情,以科学研究推动学科的发展,以丰富的研究
成果带动理论和应用的突破。
6
机器博弈可以有力地推动人工智能学科的发展,应该给与足够的重视,投入足够的人力
物力和财力,积极开展各式各样的机器博弈培训和竞赛活动,迎接ICGA即将在中国北京举
办的2008世界计算机国际象棋锦标赛,2008国际计算机(棋类)奥林匹克大赛和2008第
六届国际计算机博弈学术会议(2008.7.27-8.3)[22]。
参考文献
[1]冯·诺伊曼,摩根斯顿.博弈论与经济行为[M].王文玉,王宇译,生活·读书·新知三联
书店,2004.12(ofGamesandEconomic
tonUniversityPress,Princeton,1944.)
[2]Shannon,ClaudeE.,Programmingacomputerforplayingchess[J],PhilosophicalMagazine,
Vol.41:256-275,1950.
[3],editor,FatherthanThought,
,1953
[4],ly,Ananalysisofthealpha-betapruning
algorithm[D],DepartmentofComputerScienceReport,Caregie-MellonUniverisity,
Pittsburg,1973.
[5],Ananalyzeofalpha-betapruning[J],ArtificialIntelligence,Vol,6:
293-326,1975
[6]ivedeepening:cialIntelligence,
27(1):97-109,1985
[7]徐心和,王骄.中国象棋计算机博弈关键技术分析[J].小型微型计算机系统,
2006,27(6):961-969.
[8]
阿迪达斯搜狐体育:打扑克人脑险胜电脑.
/20070727/
[9]范如国,韩民春.博弈论[M].武汉:武汉大学出版社,2006.1.
[10]李光久.博弈论基础教程[M].北京:化学工业出版社,2005.
[11]徐心和,郑新颖.棋牌游戏与事件对策[J].控制与决策,Vol.22,No.7(2007.7):787-790.
[12]徐心和,王浩,孔凡禹.事件对策理论及在棋类游戏中的应用[C].2007年中国智能自
动化会议论文集:24-27,2007.8.,兰州,中南大学学报(增刊)(待发表)
[13]徐心和,施鸿雁.一个空战实例中的混合对策问题[C].2007中国控制与决策学术年会
论文集:913-916,2007.7.5-8,无锡
[14]杨南征.虚拟演兵——兵棋、作战模拟与仿真.北京:解放军出版社,2007.1
[15]徐心和,邓志立.基于机器博弈的作战模拟系统探讨[C].中国系统建模与仿真技术高
层论坛论文集:113-117,2006.11.21-22,北京
[16]南开大学军事教研室……科学思维方法-情报官世界(2004-4-24)
/cgi-new/violethtml/12/2004-04-24/
[17]中国脑力体育先锋网站:扑克牌里的博弈之道.
/?tid=645174
[18]ICGAhomepage:/icga/
[19]Wu,ng,H.-C.(2006).cal
report,DepartmentofComputerScienceandInformationEngineering,NationalChiaoTung
University,Hsinchu,Taiwan.
/~icwu/technical-reports/.
[20]ICGA赛:电脑棋类程序竞赛。/icga/?lang=4
[21]徐心和,徐长明,邓志立.积极开展计算机博弈的民间棋类活动[C].2007中国自动化
教育年会论文集:216-219,机械工业出版社(2007.8.17-20,西安)
[22]ICGAhomepage:
7
本文发布于:2022-11-25 10:25:03,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/90/17923.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |