1
围棋那些事
A:嘿少年,看什么术呢。
B:啊,你说这本啊。一本围棋入门书而已
A:哦,又是个受到alphaGO影响开始喜欢围棋的啊。
B:怎么,你也关注这个事了?
A:那可不,我对这件事可是相当了解的。
B:那正好,今天我们就给大家讲讲这些天热度非常高的alphaGO吧。
A:AlphaGo,也就是阿尔法围棋,其名中alpha是希腊字母中的“1”的意思,而“go”则
是围棋的英文叫法“thegameofgo”的最后一个单词。它是一款由英国伦敦谷歌公司旗下
DeepMind公司开发的围棋人工智能程序,由该公司的戴维•西尔弗、艾佳•黄和戴密•哈萨比
斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。
2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世
界围棋冠军、职业九段选手李世石,并以4:1的总比分获胜。
B:Ai的进步在这些年是显而易见的。而其中最让人好奇的就是这些ai的工作原理
如果要说到阿尔法围棋的主要工作原理是那就是“深度学习”。
“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作
为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大
脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行
精准复杂的处理,就像人们识别物体标注图片一样。
A:除此之外阿尔法围棋是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑的多
层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二
维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13
个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。这些
网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量
的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它
进化到更好。简单来说就是种可以自行寻找更优解的进化算法。
B::而刚才提到的“两个大脑”,分别是“落子选择器”和“棋局评估器”。阿尔法围棋的第
一个神经网络大脑又可以称为“监督学习的策略网络”,它观察棋盘布局企图找到最佳的下
一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高
的。这就是“落子选择器”的理解。
A:而他的第二大脑“棋局评估器”相对于落子选择器是回答另一个问题。它不是去猜测具
体下一步的情况,而是预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估
器”就是“价值网络”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但
对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决
定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅
读在这一条线上的任何更多落子,而这也就是所谓的大局观了。
B:然后呢,先让我们休息一下,之后让我们来上一点专业的的解释吧。
音乐
B:可以说,阿尔法围棋与前代的围棋差别就是多了这个神经网络、卷积积分的估值“大脑”。
2
A:这里,我们首先来介绍几个概念。图像梯度,matlab函数,普拉斯算子,以及我们大家
都学过的二阶导数。首先是图像梯度
图像梯度可以把图像看成二维离散函数,图像梯度其实就是这个二维离散函数的求导:
图像梯度:G(x,y)=dx(i,j)+dy(i,j);
dx(i,j)=I(i+1,j)-I(i,j);
dy(i,j)=I(i,j+1)-I(i,j);
其中,I是图像像素的值,(i,j)为像素的坐标。
图像梯度一般也可以用中值差分。
B:停停停,照你这样等直播结束了你都讲不完。还是我给通俗化翻译一下吧,阿尔法围棋
使用卷积积分平滑处理说白了就是怕梯度变化,怕“褶”,他利用算法就是要平滑处理掉这
些皱褶!来加速运算,模糊识别,所以它的“大局观”特别好,毕竟他的制作目的是要在职
业围棋比赛的规则下去战胜顶尖的围棋选手,必然需要改进算法来节省时间。以与樊麾的5
局胜棋和李世石的3前盘胜棋为例,为了规避海量的计算,阿尔法围棋就算用了上千个cpu,
gpu,也怕棋盘上黑白两色棋制造出复杂的拓扑结构,所以这8盘胜棋都是“高者在腹”,5
路肩冲,尽快跳入中腹把自己的棋成块,一切都是为了降低图形拓扑的复杂度!这样才能保
证更多的有效计算量。而依照这样的算法如果大约黑白不连贯的棋达到16块(因为电脑是
二进制,必然是2的幂次),就超出了阿尔法围棋的运算的能力了。当然,局部制造“褶”,
图像梯度变化剧烈的手段在与其的对抗中更有效。
A:所以你最后还是没有满足我上数学课的愿望!
B:你也不看看监督的脸色„„你如果真的这么播完我估计小编就该卷铺盖走人了。
A:简而言之,阿尔法围棋最成功的的地方就是这个对于大局观的算法处理,这算是彻底让
围棋人工智能的水平上升到了可以与职业选手相抗衡的地步,也远远地甩开了其他的围棋人
工智能。研究者让“阿尔法围棋”和其他的围棋人工智能机器人进行了较量,在总计495
局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵CrazyStone、Zen和Pachi三个先
进的人工智能机器人,胜率分别是77%、86%和99%。而在之后就是与樊麾和李世石的较量,
而这两场五番棋也分别以5:0和4:1以阿尔法围棋的胜利而告终。在围棋人工智能领域,实
现了一次史无前例的突破。计算机程序能在不让子的情况下,在完整的围棋竞技中击败专业
选手,这是第一次。
B:是啊,围棋在棋类中毕竟是非常特殊的一种。除了提子之外没有任何的特殊规则,是最
单纯的拓扑图形问题。也可以说是最考验算法优化的一种挑战。仅仅大于9阶的棋盘,如果
利用穷举法那么计算量就已经达到一个非常庞大的数量级,而每多一阶都是以几何式翻倍增
长,而围棋棋盘是一个19阶矩阵,利用矩阵知识就可以轻松理解其计算量之大,这也是围
棋智能的核心问题。相比于阿尔法围棋的注重于大局观,crazystone和zen就更注重于局部
的棋子死活,这是上一代的优势也是劣势。这也就体现了算法的改善在人工智能发展中的重
要性。
A:横向对比一下国际象棋,从最早的深蓝,到前两年掀起巨大波澜的stockfish,这也是算
法改进的体现。但是深蓝是利用并行计算机的庞大存储量来对棋局进行穷举,强行破解棋局,
加上国际象棋本身的一些缺陷,深蓝才获得了胜利。它虽然可以称得上是早期的人工智能代
表,但也是非常低端的人工智能。而相比而言,stockfish是一款可以安装在家庭电脑上的一
款软件,但是就这么一款软件。在2014年8月份击败了美籍日本国际象棋大师中村光。这
样的胜利,才可以说是具有意义的人工智能的胜利。
3
音乐
B:不过这些人工智能的发展并不会影响本身我们享受下棋的快乐。所以呢,接下来我们再
谈谈前两天这位虽败犹荣的棋手,李世石吧。李世石,韩国著名围棋棋手,世界顶级围棋棋
手,也为谷歌高级软件测试工程师,1983年3月2日生于韩国全罗南道,2006年3月12
日与女友金贤珍完婚,同年9月3号女儿李慧琳出世。1995年入段,1998年二段,1999年
三段,2003年因获LG杯冠军直接升为六段,2003年4月获得韩国最大棋战KT杯亚军,升
为七段,2003年7月获第16届富士通杯冠军后直接升为九段。2006、2007、2008韩国围
棋大奖——最优秀棋手大奖。李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主
动出击,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下
完成逆转。而这样的一位王者,自然也是有着自己的脾气。11岁那年,权甲龙道场和另外
一所道场对抗,按水平李世石可以当主将,但因为年纪小,权甲龙就把他排在了第四台。没
想到此举大大伤了小李世石的自尊心,比赛当天玩起了“失踪”。事后,权甲龙找到李世石
的父亲,逼着李世石回道场并写下悔过书,但直到现在,李世石仍然认为他是抗议老师的“偏
心”,他做得没错。除此之外,他青年时的拒绝参加段位赛迫使韩国方面专门修改升段规定
也是在棋届引起了轩然大波。抛开这些事,李世石的实力强劲确实是为众人所接受,这样桀
骜的性格更是为他的魅力更添一笔,很多棋迷都亲切称他为小李子。可见他在围棋界的人气
也是当红巨星啊。
A:是啊,当时第四场比赛看直播可真的是惊心动魄,最后赢了的时候的喜悦感也是让人激
动不已呢。
B:对于那场棋局,他本人也在赛后表示:这一胜对他来说太重要了,世上任何宝物,我都
不会用这一胜交换。
A:虽然当初开赛前他说着要5:0或4:1来着。
B:你这么揭底好么,毕竟1:4你上你不行。
A:好了好了,别找茬了。不过啊,你难道打算只介绍一下他就算完了?不是还有个焦点人
物么?
B:你说柯洁啊,嗯~我看你应该很了解吧,那你来介绍算了。
A:好那就我来介绍。柯洁,浙江丽水人,中国职业围棋九段。第二届梦百合杯世界围棋公
开赛冠军,曾获2007年全国少儿围棋锦标赛冠军,2008年世界青少年围棋少年组冠军,第
28届应氏杯世青赛围棋青年组冠军。2015年1月14日,在第二届百灵杯世界围棋公开赛
五番棋决赛中,以3-2的比分击败邱俊,夺得冠军,直升九段。2015年12月9日,在第20
届三星杯世界围棋公开赛三番棋决赛第二局比赛中,柯洁执白中盘击败时越,以2-0的比分
夺得三星杯冠军。2016年1月5日,第二届梦百合杯世界围棋公开赛五番棋决赛决胜局,
柯洁执黑粘劫收后半目险胜李世石,以总比分3比2击败对手,获得冠军。绝对可谓是英雄
出少年啊,虽然微博还要叫自己是“大棋渣”,你以为我会信么,我可是一个笔画都不会信
的!
B:你把最重要的一点忘了„„最重要的事就是,柯洁表示要主动挑战alphago了!他要主
动挑战alphago了!他要主动挑战alphago了!
A:重说三重说三重说三!也就是说很快我们就能看到柯洁与alphago的对弈了。希望大家
也是和我们一样都在期待呢。
4
音乐
B:人工智能的开发当然不仅仅限于是围棋界,deepmind公司打算也没闲下来。在围棋之后,
deepmind的公司的下一步考虑是要对alphago进行改进,而改进之后的成品叫做alphaSC,
其中的alpha的意思并没有变,而这个sc的意思嘛,其实是个相声场次,意思就是deepmind
接下来打算挑战的就是中国的相声,也许会和郭德纲同台竞技讲相声哦。
A:你这都口胡到哪里去了,不仅非要玩梗还偏要讲错的。Sc这两个字母呢其实是starcraft
的缩写,也就是暴雪旗下的著名rts游戏星际争霸。这不仅是在ai制作界掀起了轩然大波,
在游戏界更是众说纷纭。因为游戏本身的规则过于复杂,不仅拓扑图形的分析差别极大,而
且考虑到游戏内的极其考虑策略的状况,我觉得大家也就只好期待了,我们还是期望这个人
工智能回应大家的期待吧。
B:当然我还是想看相声。
A:你就不能收敛一点你的谐星本性,高数写完了么?线代都会做么?还不好好学习!
B:天网尚未诞生,臣无心学习。
A:天网,你又扯了个很沉重的话题呢。确实,每次提到人工智能,大家都是又喜又悲,因
为科学的进步而喜,又因为对于人类的自身危机感而悲伤。这个问题的深度确实是有些超越
我们正常生活的层次了呢。
B:人工智能的不断进步肯定是不可阻挡的,而这也将深刻的影响我们的世界。Alphago在
算法上的进步无疑是惊人的,这种深度学习的简易进化算法,已经开始表示着人工智能在一
定程度上具有了自我学习能力。比如alphago它现在每天可以学三万盘棋,每一层的规则都
是自己总结的。这在人工智能的发展之路上必定是一块里程碑一样的存在,其重要性也必然
是不言而喻的。
A:至少从我们自身的期望出发,我们自然是希望人工智能在不断的发展历程中一直与人类
友好合作,也许不久的将来,当人工智能真的具有了人类的一些特质后,我们也真的会有一
些网络上的真正的虚拟朋友呢。
B:毕竟我们从自身的角度思考大家还是会希望我们能一起和平共处,人类是人工智能的创
造者,所以我们更要对他们负责,我们不能因为某些悲观的言论就否定了人工智能的美好前
景,我们需要去为他们做好一切。
A:不论如何,我们还是要抱着宽容一切的善意去面对世间万物的。这也是扶持着我们一直
向前走的动力,我们相信人工智能在以后的日子里,一定会带给我们更多的惊喜。感谢编辑
张劭琛,程路遥以及播音我们下周一不见不散
本文发布于:2022-11-24 08:14:00,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/90/10516.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |