【编者按】本文来自知社学术圈士奇。
美国时间1月27日,Facebook与Google两家之间玩了一场没有硝烟的战争。在相隔不到几个小时的时间里,双方先后公布了自家人工智能技术(AI)在围棋软件上的进展与水平。如此紧张的撕咬,恐怕并非巧合。我们来看看到底谁家的人工智能更强一些......
脸书的声音
周三早上,Facebook创始人扎克伯格在自己的脸书上敲了这么一段:“……科学家们已经花了20年教电脑兄下围棋,现在我们马上要实现啦 (We’re getting close)。在过去半年里,我们所创造的AI只用0.1秒就走一步,效果与以前那些几年才设计出来的系统一样好……”
背后的故事
Facebook去年11月就在International Conference on Learning Representations (ICLR) 上发表了论文《Better Computer Go Player with Neural Network and Long-term Prediction》作者为Yuandong Tian和Yan Zhu两名华人。论文介绍了代号为黑暗森林的围棋人工智能系统。几乎在扎克伯格发布消息的同一时间,Facebook人工智能研发中心发表了该论文的更新版,中心负责人Yann LeCun也在Facebook上作了相关介绍。
该项目独立带头人Yuandong Tian表示:“围棋中极多的分支因子使得传统的搜索技术难有建树,即使在尖端硬件平台上运行也非常乏力。如果换了黑白方,围棋的评估体系也会有很大变化。”
(Facebook围棋程序已达业余五段水平)
这一次,他们在新版本系统黑暗森林2上面加入了蒙特卡洛树搜索,与之前的卷积神经网络相结合后,性能有了进一步提升。对战人类棋手时,黑暗森林2可以达到业余三段水平;通过7.5万次运行后,则可以在KGS服务器上稳定保持在业余五段水平。
谷歌的声音
同一天,Google在官方博客中表示:“……我们很骄傲地公告天下,我们的科学家已经搞定了围棋,并攻克了人工智能领域的一项重大挑战 (achieved one of the grand challenges of AI)……”
两边的开场白都从介绍中国古代这项头脑竞技开始,Google甚至还提到了孔子和四艺。不过就后面的用词来看,Google的技术似乎更胜一筹。
背后的故事
Google的围棋论文可谓来得早不如来得巧。
同样在1月27日,DeepMind团队发表的《Mastering the game of Go with deep neural networks and tree search》作为Nature封面论文上线。
DeepMind是一个位于伦敦的人工智能团队,2014年其公司被Google以4亿英镑的价格收购。团队创始人Demis Hassabis在周三发表的官方博客中表示,他们开发的围棋程序AlphaGo融合了高级树状查找和深度神经网络。通过对神经网络进行的3000万步训练 (所有棋谱均来自人类专业棋手的比赛),AlphaGo预测出人类对手下一步走法的正确率已经达到了57%,之前的纪录是44%。
(AlphaGo 5-0 击败樊麾)
谈到围棋战绩,Google明显应该更骄傲一些。AlphaGo在2015年10月5日以五连胜的成绩击败了欧洲围棋冠军樊麾。这次对决完全符合比赛规则,没有任何让棋设定。今年三月,AlphaGo将对阵世界顶尖棋手——韩国“飞禽岛少年”李世乭。让我们拭目以待。
(韩国棋手李世乭)
樊麾,2013-2015年三度欧洲围棋冠军
在中国,围棋不仅是一项比赛,它还是生活的一面镜子。我们说,假如你的棋下得有问题,那很可能是你心性的问题——棋如其人。
输棋确实很难过。和AlphaGo对战之前,我觉得我能赢。在第一局失利后,我改变了战术,增强了进攻,但还是输了。问题是人类有时会犯致命的错误,因为我们是人。有时我们会疲惫,有时我们求胜心切,我们总有这样那样的压力。电脑程序不会这样,它非常强,也非常稳定,简直就像一堵墙一样。对我来说这是很大的差别。我知道AlphaGo是个电脑,但如果没人告诉的话,我可能会觉得它是个有点陌生却又非常强大的对手,是个真人。
当然,输掉比赛让我不太开心,不过作为职业选手,我们输过很多比赛。所以,失败了就从中学习,也许会有所收获。总之从长远来讲这是一件好事。
Toby Manning,英国围棋协会司库,樊麾人机对战的裁判
围棋玩家都知道,人工智能尚未解决围棋这个问题。所以我想人们会希望见到电脑达到人类专业水平,但我觉得这可能还要10年的时间。在这次比赛中,我本来是看好樊麾的。
很神奇的是,在比赛过程中你很难分辨谁是人类,谁是电脑。在很多围棋软件的比赛中,你可以看到很多合理的棋路,然后电脑还是会瞬间崩盘。但这次不一样,你真的很难分辨谁是谁。
AlphaGo与人类不同的一大特点是掌控时间的方式,樊麾下棋所用的时间比电脑要长。AlphaGo的路数看起来并不像人类那样具有侵略性。它会平静地布局,而非发起进攻或试图吃掉一片棋子。
我认为围棋界的主要反应会是,就像IBM的深蓝获得国际象棋大师地位后一样,人们希望自己能够掌控软件,并在自己的比赛中弥补自己的不足。
Hajin Lee,国际围棋联合会秘书长
当我知道那个电脑要挑战职业顶尖棋手李世乭的时候,真的很吃惊。我当时觉得这个挑战者绝对对顶级选手有多强完全没概念。但实际上,可能我才是那个不知道这个电脑有多强的人。现在我对这个比赛非常兴奋。
谁会赢呢?我不知道。李世乭自己也觉得可能那电脑跟他一样强。可能是我听到了太多AlphaGo的消息,我现在惊讶于它的强大。同时我也非常了解李世乭的水平,所以我认为他们双方五五开吧。
我觉得围棋是个很有内涵的竞技,我不觉得如果电脑AI击败了人类会对围棋造成什么伤害。我想人们会接受自己被电脑技术超越这件事。
Jonathan Schaeffer,阿尔伯塔大学计算机科学家,Chinook设计师
我想这还不是围棋版的深蓝时刻。真正的成就是这个程序能作为选手在顶级比赛中较量的时候。深蓝从1989年开始就常常战胜各路大师,最后登顶则是八年之后的事情。但就目前情况来看,我认为AlphaGo和顶级人类选手之间的差距被大大缩短了。可能只需要再进行一点努力和改善,再提高一点计算能力,不出一两年,它就能打败人类。
就今年3月份的比赛来说,不是打击AlphaGo团队,我还是看好人类。我们可以把AlphaGo看成是少年天才。它突然学了一手好棋,进步神速,但毕竟还是经验有限。从国际象棋和西洋跳棋来看,经验还是很重要的。
Demis Hassabis,DeepMind创始人
AlphaGo正在突飞猛进,甚至会超越最棒的人类选手。能够看它在围棋规则内去创造新的东西,感觉很神奇。我们对自己创造的这个系统有种很密切的感情,特别是它被创造的方式——它会学习,我们也会教它,它的风格就像人一样。和其他编出来的程序不同,你不知道它到底都会什么,因为它能够自己学习。
用Facebook人工智能研究中心Yuandong Tian的话说,两家公司确实存在着某种“友好”的竞争。是呀,这样两家公司之间的较量一定是件好事。脑海里不禁想起了去年Google Chrome团队送给Microsoft Edge团队的那个大蛋糕,不知道这一次是谁送给谁呢?
参考文献
1. Nature doi:10.1038/nature.2016.19255
2. http://120.52.73.78/arxiv.org/pdf/1511.06410.pdf
3. Googleblog、Facebook、 Wired
【作者介绍】知社学术圈,由清华教授发起的海归学者发起的公益学术交流平台,旨在分享学术信息,整合学术资源,加强学术交流,促进学术进步。
作者文章推荐阅读: