谷歌AlphaGo的胜利：不是计算机打败了人类，而是人类打败了人类

谷歌 AlphaGo 围棋人机大战

作者：高飞龙

2016/01/28 18:21

【编者按】作者北大软件与微电子研究院研究生毕业，围棋业余5段，现参与在线围棋教育开发项目。

谷歌AlphaGo的胜利：不是计算机打败了人类，而是人类打败了人类

“珍珠港遭到空袭！这不是演习！这不是演习！这不是演习！”
——2016年1月28日凌晨

从昨晚开始，一条声称某AI在19路棋盘上分先战胜樊麾二段，并且论文已登上Nature的消息刷爆了朋友圈。一开始，就像以往的那些“大新闻”一样，大家都认为是标题党，甚至某业余7段还查验到其论文尚未被Nature审核通过。

然而随着时间的推移，越来越多的近距离详细消息传来，开始有人相信消息的真实性。围棋圈内的各种微信群、朋友圈都在不断地争论，相信的人越来越多，不信的人也坚持己见。

终于，在接近凌晨两点，又一条最新报道来了，还附带着棋谱：《面对谷歌围棋AI，人类最后的智力骄傲即将崩塌……》（虽是真消息，但稍有标题党之嫌）至此，看到棋谱的所有人几乎都相信了：人工智能AlphaGo，实现了里程碑式的一步。

| 首先，在客观上要肯定AlphaGo实现的水平进步

附带着的棋谱：以往最强的围棋AI，大致是CrazyStone、Zen和银星围棋这几个。

而AlphaGo在让以上几个程序（无银星围棋）4子的情况下，取得了80%左右的胜率。我们据此基本可以判断，人工智能将自己的水平上限一下子提高了5个子。

樊麾二段，虽然以欧洲冠军闻名于世，但其实圈内谁都知道他是一名中国旅欧教学的职业棋手。

虽然远离东亚职业一线，但樊老师的水平仍然是不容置疑的，他依然有着职业的水平（虽然是较弱的职业），一般的业6仍然是比他不上的。

AlphaGo在正式比赛中对樊老师5：0（棋谱已可见），据说加上非正式比赛的总分为8：2（已确认），再加上棋谱里AlphaGo显示出的惊人的表现，我们可以认为，人工智能在围棋上的水平已经迈入了职业的大门。

（最新：据多位顶尖棋手对棋谱的鉴定，认为AlphaGo的水平应该在业余强6段到弱职业之间，离人类顶尖大概还有一先到两先的差距）

说的更明白点，之前的AI在蒙特卡洛算法的帮助下虽然取得了革命性的进步，战胜了绝大多数的人类，但人类中能战胜那些AI的人数可能仍然在近百万的级别。

而自今日（其实已经是三个月前了）的AlphaGo起，能在围棋盘上战胜AI的人类人数可能已经不到千人了。

按照Facebook人工智能研究院的田渊栋老师的说法，这个消息在相关研究圈内应该早就不是新闻了。

甚至回想一下昨天扎克伯格在facebook上突然发声支持自己的研究团队，也因为是知道了google团队的成果即将在一日内公示，所以想要抢占一个在舆论的位置。

（田老师参与的facebook的研究团队，是google现在最大的竞争对手，田老师他们使用的方法应该不太一样，虽然他们暂时落后，但我同样也很期待他们的下一步进展）

总之，从事实看来，这不是演习已经是显而易见的事实。

接下来谈点个人对人工智能的粗浅理解。

| 蒙特卡洛算法之后，我看到了新的天地

近些年来，尽管在蒙特卡洛算法的帮助下，AI实现了革命性的进步，达到了能战胜大部分人类的水平（中等业余5段），但随着摩尔定律的走向终点，计算机硬件的发展速度在旧有的道路上暂时无法按以前的速度爆炸发展下去，大家都认为仅凭蒙特卡洛算法是无法帮助AI战胜人类的。

依据个人的理解，我曾将围棋的思维过程分解为四步的演进：常识→棋感→计算→判断。

大约一年前，我曾和李喆七段就此问题进行过简单讨论，当时我认为蒙特卡洛算法的成功主要在于为人工智能建立了“棋感”，而以往的人工智能只能在“常识”和“计算”具有天然优势。

在蒙特卡洛算法之前，虽然计算机凭借强大的计算力可以积累大量“常识”，但由于“棋感”的缺失，人工智能无法对计算方向进行有效的筛选，最终就不免沦于蛮力搜索。

而蛮力搜索虽然可以在一定程度上实现高水平的“计算”，甚至很多其他棋类都在这一环节上被人工智能打败，而由于围棋的过度复杂和摩尔定律结束对计算机发展前景的限制，走到这一步仍然无法让人工智能战胜人类。

谷歌AlphaGo的胜利：不是计算机打败了人类，而是人类打败了人类

（注：上图为计算机眼中的国际象棋落子思路，而下图为计算机眼中的围棋落子思路，来自谷歌deepmind官网AlphaGo | Google DeepMind）

谷歌AlphaGo的胜利：不是计算机打败了人类，而是人类打败了人类

而蒙特卡洛算法出现后，凭借大量储备的棋局，通过胜负概率来判断下一步着点以作为计算方向，极大的提高的计算的效率，所以AI的水平才实现了革命性的进步。

而这次的AlphaGo，使用了深度神经网络与蒙特卡洛树状搜索相结合的方法。

依据已经能看到的Nature上的论文（可见雷锋网文章：《Google人工智能击败欧洲围棋冠军， AlphaGo 究竟是怎么做到的？》），研究者们在AlphaGo中加入了两个深度神经网络，以value networks来评估大量的选点，而以policy networks来选择落子，并且开发了一种新式算法来结合蒙特卡洛算法和以上两个神经网络。

谷歌AlphaGo的胜利：不是计算机打败了人类，而是人类打败了人类

（注：上图为AlphaGo使用的神经网络结构示意图，来自原论文）

在这种结合下，研究者们结合参考人类职业对局的监督式学习，和AI大量积累自对弈实现的深度学习，来训练和提高AI的围棋实力。

在蒙特卡洛算法之后，我看到了新的天地。这种结合以及新式的思路，让人感到前景无限。

最后谈一谈，我认为我们应该保有的态度。

| 如何面对人工智能？

这里，我首先想引用李喆七段在今天早上说的话：

“我们已来到两个时代的连接处，无论你是否愿意，这都是一个需要接受的事实。工具无善恶，善恶在人心。未来的路通往何方，将由我们自己决定。”

从凌晨到早上，朋友圈里的评论区一直争论不休，甚至某世界冠军一直在说“不信”，毕竟大家在没有看到板上的钉子之前，从情感上都是不愿意相信的。直到另外两位一线棋手告诉他，已经可以看到棋谱了......

面对这个事件，接下来将会有很多的爆炸性新闻报道，以及各种各样姿势的讨论。

我们要知道：

一．人工智能的确实现了很大的进步。

这次的进步可能是革命性的，这次新闻宣称的AI取得的成绩并不是“标题党”。

二．人工智能还没有战胜人类（什么所谓“人类最后的骄傲陷落”都属于“标题党”）。

但朝着这个方向迈出了一大步，而且是在很多人在蒙特卡洛之后不看好AI下一步发展的情况下，来了一个突然袭击（谷歌从开始研究到出成果再到发布，一直憋一个大新闻憋这么久也真是能忍）。

三．人工智能战胜人类的时点，可能比很多人想象的要来得更早了。

不是之前设想的生物计算机或者量子计算机出现后，甚至都不是新材料取代硅晶片之后，在这个时代就有可能出现了。也许是五十年后，也许是二十年后，甚至可能是十年后。

从小学时开始，我就痴迷于许峰雄教授对于计算机国际象棋项目的研究和成就，一直追踪到97年“深蓝”战胜卡斯帕罗夫。（就是在那之后不久，我才从国际象棋转投了围棋......）

谷歌AlphaGo的胜利：不是计算机打败了人类，而是人类打败了人类

（注：上图为第一个打败人类的计算机国际象棋程序“深蓝”之父——许峰雄）

从中学时代到大学时代，我一直追寻着许教授的动态和他撰写的各种文章、书籍，他写的《“深蓝”揭秘》被我翻的都烂了，我甚至在中学时代一直想以此作为未来的求学从研的方向。

许教授离开IBM、前往亚研院并声称准备致力于作为最终问题的计算机围棋难题之后，我仍然一年年心心念念的期待着许教授的后续动作。

然而十多年过去，等来的却是无数的后来者。

这也挺好，人类就是不缺后来者。

看许教授对当年研究过程的讲述，最大的感受就是：

其实并不是计算机打败了人类，而是人类打败了人类。

大量的计算机专家，配合大量的国际象棋职业棋手，在算法上不断革新，再搭乘上摩尔定律的东风，不断的失败再重来、输了再修正，最终才解决了计算机国际象棋难题。

卡斯帕罗夫，是败给了数以百计的人类专家的智慧的合力。

围棋也会是一样，计算机——今天说人工智能更合适，战胜人类的那一天迟早会来，大部分人都从来不否认这一点。

争论，始终在于这一天的早晚。

而棋手和围棋从业者们，出于可以理解的感情，总是希望并认为这一天不会来得那么快，但他们绝对不会拒绝甚至仇视这种进步。

其实我看到的很多人，都一直期待并赞许着人工智能的进步，甚至很多职业高手还亲身参与和帮助着计算机围棋项目的研究。我们努力打造着一个“大玩具”，一个能战胜自己的“大玩具”。

所以最终的成功，是我们人类自己的成功，而不应该对计算机感到恐惧。

同时，这“大玩具”也不只是好玩而已，人工智能对于现代乃至未来科技的发展有着极大的意义，这意义甚至会超出当年原子弹研究的后续红利。

所以不要害怕，不要烦恼，让我们期待着人工智能在围棋上战胜人类的那一天的到来吧。

我之前一直认为在我有生之年是看不到这一天的，然而现在看来，我错了。

我一点也不失望，反而感到很兴奋，很激动，并且期待着以google和facebook为首的前沿研究团队们的进一步的表现。最后的最后，恭喜谷歌，恭喜围棋，恭喜人类。

另外，文本先发于知乎（我的知乎ID：高飞龙），希望也能与雷锋网的读者们一起分享，欢迎留言探讨。