AlphaGo 对李世石“放水”？棋手说不可能！

李世石 AlphaGo 出门问问

作者：陈留

2016/03/13 19:16

就在舆论普遍认为李世石将会继续败北的时候，人机大战的第四场，李世石出人意料地挽回了胜局，将比分改写为“3:1”。

比赛开局阶段，李世石始终落后于 AlphaGo，一直在被吊打。然而，第78手的时候，局势峰回路转，李世石下出了关键的一步，一招极其冷门下出妙手。对于这一步棋，视频观战的职业棋手古力评价为“神之一手”。

随后，AlphaGo 一连串的差手让棋面局势利好于李世石。在第97步，AlphaGo 再次出现低级失误，所下白子被李世石果断吃掉。最终，经过长达4个多小时的鏖战之后，AlphaGo中盘认输，李世石终于在这场人机大战中赢回“尊严”之战。

AlphaGo 对李世石“放水”？棋手说不可能！

对于戏剧性的比赛结果，雷锋网编辑的朋友圈出现了有多种观点看法，其中最有代表性的一种说法是“AlphaGo 选择性放水“。甚至还有阴谋论表示，AlphaGo 今天失利是因为被改代码。那么，AlphaGo 放水的可能性有多大呢？

AlphaGo 对李世石“放水”？棋手说不可能！

雷锋网第一时间针对这一问题请教了围棋界的专业人士。对此说法，他们都表示，“可能性为零”。至于李世石第78步的落子，完全可以称得上是载入史册的一次妙招！

业余围棋5段的赵治勋（20年棋龄，并非职业9段棋手的赵治勋）表示：

李世石创造了历史，第78步棋没有一定水平看都看不懂，很高的职业水准才能想得到。

棋手鲍云对于李世石第78步下法给予了很高的评价：

“配得上最高评价神之一手。

AlphaGo 程序在大优局面的情况下被李世石的妙手打懵了，导致在随后的20来步进入疯狗状态。鲍云表示：

AlphaGo 前半盘大优，不是防水的态度。至于AlphaGo 第97步的表现可以用“疯狗病发作”来形容。78-97步，机器应该有足够的（时间来）缓冲调整计算出局面走势。97确实是很“丢狗”的一步，说明算法还是有极大的问题，抗击打能力不足，崩溃的太脆了”。

那么，AlphaGo 为何会出现如此明显的异常表现？

根据Alphago原论文第一作者之一的Demis Hassabis 在赛后的总结，

“李世石下出白78后，AlphaGo自我感觉良好，在程序的“值网络”(用于评估电脑胜率)中，误以为胜率达到70%，直到第87步才反应过来。”

AlphaGo 对李世石“放水”？棋手说不可能！

赵治勋猜测，很可能是蒙特卡洛算法本身的一个缺陷。“78步本身是盲点，（李世石）小概率的选点，很可能导致（AlphaGo）在正确率很高的算法上出现意外事件，导致出错。”如果这一猜测成立，人类将可能找到每盘打败阿尔法的策略。而谷歌公司，将需要很长的时间来修正这一“缺陷”问题。

出门问问ＮＬＰ工程师李理也在微信群给出了自己的猜测：

（如果一定要猜测）我觉得可能是开局主要靠value network，因为搜索空间太大，有可能在某些特殊的局面下出现非常差的结果。就像之前神经网络识别图片时也出现过很诡异的错误，还有人研究怎么构造让它识别出错的例子。

同时，他也认为这一“诡异”问题将会比较难解决，

神经网络打分是固定的，搜索有一定随机性。而value network是异步的，调试也不简单，得通宵加班找bug了。

PS.最新消息补充：

在赛后的记者招待会上，李世石谈到了AlphaGo的两个弱点：一个是AlphaGo执黑棋时似乎挣扎比较多，相较执白棋时更难赢。另一个是，当它遇到出其不意的招数时，有可能会导致失误，未必是失误，就是bug。

那么问题来了，第5场比赛，各位怎么看？是李世石再下一城还是AlphaGo 4:1 荣耀收关？