昨天晚上,小度与“水哥”王昱珩人脸识别比赛播出,最终小度机器人以2:0胜出,然而这个结果似乎并不服众。在很多论坛、贴吧里,充斥着大量百度“黑幕”的帖子,很多人怀疑这次王昱珩实际上是“被输”。阴谋论太多,以至于《最强大脑》节目组不得不进行了一场“澄清直播”,然而这场直播似乎并没有多少效果,该黑的继续黑,想骂的也仍然继续骂。
在吴恩达的微博下面评论区,求证是否有“黑幕”的评论被顶到了前排。
针对黑帖里几个点,雷锋网来扒一扒,这次黑幕的可能性有多大?黑帖主要针对了以下几点:
在节目录制的前一晚,节目难度突然增加了,视频明暗度调低了20%,这样挑战难度增加了好几倍,令王昱珩处在不利地位。
魏坤琳在比赛现场也做了说明:“王昱珩要求节目组把明暗度调低,让照片更加模糊20%,但这个难度(对于人来说)增加太多了,可能机器在这方面不会受到明暗度太大的影响。”
对于临时更改规则这一点,王昱珩在直播里说出了自己的想法:“对于增加难度,我想的是,是不是越暗,电脑的噪点就越多?如果我把亮度降下来的话,是否(电脑在处理的时候)就回不来(亮度)。就像如果给一个人美颜了,再让这张照片回到原图可能就费劲了。”
王昱珩的动机,实际上是想增加对机器人的难度。他在之前的彩排中,三次都是全中,在这样的情况下,他提出增加难度的动机是可以理解的,他不想平手,他想赢,想让计算机出错。但是人工调节照片的明暗度,对计算机来说,可能根本没有什么影响。
魏坤琳给出的说法是:“人工智能用对比度解决识别轮廓的问题,就算整体变暗,但是对比度还是原来的,只靠这个东西就可以把线条轮廓弄出来。“
北京大学信息科学技术学院的一位博士生告诉雷锋网:
“人工调节明暗度如果是成比例缩小所有像素的数值,那么相对于人来说,人工调节对电脑的影响不太大。但如果是因为拍摄环境的改变,比如说天色变暗,那么人工智能将会受到影响。魏教授所提到的通过边缘轮廓识别人脸是正确的,像部分传统人脸识别算法,就是通过相对明暗度来检测特征点从而识别的,所以降低明暗度对这类算法影响不大。但是对于深度学习,由于我们目前并不完全了解它提取了哪些特征进行识别,并且大部分开源的训练照片的明暗度都适中,所以在部分深度学习算法的评测,我们确实发现拍摄环境的明暗度是有影响的。”
也就是说,如果小度的工程师团队用算法把照片明暗度恢复了,那么其实人类和计算机面对的难度是不平等的,另外这位博士还说道:“比较公平的是,在视频录制的时候,调低附近灯光。”
但是视频录制是早在一个月之前就弄好的,王昱珩在直播中说道:“我误认为耳朵和鬓角是唯一没有遮挡的地方,所以是最能反映真实信息的。我哪想到这(视频)是一个月前的,中间有剃头的、长痘的、痘痘消了的。”而规则是在录制的前一晚更改的,所以当时无法去从根本上调整视频的明暗度。从这个角度来说,王昱珩在不是很了解机器学习运行原理的情况下,误以为自己更改规则会增加机器识别的难度,但实际上并没有,用他自己的话说就是“聪明反被聪明误”了。
在视频中,我们看到王昱珩有几次,都是在2个选项中决定,然而往往都是把正确答案擦去,最终选了错误答案,最终他三个答案都错了。鉴于王昱珩之前的表现,三个都错是比较异常的,所以就有人就怀疑,王昱珩是“被迫”擦去了答案,甚至“还原了”当时王昱珩愤怒的画面。
(黑帖之一截图)
王昱珩自己在直播里解释道:“如果你让我只写一次的话,或许我就对了。我擦掉的全是我之前写的答案,留下来的都是我校准完以后的。”王昱珩用人的耳朵和鬓角来做“校准项”,这几个信息是会随着时间而产生变化的,这是他三次都错的主要原因。
小度在现场除了进行比赛之外,还跟主持人、嘉宾互动,展现了机器人幽默可爱的一面。然而这种问答系统似乎并不是计算机自动产生的。
首先,我们没有看到小度在交互的过程中是用“唤醒词”来开启对话的,似乎人们不用说出“唤醒词”就能跟小度对话,而这是目前NLP领域不可能达到的水平。其中有一个细节是,主持人在第一期节目里问王峰是否对自己的答案有信心时,转身问小度:“对于你的答案有......”话还没说完,小度就自己回答“有信心”。主持人也忍不住吐槽:“我还没问他,他就直接讲出来了。”
一位从事NLP研究的博士生告诉雷锋网:“目前机器是不可能生成这样的答案,一般人做聊天机器人不会加入抢答这个功能,因为无法确定什么时候该回答。所以我猜测是有台本的, 后台有工作人员控制。”
在第二轮中,小度和王昱珩的答案都错了,正确答案是中间的8号,王昱珩选择了7号,小度选择了29号。可以看出,7号与8号比较像,然而小度的答案29号却与8号相差比较远了。
对于这一点,百度的工程师似乎也感到很惊讶。知乎上,自称百度IDL人脸组工作的翁仁亮做了回答,他表示自己参与了这次最强大脑项目组,并形容当时团队的反应是懵掉了。
为什么系统出现了这么大的失误?雷锋网咨询了几名业内专家,没有得到确切结论。雷锋网也进一步联系百度IDL的工程师,目前为止还没有得到回复。
同样是带有PR性质的“人机大战”,跟AlphaGo与李世乭对弈相比,为什么谷歌没有被质疑,反而达到了震惊全球的效果(因AlphaGo的影响,2016年甚至成为了“中国人工智能元年”),而百度这次有人工智能界的权威人物吴恩达坐镇,甚至当事人王昱珩进行一场“澄清直播”都显得不够。
为什么百度这场“人机大战”会招徕这么多质疑?
其中有一个很重要的部分,是“播出形式”对比赛的真实性打了折扣。AlphaGo与李世乭对弈战况,是实时直播的。站在第三方观战的角度来说,观众可以看到比赛全程,双方落下的每一步棋、思考时间等等细节,都一览无遗地呈现出来。所以李世乭“神之一手”这样具有“戏剧化”的一幕才会一直到现在都被人们津津乐道,人们并不会去质疑这是否是经过了编排,因为观众都是“亲历者”。
《最强大脑》是个录制节目,为了营造戏剧化的情节,节目组会对赛况进行后期剪辑编排,加上灯光和音乐效果,所以对于观众来说,比赛进程的真实性就是会打折扣,这是“播出方式”本质上决定的。
另外,第一期节目里,王峰是临时受命上场的,人类在毫无准备的情况下去对决一台训练充足的机器,这种比赛规则并不公平。还有一点,就是小度的语音问答系统的真实度确实不高,但是节目里却营造出小度在跟主持人、嘉宾聊得风生水起的效果,普通观众或许真的会因此认为AI的能力已经达到这样的高度了,这会让人们对AI抱有不切实际的期望,而这对整个AI的发展并不利。
百度深度学习实验室主任林元庆此前曾在采访中表示:“我们在过去几年里,对百度大脑投入了很多,这次参加《最强大脑》的初衷,其实就是为了看看我们的技术水平达到了什么程度。”
《最强大脑》始终是一个娱乐性质的综艺节目,如果百度想做一次像AlphaGo那样成功的PR,其实可以考虑把比赛的控制权掌握在自己手里,请一群人类高手来参加自己组织的比赛,做好赛制的Peer Review工作,彻彻底底做一场较量,或许就会好很多吧。
吴恩达在接受采访时说道:“虽然小度在人脸识别方面可以做的非常好,但是如今王昱珩以及任何人类能做的事情,AI还不能做到。”但这样“请理性对待AI”的信息,似乎并不能够通过娱乐节目来传递给大众,反之只会令AI的狂热越来越大。
总的来说,这次小度参加《最强大脑》遭黑,是因为这场秀里“若干个谎言包裹着真实”,确实有一点难以服众,当然你把它当个娱乐节目来看,也就没什么了。