近日,英国雷丁大学宣布俄罗斯人Vladimir Veselov创立的人工智能软件Eugene Goostman通过了图灵测试。一时间,有很多人欢呼雀跃这是“人工智能新的里程碑”、“标志人工智能新阶段”。巧合的是,若干天前,我我还看见资深IT评论人士banly在朋友圈写道:“现有的机器应该都不可能通过所谓的图灵测试吧,机器人会卖萌就可以了。”
图灵测试是什么?
“图灵测试是图灵于1950年提出的一个关于判断机器是否能够思考的著名试验,测试某机器是否能表现出与人等价或无法区分的智能……如果一个人(代号C)使用测试对象皆理解的语言去询问两个他不能看见的对象任意一串问题。对象为:一个是正常思维的人(代号B)、一个是机器(代号A)。如果经过若干询问以后,C不能得出实质的区别来分辨A与B的不同,则此机器A通过图灵测试。”——维基百科
但图灵测试是60多年前提出的标准,那时候人类对自身的理解还很不充分,图灵测试基于一些过分简单的假设——但是,人类的智能要素可以分解为数十种之多,比如从记忆力、洞察力、数理逻辑方面,并不只是基于正确逻辑和策略做判断的机械逻辑,简单地“按照正确的知识做独立判断的能力”、“获得正确知识的能力”不能衡量一个机器是不是“智能”。换言之,图灵机本身并不是关于智能的定义,它从头到尾都没有说智能或者人类智能必须具备什么特征。
而且,图灵测试的可操作空间很大,和测试者的题目设计也有很大关系,小黄鸡和小冰也许也可能通过图灵测试,但这能说明什么问题?
zompist.com(新人工语言创建者Zompist所创建的一个论坛)上,有人因为不忍“图灵测试已经变成了人工智能发展道路上的一个愚蠢的路标”,发表了《12个抛弃图灵测试的理由》,摘取几点如下:
1、每次测试都不超过5分钟,这种时常的“测试”没有什么实质意义;
2、对AI研究没有帮助,AI不靠通过这种“测试”而进步,而是通过解决实际的问题、或者应用到生命科学里才会有实际的意义。
3、对于不相信机器能具备人类思考能力的人来说,听到机器“通过图灵测试”的消息的第一反应只会是“who cares”(对于不知道情况的人来说,他们也不知道这个测试意味着什么),一个本身有争议测试结果,没有什么真正的说服力;
4、容易被欺骗。
5、有主观性。两个人面对同一台机器,测试结果可能不同;即便是同一个人面对同一台机器,两次测试的结果也会不同(几乎是百分百的概率)。
6、图灵测试假设大脑只有规则性、结构化(而不是物理大脑本身的复杂度,比如上文说的记忆力、洞察力等)的部分才会产生人工智能。
7、即便图灵测试告诉了我们结果,我们还是会用一套人类的标准判断一个机器具不具备“人工智能”,比如微软小冰通过了图灵测试,但所有人知道它就是机器人。
……
对此微博网友有一针见血的评论。
@fourjiong:“语言游戏玩得好的话,人类无法通过语言来判断对方是人还是智能(估计塞尔老爷子本人会挺高兴,他的讽刺被兑现了)另外图灵测试大赛用的也不是严格的图灵测试,这个新闻其实不能说明AI的任何进步,反而又一次讽刺了人类自以为神圣的一些东西。”
@末日余歌:“听说图灵测试被打破了。其实我觉得,这只是说明:人工智能的考核标准需要写入新的东西,而不是表示这个消息值得引起恐慌或者过度关注,毕竟人工智能还不能感知或者掌握人类的隐藏情绪,比如反语、双关、讽刺、谎言,还有‘下意识’。‘人工智能威胁论’尚无从谈起。”
图灵测试已经out了,除非修改规则,否则拿它来衡量人工智能的发展水平是有失偏颇的。