雷锋网按:从问答系统开始,聊天机器人已经存在了几十年。但只有在过去三四年内,如何让机器与人流畅自然地对话才成为商业公司尤其是国内互联网公司重金投入的热点。从微软小冰、百度度秘到各个垂直行业成熟的客服机器人,这些聊天机器人形态各异,又不乏共性。
雷锋网试图在一个系列采访里找到国内典型Chatbot公司形成的原因,以及他们所看见的商业机会。本文是雷锋网对竹间智能科技CEO简仁贤的采访整理。在创业前,简仁贤是微软亚洲工程院最高级别的负责人之一,其参与和向其汇报的项目包括了Bing亚洲地区的战略与合作伙伴关系,微软的虚拟助手小娜以及亚洲地区的商业变现业务。创业之后,简仁贤的竹间智能今天已经扩张到一百多人。简仁贤认为竹间做得大致就是一件事:让机器读懂语境,读懂人的情绪和情感,继而与人自然地发生对话。
周一晚上大约8点,简仁贤在对面的椅子上坐定开始接受采访。这个采访之后,他在9点多还有一个产品会议。他低沉的嗓音不时被咳嗽打断,但他的表情中没有显露出明显的疲倦。创业一年多后,谈到聊天机器人Chatbot和情感计算,他的大部分回答是明确有力的。上面与简仁贤对话中的这些判断,一个普通人容易从语调、动作、表情甚至环境中去捕捉到;但对机器来说,这个过程就很复杂。而他设想中的聊天机器人还不止于做到这些。
一、Chatbot的历史
聊天机器人Chatbot存在很久了,从我学生的时代就有。我自己写过一个机器人问答的程序。其实很简单,问答系统是找关键字,一个字两个字合起来,就可以找回来一句话。Chatbot,应该说一直有人在做,但是都是作为exercise,从未真正popular。
我觉得Chatbot可以做了,那是我还在美国,是搜索最红的时候。05-10年中间,当搜索需求最旺盛的时候,我就觉得,Chatbot应该是有未来的。
为什么?因为搜索一直处于用户输入一个关键词,返回多个链接多个结果的情景。以前美国有一家公司叫ASK.COM,在2000年初期就已经出来了。它是第一个公开的自然语言问答的系统,而不是检索。用户是以一句话问句的形式,找到他想要的信息。相比关键词和链接,这个时候,它就比搜索更进步一点,自然一点。
但中间有很多年,这样问答的系统其实没有流行起来,也没有让人能够觉得Chatbot是有用的。因为一个机器人,如果让人觉得它有用:要让人在用它的时候,觉得很智能,如果问一句、两句,答不上来,人就不会再来用了。当人把一个东西定义成一个小玩具的时候,就不会再回来了。
所以Chatbot在过去几十年来,虽然说有人拿它来做exercise,有人拿它做academic,就是没有普通人再用。
再让我想重拾Chatbot,是蛮长时间以后了。我在2012 - 2013年接触到《Her》这部电影,我觉得电影里的景象是可以实现的。她有很多人性在里面,而不是单纯的一个机器人。一个Chatbot可以懂你,可以有人性。但是她有人性之前,她必须要先懂情感,我觉得这里面有很多可以做的。
我那时候认为,机器人的定义要重写了。但即使现在,4年过去了,市面上还是有很多一问一答的程序,还很机械,用关键词、关键字去查找。现在很多市面上的机器人谈不上AI,都只是一个传统技术里商业化的工具而已。
那时候,在技术上也没有像现在成熟。但在我的职业生涯里面,技术永远不是难点。因为我们学技术的,认为什么事情只要能够讲得出来,大概都有方法实现,只是实现时间的先后长短而已。
所以技术不是根本问题,问题是观念、理念,是你对Chatbot的看法。如果你认为Chatbot还是一问一答的,很机械化的,那么你技术再高端,做出来还是一问一答;如果你能够想象Chatbot是具有感情,那么机器人就可以懂你。
听起来,好像每个人都是有这个愿景的。但在实现上,有的人并没有朝着这个方向去做。这个不是技术的问题,是设计观念的问题。比如说微信刚出来的时候没几个功能,跟其他的聊天平台一样,在聊天平台的开发上,技术不是难点。但有几个能够像微信做得那么成功?如果Chatbot只是技术的融合,每一个做出来的Chatbot都一样的,每一个人做出来的IM应该也跟微信一模一样。不是的。
我们再看Chatbot的时候,我们设计的思路,架构的思路,算法的思路,是不是按照人性化的方式去走,这很重要。如果说虽然愿景是往人性化走,可是架构、算法、开发还是走捷径,那么做出来的还是跟20、30年前的Chatbot没什么两样。
做一个有人性的机器人,能够了解你,有情感。
第一,要从情感机制上去着手。有多少做机器人的团队真的去投入情感计算?大家都是投入做语料库、做词向量、再做一个检索,有没有人想过如何做好一个情感计算吗?如果有人要把一个Chatbot做好,要模拟人性,模拟人的行为,包括理解人的行为模型,让Chatbot能够有人性地互动。
对人性和情感的建模,有几个方法可以做。一种是计算认知科学的方法。它也可以从逻辑的模型演变成机器学习的模型。所以一个是逻辑去模拟人的情感和行为,一个用是机器学习的模型去预测。
当你对我不满的时候我应该怎么应对,当你无聊,跟我说你很烦的时候,我应该怎么应对,当没话讲的时候,我应该怎么应对。
第一,要能够辨识这样的状态;第二要能够应对这样的状态,如何在不合适的状态之后,做自我学习调整,成为一个好的状态。这就需要结合逻辑模型跟机器学习模型的方法。
另一方面机器学习自己可以去制造很多交互的数据,这个交互数据产生一个好的交互模型,用交互模型再让机器能够对应不同的情绪状态。把这两个结合起来,就能够模拟人的交互,跟人的行为。
重要的一点是,你的Chatbot能够对情感进行识别和理解,要能够对话的主题理解,要对意图理解,要对整个语言上很多不同的信息理解,你才有办法做出一个真正懂人的机器人。
这几年来,信息通讯平台的流行,包括从以前QQ到现在的微信、国外的LINE、Facebook Messenger还有其他的聊天平台盛行。人类在这几年来,已经对聊天行为习惯了。人的行为变了。如果人的行为没变,那么今天聊天机器人的接受度也不可能那么高。
基础技术也进步了,包括机器学习的工具、平台进步了,深度学习也进步了。你要一个RNN的模型,谷歌帮你写好了,TensorFlow帮你写好了。你不用一个代码一个代码去敲,只要专注于你的模型就可以了。同样的,在工具、技术里面,大家的心得也丰富了,这部分的技术理论迭代非常快,所以技术方面是成熟的。
第三个,有很多数据,最珍贵的数据不是从网络来的。最珍贵的数据是自身产生的数据。但是从网络来的数据是冷启动的关键,扒来的数据清洗,清洗之后整理,整理之后做标记等等。数据存储的成本也降低了,GPU越来越便宜,GPU一年可以3倍速度增长,在不涨价的情况下,性能可以提升3 - 4倍, 3年会提升20、30倍。
在这几个前提下,我觉得现在是做聊天机器人最佳的时候。甚至不是现在,在两年多以前就是了。像微软小冰在2013年底 - 2014年初就已经开始了,这些准备条件都已经存在了。
而我想做的情感机器人跟小冰是相反的,是完全可定制化的。让每一个人可以有自己的机器人,每一个商家可以有自己的机器人。我想做出来一个机器人工厂,它是可以制造很多情感机器人,不是只有一个。
机器人不仅仅只是一个IP,比如迪士尼的米老鼠,它不可能成为其他商家的代言人,因为事实上只有一个迪士尼。每一个商家都有属于自己的品牌,所以每一个商家都应该拥有属于自己的机器人。
如果真的想把机器人推向各个地方,它需要有情感,懂你,可以“记忆”。这个机器人会记忆“你”,还有你周围的人,围绕你去学习。这个机器人会和你一起成长。
构建这样一个机器人,分很多步,需要比较大的资源。我们要从平台开始做起,其实是一个10年计划。
第一个要先能够证明,聊天机器人能跟人产生黏性,如果产生黏性,就要取得人的信任。机器人在过去几十年来,为什么一直没有办法为人所信任,因为,它就是不够智能。只会闲聊,是不可能有黏性的。会闲聊之后,Chatbot能够帮人做到什么,这样才有办法达到更强的黏性,情感跟功能理性地结合。
其次聊天机器人必须要在人的生活上,能够起到帮助的作用,必须要跟商业去打通结合。要不然,它可以帮你查天气,可以帮你做搜索,但是没有办法在其他的业务上帮你服务,Chatbot也没有办法跟人产生黏性。只会闲聊,是不可能有黏性的。
我觉得一个完整的懂人性的机器人,这个梦想可能要10年才能达到。下一个,它可能要要淘汰掉搜索,甚至于取代App一些的入口的。这个过程,在未来的演变里,是一定要发生的。