人工智能的现实是:苹果的虚拟语音助手 Siri 十分糟糕,多数时候她完全不知道你在说什么。即使当 Siri 识别出你的问题,有时也会用一个包含了网页链接的页面作为回应,并不会直接告诉你答案。
原因在于,苹果的语音助理是建立在旧技术之上的。但即使 Siri 升级到最新的人工智能,她也远远不如有血有肉的真助理。人工智能在过去的几年有了十足的进步,但它距离智能仍然有很长的路要走。
“M”是 Facebook 目前正在研发的全新虚拟助理,它也印证了这一点。
这一语音助手建立在 Facebook 即时通讯应用 Messenger 之上。根据雷锋网消息,M 于本周三亮相,旧金山湾区的数百名用户开始测试这一功能了。毫无疑问,这是 Facebook 为了与 Siri、Google Now 和微软的 Cortana 竞争而交出的答卷。不过,根据 Facebook 的描述,它能够执行更广的任务,你能向 M 下达指令,帮你订晚餐,规划下一个假期等。
这是因为 M 会让人工智能在人类的协同下,回应你的问题。Wit.ai 的创始人 Alex Lebrun 表示:“人工智能试图做一切事情,但它需要受到人类监督”。雷锋网曾介绍,Wit.ai 是 Facebook 收购的一家人工智能创业公司,帮助开发了 M。
在这个由人工智能驱动私人助理的大环境下,M 的诞生似乎是一种倒退。Facebook 才刚刚公开测试,目前还不清楚这种人机合作的方式,在扩展到更多普通用户身上时能否跟上步伐。虽然这是一个违反直觉的方式,但实际上 M 可能更加智能的人工智能。
Facebook 的想法是,人类不仅仅能回答人工智能无法回答的问题,而且从长远来看,有利于提高它们能力。如今的人工智能,都至少需要获得人类的一些训练。如果你想要一个系统能自动识别 YouTube 视频中的猫咪,首先人类必须告诉它猫咪是什么样,而且还必须标注各种猫科动物的照片,提供其他必要的数据。通过人类对 M 提供支持,Facebook 正在以异常复杂的方式做这类事情。
具有讽刺意味的是,Wit.ai 提供的依然是很老的人工智能技术。这一技术基于两个算法——条件随机域和最大熵分类器。这两个算法已经服务于这个高科技世界十多年了。不过,这种方法为 M 在找到更好的人工智能技术之前,提供了跳板。
Lebrun 于2013年成立了 Wit.ai,之后开发了一个AT&T公司用于与客户沟通的数字代理。Wit.ai 提供了一种可以帮助软件程序员开发类似于 Siri 系统的服务,其可以识别语音,并在一定程度上理解自然语言。这一服务正是基于上述所说的旧算法,但它不需要像苹果和 Google 一样,收集大量的语音数据就可以学会识别语音。
负责 Messenger 的 Facebook 副总裁 David Marcus,之前曾想扩大 Messenger 的使用范围,产生更多收入,之后他接触到了 Lebrun 和他的公司。今年一月 Facebook 收购了这家仅有10人的创业公司,收购金额不详。Marcus 表示,Facebook 拿下了“在全球人与人工智能交互中做的最好的团队之一”。不过当时,Lebrun 并不清楚 Facebook 要做什么。
约三个月后,他们团队产生了开发一个运行在 Messenger 之上的虚拟助手的想法,但它不会是另一个 Siri。首先,它主要是通过文字沟通,而不是声音。其次,它也会回答一系列更复杂的问题。Lebrun 表示:“如今有很多的人工智能助手,如 Siri、Google Now 和 Cortana,但应用范围有限。我们希望开始做一些更加雄心勃勃的事情,给人们他们真正想要的答案。”
当你向 M 提问,人工智能会理解你的问题,并制定相应的回应。但它不会将结果发送给用户,系统会先将结果发送给人工智能“培训师”——也就是 Wit.ai 团队的员工。培训人员经过审核,再决定为你提供所要寻找的内容。
根据 Lebrun 的说法,该人工智能可以自动完成大部分简单的工作,例如讲笑话。对于更复杂的任务,比如预约驾驶考试,人类会在其中担当最繁重的工作,并会真正向目标公司预约。
在有人为参与的任务中,人类会因特定的问题应该如何回答,产生相应的操作路线图,每一步都会被记录下来。未来,这些数据可以帮助推动基于深度学习而产生的更先进的系统,基于深度学习的人工智能会通过机器的庞大网络分析信息,这些网络就像是在模仿人类大脑中的神经元。
这种神经网络已经被证明在识别图像、识别语音、定向广告,甚至是指导机器人拧上瓶盖等方面极为有效。Facebook 现在使用神经网络来识别照片中的面部,确定哪些内容可能是你想要在新鲜事中看到的。采用了 M 之后,它的目的就是将技术进一步在产品中应用。
那么为什么不从一开始就用神经网络开发 M 呢?如果没有正确的数据,神经网络将无法提供如此强大的服务。有了几千个数据点,你就可以开始建立一个模型,之后采用这一模型,就会得到更多的数据,一旦你有了一百万个数据点,就会得到一定程度的深度学习能力。
正如 Lebrun 所描述的那样,这是一个非常宏大的计划。即使将神经网络混合进去之后,Facebook 将在未来几年继续使用人类参与这项计划。随着 M 的不断使用,它就需要更多的数据才能继续提升。你知道的越多,你不知道的也越多。人工智能做的越多,也就有更复杂的任务需要去做。
随着 M 的使用范围扩大到越来越多的用户,就需要越来越多的“培训师”。Lebrun 预计其培训人员的数量将会随着用户的数量的增长而增长,这会带来的负担将是巨大的。Messenger 目前有7亿人在使用。
但同时,即使 Facebook 能够保持系统持续运行,人工智能可能不会像 Lebrun 所期望的那样快速进化。数字助理创业公司 x.ai 的 Dennis Mortensen 表示,让人类和人工智能一起工作实际上可能会放慢改革的步伐。他拿无人驾驶汽车作类比,除了像Google这样的完全无人驾驶,现在还有一种方式是在汽车中逐渐加入智能功能。但后者的问题是,它可能并不会最终达到完全的无人驾驶,毕竟所收集的数据可能人工智能并不需要。
但Mortensen也承认了数据的重要性,并表示,如果Facebook适当使用了培训师,或许能为人工智能找到捷径,不过它要将重点放在未来,而不是看它现在能做什么。
via wired