资讯 人工智能
此为临时链接,仅用于文章预览,将在时失效

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会

作者:丛末
2018/12/11 15:13

雷锋网 AI 科技评论按:随着语音识别 ASR 的进步,对话机器人从简单的指令式的语音助手,进化到关键词交互方式,人们能够使用较为完整的句子来表达意图,机器人从中截取关键词判断用户意图。

现阶段利用 NLP 、NLU 技术,以及机器学习方式,慢慢脱离关键词的束缚,可以更聪明的去理解用户意图以做出正确的回应。再下一步是否能脱离一问一答的回应方式?是否机器人能主动的跟人产生互动?没有情绪情感的机器人真的算是智能机器人吗?情绪情感又有哪些可能的应用?

近日,在雷锋网 AI 研习社公开课上,竹间智能 CTO 翁嘉颀分享了人机交互技术探索。公开课回放视频网址:http://www.mooc.ai/open/course/587?=aitechtalkwengjiaxin

翁嘉颀 Phantom Weng:竹间智能 CTO,作为 AI 领域的技术专家,他带领团队负责竹间在 AI 领域产品研发与技术规划,领域主要涵盖对话机器人、计算机视觉、金融科技等领域。此前,翁嘉颀在中国大陆及台湾的多个科技类创新企业担任 CTO、首席架构师等职位,带领团队进行 AI 及大数据领域的研究开发。他毕业于台湾大学资讯工程学系,此后就读于纽约州立大学。熟悉算法、编程语言、搜索引擎、网络安全以及邮件安全,使用过的语言超过 35 种。

分享主题:人机交互技术探索

分享提纲:情感计算、意图、主题、上下文、中文 NLP 应用、多轮对话、算法与数据的关系

雷锋网 AI 研习社将其分享内容整理如下:

今天讲的主题是人机交互技术探索,我会着重讲这些技术的应用以及怎样解决当前的问题。

人机交互现状

先看一下人机交互目前的现况:第一个,双十一快到了,我在系统推荐了三件 T 恤后,回答「要黑色的」,结果因为不理解上下文,变成在解释黑色的基本定义。跟各种机器人交互也常常会有类似答非所问的事情发生。

为什么现况是这样的?这是因为大部分人机交互都使用关键词匹配和模板的方式,没有上下文,语料都是从网络上爬来的——根本无法控制质量,怎么清洗基本上都没法使用。

一个理想中的机器人是贴心的,是能够有情感、有记忆、懂你的,是能够陪伴你的。机器人应该避免攻击性的回答。

使用模板的机器人没有情商,也无法进行多轮对话。Siri 曾在美国做过一个测验,测验结果显示它的智商为 2 岁,其他的机器人也差不多。而对于成年人来说,智商达到 16-18 岁的机器人,才是我们需要的机器人,然而,如何做到这种程度?

公司介绍

在此之前,我先介绍一下竹间智能这家公司。

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会

我们似乎可以发现,目前在人工智能的文本分析和语义理解领域,很多公司的技术人员都是做搜索引擎出身的。

我们公司的 EMOTIBOT 是一个情感机器人,光文字情绪就做了 22 种,人脸表情 9 种,语音情绪 4 种,此外,还做了多模态情感识别。

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会

需要的技术

做到较好的人机交互,需要哪些技术呢?

第一个是上下文理解技术,有三种方式:补全、指代消解和对话主题式补全。

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会第二个是主题、Speech Act &情感以及 Memory 的运用:

一是利用主题做对话控制;人类对话是有固定的主题,有时候会有主题的转换,但是至少不是东一句「天气」西一句「体育」,这是无法聊下去的。尤其机器人回答的答案更要跟原本的对话主题相契合,不然就是答非所问文不对题。

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会

除了对话主题以外,句法句式,根据对话中记忆下用户的属性,做出好的回答。例如我不喜欢看恐怖片,当问到「最近有什么好看的电影」,就不应该出现恐怖片。然后也可以用生成的方式来产生回答,直接生成方式要产生高质量的回答需要大量的数据训练,所以也可以考虑先生成些细节 (句法、关键词、主题 等等),再用造句的方式生成整个句子。

此外人机交互目前在特定场景内比较能表现好,因此需要针对场景做深,需要场景专家以及现有的场景语料,才能做到准确率超过 95%。

 NLP 重要性

我们再来讲 NLP 的重要性,刚刚所提到的技术有一个自然语言处理平台,能够提供我需要的线索。而我们底下其实做了大量苦工,做得模块较多,就有更多机会,让各个模块在匹配时能够 Cover 对方的弱点。

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会

那我们如何利用 NLU 的基础信息呢?

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会

中控中心

然后讲到一个中控中心的问题,这就涉及到刚刚所提到的多轮对话问题。那多轮之间能不能切换?下面是几个例子:

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会

间智能

经验分享

最后我分享一下竹间智能的实战经验。

一是算法。单一算法在图像识别上的应用表现可能还好,但在文本和语义理解上基本不可能获得好的准确率,下面是其无法解决的一些问题:

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会

二是语言学家与数据质量。数据标注上必须非常严谨,尤其必须有专业的语言学家加入标准准则的设计,或是标注质量的把控。建议任何一笔数据都有多个标注人员做到交叉审查,当几个标注人员意见不一致的时候,由语言学家 / 领域专家做最后的判定。不然垃圾的数据只会训练出垃圾的模型。

未来会不会存在这么一个世界:每个人都有一个机器人,机器人会懂你,就像好朋友和闺蜜一样;每家企业也会有机器人,会帮助员工完成订餐等事宜。这是一个理想的状态,虽然现在还有一段距离,但是也有很大的希望,不过我们只有将技术底层做好,才能一步步走到这个理想状态。

以上就是本期嘉宾的全部分享内容。更多公开课视频请到雷锋网 AI 研习社社区观看,关注微信公众号:AI 研习社(okweiwu),可获取最新公开课直播时间预告。

长按图片保存图片,分享给好友或朋友圈

竹间智能翁嘉颀:人机交互技术探索 | AI 研习社 60 期猿桌会

扫码查看文章

正在生成分享图...

取消
相关文章