纽约时间 11 月 10 日,CES 宣布了 2017 年度获得创新奖的产品,来自英国创业团队 Emotech 的语音机器人 Olly 获得了 4 项创新奖。虽然入选创新奖的产品数量颇多,但同时揽获 CES 4 项类别奖,这在 CES 历史上还是首次。
(黑色版 Olly,图片由 Emotech 提供)
Olly 的外形像是一个坐在垫子上的“甜甜圈”。而颇为奇特的是,Olly 与 Hover Camera 同时位列 “无人机与无人系统”(Drones and Unmanned Systems)的创新奖获得者。
其它项目还包括:
智慧家庭(Smart Home)
家用电器(Home Appliances)
家用音视频组件和配件(Home Audio Video Components and Accessories)
雷锋网对 Emotech 两位创始人庄宏斌、Chelsea Chen 进行了专访,了解了 Olly 背后的技术、团队和发展脉络。
Olly 是一款语音机器人,与亚马逊 Echo 和 Google Home 定位于普通家庭不同,Olly 将自己的用户选择在了都市白领,其核心功能是:提醒、优化日程安排,主打个性化和情感互动。
Olly 上半身长得像是一个“甜甜圈”,安装有 LED 灯;下半身是一个底座,内置 6 个麦克风。“甜甜圈”与底座之间可以有 12 种角度变换,甚至可以绕着底座进行 360 度旋转。Olly 约重 1.5 kg,底座直径约 20cm,目前有黑白两种款式。
(白色版本 Olly,图片由 Emotech 提供)
其实 Olly 最早样机是出现在 2015 年 TechCrunch Disrupt 大会上,当时它还长这样,像是一个“大眼”喇叭,渐渐迭代至如今的模样。
(图自:Robots Champion)
庄宏斌和 Chelsea 告诉雷锋网,作为一款语音助手机器人,Olly 最与众不同的地方在于:它是具有个性的,并且能表达情感。
这意味着 Olly 会实时习得用户习惯,做出符合用户独特个性的安排和互动。当然,谁愿意让 Olly 掌握自己的数据,比如日程安排、健身数据等,那么谁就会是 Olly 的主人。
一旦有了主人,通过对其数据和互动历史的学习,机器人 Olly 会沾染上主人的性格,变得与主人越来越像。Chelsea 说道:
"如果用户是理性严肃的人,那么他的 Olly 将会以数据导向,直来直去。比如你问今天天气如何,那么就会给你一个多少度、风速多少这样准确的数据。如果主人的个性是感性的,那么他的 Olly 就会更活泼,在互动的时候会有更丰富的语言发挥。"
Olly 会像宠物一样,对不同的人表现出不同的态度。
“一个活泼的 Olly,跟主人互动式时会比较俏皮,但如果是陌生人来询问,其表现可能就会跟 Echo 差不多。”
这样极具个性的机器人,对于主人发出的指令,也会“Say No”,这是 Emotech 团队颇为自豪的地方。Chelsea 举了个例子,当你把自己锻炼身体的计划告诉 Olly 之后,如果有一天你想“偷懒一下”不去锻炼,让 Olly 打开电视,那么此时它可能会拒绝你的要求,因为它会告诉你,你明天的日程很满,或者明天天气不好,最好的锻炼时间应该是今天。
其实早期 Olly“大眼”设计是有一些争议的,TechCrunch 在报道的时候用了“Olly 团队坚持认为这个眼睛很可爱,并非诡异”这样有点戏谑的描述。
Chelsea 告诉雷锋网,“大眼”的设计是为了情感互动,让用户能够感受到这个机器人在跟自己对视。但在 TechCrunch Disrupt 之后,他们做了 40 多场的用户调查,发现用户对这个设计表现出了两个极端的态度,有的人爱不释手,有的人则会因此感到害怕。而且,新的 6 个麦克风阵列的设计也需要它们在硬件上作出比较大的改变。
“真正的表达情感不一定非得是用眼睛一直盯着看。”
他们选择了更加抽象的表达方式:通过 LED 颜色和形状的变化、震动、“甜甜圈”的旋转,来表现 Olly 的情感。
当你说出“Wake up Olly”唤醒词的时候,本来趴在底座上的“甜甜圈”就会抬起来,用户这时候会感觉自己的机器人“醒来了”。Olly 还会用身体的震动来表达开心的情绪。
再比如,Olly 的一个典型应用场景就是为你安排健身计划,如果你在 Olly 面前完成了俯卧撑,那么“甜甜圈”就会绕着底座进行 360 度快速旋转,以此表达兴奋之情。
亚马逊的 Echo 已经卖出了 300 万台,Google Home 也在今年 10 月正式发售,各巨头、初创公司都在抢滩登陆这个千亿级的市场。
目前 Echo 和 Google Home 的售价分别是 179 和 129 美元,主要提供信息查询的功能。在 Emotech 看来,“个性化和情感互动”是 Olly 相较于这两家巨头产品的优势。
但是 Olly 并非第一个推出此类功能的语音机器人,它面临着来自美国波士顿的强劲对手 Jibo。这款诞生于 MIT 实验室的的产品,拥有豪华的技术团队,既能情感互动,还能人脸识别跟踪拍摄。
但是,庄宏斌认为 Jibo 想要做的太多,把目标用户定位于家庭成员,难度会非常大。
“如果是定位于所有家庭成员的话,我相信其算法实现和开发的难度是非常高的。单就语音识别这一方面,年龄段不同的语音会差很远,在情感上表达的语义也会差很远。如果一个家庭里有小孩、青年人和老人,那么需要的模型难度是非常高的。而这仅仅是一个例子,我相信 Jibo 面临的复杂性要比这个高的多,这或许是 Jibo 一直在推迟发货的原因。”
庄宏斌认为,相较而言,Olly 的目标人群会更加集中,就是都市白领,其产品优势就是专注。他们摒弃了屏幕,在功能选择上更加集中,这让 Olly 快速实现了产品化。庄宏斌告诉雷锋网,预计明年年中的时候英文版的 Olly 就会上市,到明年年底则会推出 Olly 中文版。
Chelsea 告诉雷锋网,目前 Olly 的定价大约会在“高端智能手机和电脑之间”,也就是说,会比 iPhone 贵一些,但不及 Mac 的价格。
庄宏斌告诉雷锋网,Olly 的英文语音识别、语义识别等系统都是他们自己研发的,并没有借助第三方平台。当然,中文语音识别系统与英文还是有很大差别,他们正在考虑中文版的 Olly 与中国公司的合作。
但 Emotech 成立不到两年时间,最新版 Olly 的研发时间也只有半年,他们如何能够做出一款既能完成事务性功能,又能进行情感互动的语音机器人?
关于这个问题,两位创始人认为,这是由于技术团队成员本身有着多年的技术积累,另外就是与英国各高校实验室进行了很多合作。
Emotech 目前的技术团队有 5 名成员,领头人是 Pawel Swietojanski,这位毕业于爱丁堡大学的博士,主攻自动语音识别(ASR)领域,另外还有 2 名成员曾在苹果 Siri 项目工作过。
在高校合作方面,
“与伦敦大学学院(UCL)主要合作的是机器学习、帝国理工主要是类人脑的 AI 引擎、爱丁堡大学主要是语言的部分。”
庄宏斌本来就是 UCL 的学生,得到了来自母校的慷慨帮助。他们与 UCL 计算机系的负责人 John Shawe-Taylor 教授合作密切,“所以 UCL 的众多硕士、博士生都有参与到我们的项目中来”。
另外与他们合作的帝国理工 Murray Shanahan 教授是 AI 界的一位明星人物,他所著的《Embodiment and the Inner Life》,探讨了人工智能产生自我意识的问题,对电影《机械姬》导演影响颇大,因此也受邀成为这部电影的科学顾问。
所以,
"Olly 是在学校技术人员既有的研究成果之上,不断作出迭代和定制化调整......大半年的时间里,我们做的更多的是对用户的数据采集"。
庄宏斌提及自己当年从人人网离开,到英国留学并创业,就是看中了英国雄厚的人工智能技术积累。
CES 的四个奖对于 Emotech 来说是一个巨大鼓励,Chelsea 反复提到“兴奋”这个词。
300 多万台的 Echo 销量已经证明了市场对于智能语音机器人的需求,不过 Olly “个性与情感互动”的产品特色对用户来说有多大的吸引力,值得他们多花 4、5 千块钱去买,这要看市场验证了。对标高端用户,苹果做到了,大疆做到了,获了 4 个 CES 创新奖的 Olly 能否做到,我们拭目以待。
延伸阅读: