目前世界上大部分机器人都是咖啡机那样的功能型机器人,这和Cynthia Breazeal的作品截然不同。她的作品中有机器玩具熊Huggable、长着大眼睛红嘴唇尖尖耳朵的Kismet、蓝眼睛娃娃脸的Nexi、和长得就像一只毛茸茸松鼠的Leonardo,以及外形类似更小一点的Furby。
Breazeal和她的学生已经在麻省理工学院媒体实验室开发了多年的情感交互机器,她认为现在是时候让个人机器人进入我们的家庭,提高我们的生活质量了。为了实现这一目标,她在波士顿成立了Jibo公司,并且成功募集到了3860万美元,用于生产一种友好的家庭机器人助理。
他们的机器人就是我们熟悉的Jibo,配置有相机和麦克风,长得就像是一台桌面风扇,大小也不过烤面包机大小。它能够识别人脸和语音,并且还能用萌萌的声音作出回答。Jibo的目的是帮助忙碌的家庭成员之间更好地彼此交流以及与外界通信,比如说每天早上提醒父母或孩子当天需要完成的任务。你可以告诉Jibo今天你需要完成什么,然后它就会在你忙着做早餐的时候,帮你更新日程安排或待办事项列表。Jibo还会在聚会时自动拍摄照片,给小孩阅读互动故事,还能帮助老人拨打视频电话。预计2016年三月到四月份,Jibo的第一款产品就将出货,最新一批Jibo的单个预售价为750美元,而早在去年8月份它们就已被抢购一空。Breazeal说:
“我们这个时代,说到技术就是数据、数据、数据。社会机器人就是说‘是的,我们拿到所有的数据了。现在就让我们把注意力放在用户体验和与人的交互上吧’。”
确实如此,尽管Jibo和Breazeal以前的作品不一样,没有小狗样的眼睛和柔软的皮毛,但它看起来似乎真的有自己的个性。它可以它那脸一样大的大单眼直勾勾地盯着你,发出萌萌的机器笑声,还能栩栩如生地转动自己的身体。她说:
“关键不是它能做什么,而是它怎么做。”
Breazeal希望Jibo可以成为人们的家庭伙伴
可以肯定的是,拥有一个真正有用的、有能力的还足够可爱的个人机器人,是很多人长久以来的梦想(Roomba当然不算,除非你喜欢对着吸尘器说话)。40年来,企业家们一直在不断推出各种各样的家用机器人,但几乎所有的产品都很快销声匿迹了。即使是索尼推出的著名机器狗Aibo,尽管有那样大张旗鼓的造势宣传,但最终还是遭遇了商业上的失败。
而现在必要的技术已经比过去更好更便宜了,给智能手机和游戏机制造商提供组件的行业也在为新一代家用机器人制造商提供组件。除了功能强大的低功耗微处理器,这些组件还包括帮助探测人和物的三维传感器、帮助导向运动的加速度计和陀螺仪,以及更加轻便的锂电池。
这一新兴领域的参与者既有初创公司,也有大型企业。2014年,日本电信巨头软银开始销售人形机器人Pepper,其主要的设计用途是用于接待。今年7月,法国初创公司Blue Frog Robotics也计划开始推出其第一款机器人Buddy,它就像是一个带轮子的Jibo。另外,中国也出现了一众机器人制造商,它们的产品方案也大致类似。
有如此之多的竞争对手,Breazeal的机器人能够脱颖而出吗?The Robot Report网站分析师认为答案是肯定的。他认为Jibo是“社会机器人市场的游戏规则改变者”,并指出该公司不仅拥有一个由优秀的机器人专家组成的团队,而且还拥有语音识别、人机交互、游戏和动画等领域的优秀人才。另外还有一个让他觉得Jibo会成功的原因:他曾把Jibo机器人的宣传视频给他的妻子看,她表示“任何能点中国菜的设备都是赢家”。
Jibo公司副总裁Andy Atkins正在调试一台早期的原型机
其它人对此就没有那么热心了。媒体专家评价Jibo是“带动画的灯罩”和“造型别致的闹钟”。《时代》杂志评论说“不确定你是不是真的需要一个”,更何况Jibo能完成的工作基本上用智能手机也能做。而科技媒体GeekWire则从隐私和安全方面评论说:“把一个联网的、可以电动控制的摄像机放在我女儿的床边?想都别想。”
Breazeal泰然接受了这些批评,她承认Jibo推出时将只带有很少几种应用程序(她称之为“技能”),但Jibo本身是一个开放的机器人平台,开发者可以基于该平台实现更多的功能。她肯定地说新应用将会逐渐增加Jibo的用途,并且还有望使其拥有一些现在无法想象的“技能”。而在隐私和安全问题上,她的团队也一直格外重视。
从消费者的角度来看,目前一切还进展顺利。截止12月,Jibo通过预售的方式已经在Indiegogo上众筹到了370万美元。考虑到该项目众筹开始时,Jibo机器人还只是一个不能执行任何任务的粗糙原型,这样的众筹成绩真称得上是十分惊艳。Jibo已经推迟了原定计划的上市时间,Breazeal知道她和她的团队需要兑现自己的承诺。“现在就是在埋头苦干,”她在接受IEEE Spectrum的采访时说道。
Jibo的第一款原型机看起来就像是一台智能手机黏在一个饮料罐上面。有的型号顶部还支出了一根卡通化的天线。而现在我们能见到的外形设计是Jibo团队和旧金山一家工业设计公司合作之后的产物,看起来圆滚滚的,又小巧玲珑。它内部拥有大量的电子部件,包括高分辨率立体相机、六个麦克风、一对音箱、一个LCD触摸屏、两个冷却风扇、WiFi和蓝牙模块、LED灯、触控传感器和运行Linux系统的ARM架构的嵌入式处理器。
Jibo设计中最巧妙的部分应该是其身体结构。它包含三个大致圆柱形的结构,分别用作基座、躯干和头部,它们之间按一定的角度连接在一起。最终导致的结果是当机器人转动时,这三个部件之间也会发生相对移动,表现出各种各样的姿势。旋转动作是通过机器人体内的三个直流电机和传动带共同完成的,整个过程非常平稳,也不会产生噪声。
要让机器人的运动模式正确需要大量的工程学工作。在早期原型机阶段,各个部件在两个方向上都只能运动较少的距离,这就限制了机器人的活动空间,并且让机器人的运动看起来非常不自然。为了让机器人能够连续旋转,Breazeal的团队以更为紧密的方式重新配置了电子和机械组件。线材也都选择从机器人身体的中心穿过,这样机器人旋转时也不会影响到些线材。解决机器人运动问题的Matt Berlin说,Jibo现在“感觉更加流畅和放松了,比如它可以很流畅地从一个姿势切换到另一个姿势,中间没有任何停顿。”
最后,如果Jibo所带来的用户体验果真是完美无缺的,那么它将毫无疑问取得成功。而用户体验还极大地依赖于机器人的语音识别和分析技术。这是个比较大的挑战:如果用户选择跟机器人对话,那么他一定期望这个机器人是足够智能的。
“人类对话和使用结构良好短语的Siri或Google Now请求不同,”西雅图医疗机器人创业公司Hoaloha Robotics创始人Tandy Trower说,“当我们彼此交谈时,我们会借助大量的语境信息帮助我们理解彼此的谈话。”换句话说,Jibo这样的机器人不得不将更多的语境信息囊括在内,这样才能带来开放式的对话。
这并不简单。Breazeal说Siri和Google Now采用的将语音传输到云端的处理方法并不适用于机器人。基于云的语音引擎会产生延迟。更糟的是如果Jibo失去了WiFi连接,它就没办法作出回应了。另一种方法则是把语音识别放在本地,放在机器人身上。而这也并不是一个好选择,因为这必将成为机器人CPU的沉重负担。尽管Breazeal并没有透露他们所使用的方法,但合理的推测是Jibo使用的是上述两种方式的混合:本地语音处理可以实现一些基本功能(比如,用户可以简单说一句“wake up”唤醒机器人),而云计算则用来处理更为复杂的语音识别任务(比如基于语境的对话)。
Breazeal也提到她的语音处理工程师正在打造一个新的自然语言处理模型,该模型可以让Jibo以一个迷人的方式作出回应。他们还给Jibo设计了一个特别的声音,该声音建立在一位配音演员录制的14000条短语的基础上。基于此,一个文本转语音的引擎可以生成数百万条语音表达。但她表示Jibo说的话只是其真正表达的一部分——它还会使用肢体语言,也会通过改变音调来暗示高兴、悲伤或惊讶的情绪。
Breazeal还承诺说,随着时间的增长,Jibo还将了解到更多使用者的个人信息,进而提供更为个性化的用户体验。她补充说,之后人们就不再仅仅将Jibo看做是一个工具了,而会将其视作自己家庭的一分子。这也是她最美好的梦想,而这也是机器人行业所能带来的最持久的遗产。
但这遗产到底是好是坏还取决于你在向谁发问。Breazeal在麻省理工学院的同事Sherry Turkle在其2011年发布的新书《Alone Together》中写道:“机器人专家会说人类和机器人交流并没有什么坏处;这些交流可能很有趣、很好玩、有教育意义或能抚慰人心。但我却感觉并不舒服。一个被人们当做朋友的机器贬低了我们口中的友谊。我们喜欢的人、喜欢我们的人——是这些造就我们自身。”
Breazeal回应说社会机器人并没有打算取代人类的友谊。事实上它们还能为人与其他人、宠物、孩子甚至玩具之间的关系增光添彩。她说:“所以创造和探索这种新形式的关系并不会与任何已有的其它关系产生竞争。对我来说,像社会机器人这样的事物的价值看法是它们并不是人——它们与我们不一样。正因为如此,它们可以帮助完善我们自身,而这才是真正有趣又有价值的地方。”
via IEEE Spectrum