“智能音箱不足以成为第三代人机交互中心,第三代人机交互中心将会是机器人,”在2019 极客公园创新大会会后接受雷锋网采访时,优必选CTO熊友军这样讲。
在演讲中,熊友军用一张图展示了这一观点:机器人将会是第三代人机交互中心。而在前不久CES 2019上,优必选推出了Walker新一代,也为这一观点辅以产品原型。
熊友军认为,机器人要同时拥有机器的属性和人的属性。
所谓拥有机器的属性,是指能够代替人类,完成现在机器完成的一些工作;
所谓拥有人的属性,是指拥有人的智能,包括感知智能、认知智能和运动能力。例如,感知方面的语音技术、机器视觉正是模仿人类的耳朵和眼睛;认知方面的迁移学习、强制学习正是模仿人类的思维方式;运动方面的直立行走、手眼协调则是模仿人类的运动方式。
相较于最近火热的入口设备概念,熊友军认为,“(人形)机器人是人类与环境的接口。”从CES 2019上来看,机器人也再度成为今年一个热议话题,优必选也推出Walker新版本,三岁多的Walker也终于有了手臂,并辅以更多交互性功能。
在CES 2019上,优必选的主推产品Walker身高1.45米,拥有36个高性能伺服关节(腿:6x2,臂:7x2,手:4x2,颈:2),其中,双臂拥有7个自由度,据官方数据显示,在智能感知方面,Walker具有力觉、视觉、听觉、空间感知系统及能力。另外,辅以手眼协调能力,Walker可以实现端茶倒水,可以开冰箱取饮料。详见雷锋网此前报道:《解读优必选新一代Walker开冰箱取饮料背后的逻辑 | CES 2019》。
在CES 2018上,优必选曾展出其前一代Walker,相对而言,前一代Walker产品原型中并没有加入手臂,因而当时提的是「双足机器人」概念;此次加入双臂后,优必选将Walker新一代定义为「大型仿人服务机器人」。
优必选CTO熊友军
雷锋网:Walker增加了双臂后,在技术上主要进行了哪些优化?
熊友军:在运动控制方面,Walker新一代主要包括对直立行走进行了优化,提升了稳定性,让Walker能够适应在各种路面行走和外部冲击;手眼协调方面,增加双臂后,我们希望Walker能够能完成更多的工作,想要完成更多工作需要解决很多问题,例如现在机器人可以端茶倒水,实际上对于手眼协调技术的要求很高,我们也对Walker新一代增加了一些新的控制策略。
雷锋网:针对Walker接下来的迭代、技术更新,优必选会针对哪些方面展开?
熊友军:Walker从立项到现在才近三年的时间,所以目前还处于比较初级的一个状态,跟Atlas(波士顿动力的人形机器人)相比还是一个非常“年轻”的产品。针对Walker,我们制定了非常长远的规划,优必选最终的目标是希望它能够走入家庭。现阶段,Walker需要解决的还是进一步提高对环境的适应能力,其次是可靠性、稳定性的继续提升。
雷锋网:也就是说之后的主要研发方向还是在运动控制方面?
熊友军:运动控制需要持续不断地改进。
虽然Walker新一代在运动能力上距离大众对智能机器人的期望还有一定距离,但是在一年的时间内,相较上一版本,Walker新一代在运动能力和控制能力上都得到了一定的提升。熊友军也向雷锋网表示,其实大众对于人形机器人的期望还是太高,目前更应该对大众在技术上做更多的市场普及和教育,让更多人能够理解现阶段的人形机器人可以做什么,让更多人愿意与现阶段人形机器人交互,这也将会使得机器人在环境适应方面拥有更多的反馈数据,技术和能力提升也会更快。
现阶段的机器人,电源问题仍是个关键问题,此前雷锋网在各大展会上看到的国内外机器人团队,背后都会有一条长长的电缆(电源线),通过电缆接交流电进行供电。据此前Walker在CES 2019上的表现来看,Walker并没有外接电源,而是使用了电池供电,官方数据也显示,Walker采用 54.6V/10Ah/ 6kg磷酸铁锂电池,2小时充满电后,可以实现2小时持续供电。据此,雷锋网也寻求了熊友军在技术方面的解读。
雷锋网:Walker如何解决续航问题?
熊友军:机器人巨大的耗电量实际上主要来自于关节部位,伺服舵机是最主要的耗电单元,而它的耗电量又与效率有关。伺服舵机是优必选的强项,Walker的伺服舵机除了拥有减速装置外,在算法上也有非常好的控制策略能力。在这些方面我们做了很多优化,包括单个伺服舵机的驱动方式、机器人直立行走的算法、手眼协调的算法等,从而大幅降低机器人在运动状态下的耗电量。
雷锋网:您刚才提到伺服驱动占了耗电量的很大一部分?大概能占到多少?
熊友军:举个例子,机器人不断地在运动或做一些动作的时候,它的续航时间可以达到两个小时。而在固定不动的状态下,如果它的视觉和语音系统、操作系统都在运行,机器人可以正常工作8、9个小时,实际上伺服驱动占了非常大的耗电量。
雷锋网:现在大部分机器人的灵活性相对于人还是有一定差别的,主要是因为控制算法的问题吗?
熊友军:其中主要有两方面问题:算法问题、成本考虑。机器人之所以不能够完全像人一样运动,首先是因为它的关节不够多,人有好几十个自由度,机器人目前一般只有十几个自由度。虽然Walker有36个自由度,但还是不够灵活。如果想要机器人像人一样灵活,成本会上升,这样的做法是不是合适,能否被市场接受,是一个很重要的问题。另外,它的运算确实有一些难度,机器人如果有几十个自由度,对控制算法的要求实际上会很高。
雷锋网:会存在决策和计算能力放在云端导致延迟的原因吗?
熊友军:机器人的运动控制部分算法基本上不会放到云端,都是放到本地端处理。因为运动控制需要考虑实时性,每个关节都有一块芯片计算它做运动的控制,在机器人的主控制上也会有做决策调度、运动规划的东西。
优必选成立于2012年,初创团队以伺服舵机起家,早在2008年,其初创团队已经着手研发人形机器人的伺服舵机。从熊友军的解释中也不难看出,伺服舵机其实在整个机器人系统中,是非常重要的部分,无论是电源系统,还是运动控制系统,都会受到这方面的制约。而从现在业界备受困扰的电源问题来看,不仅需要在电源技术上寻求突破,在电源技术尚且难以满足需求时,还需要在伺服舵机,以及其他功能设计和结构设计上寻求降低功耗。
导航算法是机器人的另一块关键技术体现,现在服务类机器人主流导航算法是SLAM算法,也有诸多厂商根据这一算法进行了优化设计,并进行场景化应用,优必选采用的也是这样的套路,在SLAM算法基础上进行优化,形成自有的U-SLAM算法。
另外,开发系统方面,现在机器人采用的主流系统是ROS系统,但是由于ROS系统存在诸多问题,例如多为学术界使用,场景化应用存在很大问题,因而也为实际场景化应用带来了诸多难题。优必选在去年发布了自己的ROSA系统。
雷锋网:Walker机器人的U-SLAM导航系统和现在主流的SLAM导航系统有什么不同?
熊友军:目前市面上机器人大部分的视觉都是基于激光雷达导航技术,这种导航技术有一些缺点,第一,成本高;第二,对环境的要求高,不适合在家庭中使用,因为它检测不到玻璃,还有一些细的家具的腿是检测不到的。Walker融合了多种传感技术,不仅有激光,更多的是视觉方面的技术,能够让机器人的适应性更好。
Walker进入家庭中,它会在家中走一圈,基于它的视觉和激光传感器,针对整个家庭的环境建三维地图。这样它会知道门在什么地方、洗手间在哪、卫生间在哪,下次你跟Walker说,Walker帮我从冰箱里面拿一杯水出来,它自然而然就会知道冰箱的位置。
雷锋网:优必选去年推出了ROSA 机器人操作系统,这个操作系统相对于现有的ROS系统有哪些不同?
熊友军:首先,ROSA是基于行业的迫切需求而推出的机器人操作系统。优必选深耕机器人行业多年,我们知道整个行业缺什么。机器人研发的链条非常长,从底层的硬件到通讯、控制算法、APP,想做机器人创业实际上周期非常长、风险非常大。
我们希望能够推动产业快速发展,通过机器人操作系统把一些标准、技术集合起来,让更多的用户、机器人开发者、机器人爱好者可以使用,缩短他们的开发周期。ROSA集成了语音、运动控制、视觉、调控的策略,然后打包、封装起来,更具有智能性。
其次是模块化,如果你的机器人不需要视觉,就可以去掉视觉模块,让机器人跑得更快。还有一些标准,机器人跟应用层打交道,跟底层的硬件打交道,我们固化下来后,形成统一的机器人标准,进一步减少在交互资源上的消耗。
前文有提到,正是由于普通用户对机器人期望太高,机器人实际发展现状并无法做到一个机器人可以应用到各个行业,机器人供电问题、运动控制问题、场景化落地问题,这些问题都使得类似于电视节目中的智能管家机器人尚且难以实现。因而,熊友军认为,机器人其实应该首先落地于特定场景,谈到Walker2019年的计划,熊友军表示,首先会在科研和高校方面与相关厂商展开合作。
雷锋网:现在很多机器人是一个平板加一个外壳就投放到市场应用,您如何看待国内机器人市场的大环境?
熊友军:我觉得这是产业发展的必由之路,现在无论从技术、成本,还是市场接受度来看,都需要有一个过程,市场刚开始都是百花齐放、百家争鸣,随着技术发展到一定程度之后,一定会有几家公司来统领行业的发展方向,我认为优必选有机会引领产业发展方向。
雷锋网:Walker新一代在2019年会有怎样的商业计划?
熊友军:我们有自己的商业计划,包括未来Walker会在科研、教育、To B的场景中落地。
雷锋网:也就是说,之后会针对不同的场景推出不同的版本?
熊友军:对。
雷锋网:业内有一种观点,认为第三代人机交互中心应该是语音基础的应用,但是应用到哪个方向现在还没有确定。优必选认为第三代人机交互中心应该是机器人,中间还会不会有其他的产品形态、技术形态存在?
熊友军:有可能会有,但我认为它们不会成为第三代人机交互中心。很多人提到智能音箱,在我看来,智能音箱相对手机来说没有革命性的变化,智能音箱的交互方式更单一(只是语音),而手机还有图片、视频等等,但是智能音箱没有。我认为第三代人机交互,相对现在的人机交互应该是更多维的,可能会有更多的动作、感觉、表情,以及更多的人工智能技术。
雷锋网:可以理解为智能音箱只是加了一个语音功能,交互起来更好一点,但是不足以称之为是第三代人机交互中心吗?
熊友军:我觉得智能音箱是目前技术发展过程的一个产物,随着技术的发展,这些过渡性的产物终究是会被淘汰掉的。
CES 2019上的机器人再度引燃,除了让更多人再次关注机器人行业,也使得整个行业发展问题再次引起行业沉思。
熊友军在2019极客公园创新大会上,也再次解释,人形智能机器人发展将会有三个阶段:仿人、类人和“真人”,同时也提出了机器人发展的三大核心挑战:运动能力、感知能力和认知能力。
通过雷锋网与熊友军探讨,基本可以对机器人市场做出以下三个总结:
第一,用户期望过高,人形机器人还需要一定的发展过程,用户更应看清现有的技术发展阶段,并能够更多与现有阶段的机器人交互,这也会对整个产业有推动作用;
第二,在落地时,现有的技术还不足以支撑通用型机器人,更应该与特定行业合作,从特定行业入手,例如与金融行业推出符合金融应用的机器人。据雷锋网了解,现在整个行业也是这样发展的;
第三,第三代交互中心将不会是智能音箱,而是人形机器人,原因在于智能音箱并不具备像前两代交互中心那样具有颠覆性和多样性的能力提升,而只是语音技术的一个发展。人形机器人拥有文字、语音、视觉、运动等更多模态的交互方式,将会是第三代交互中心。
现在的机器人还处于弱人工智能阶段,我们更期望人形机器人成为人类伙伴。
雷锋网诚挚招聘AIoT方向记者 | 深圳:
工作内容:跟踪报道AIoT领域的公司、产品、技术和事件,包括物联网、机器人、智能硬件、智能家居等。
要求:1-3年相关媒体经验;能胜任外翻的英语水平;文笔优秀;良好的工作态度,对内容、科技有热情。
简历投递:投递邮箱:liufangping@leiphone.com,或添加微信:liu_fangping。
欢迎对AIoT领域感兴趣的小伙伴咨询/加入。
相关文章: