8月7日-8月9日,2020年全球人工智能和机器人峰会(简称“CCF-GAIR 2020”)在深圳如期举办!CCF-GAIR由中国计算机学会(CCF)主办,香港中文大学(深圳)、雷锋网联合承办,鹏城实验室、深圳市人工智能与机器人研究院协办,以“AI新基建 产业新机遇”为大会主题,致力打造国内人工智能和机器人领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。
8月8日上午,在「机器人前沿专场」上,大道智创联合创始人龙建睿博士进行了题为「机器人导航技术的通用平台和垂直场景」的演讲。
龙建睿是伊利诺伊理工大学博士,哈尔滨工业大学本科。2015年开始负责机器人自主移动系统的研发,专精于视觉/激光SLAM算法、导航与控制算法和多传感器系统架构,致力于通用场景下可靠、轻便、零部署overhead的技术方案。持续在安防、智能工业/农业、清洁防疫、物流配送和信息分发等各种场景下探索低速无人驾驶技术的商用可能,主导推进的e巡安防巡逻机器人、DDR移动零售机器人、防疫机器人、移动信息发布机器人和CS一体化智能牧场机器人等产品目前已成功落地,并具有完全自主知识产权。
大道智创是一家专注于研发安保机器人的公司,主要研发和销售巡逻机器人、安保机器人等商用服务型机器人,以视觉定位为主,配合多传感器融合,在复杂环境下实现全自主定位巡航。
以下是龙建睿博士在大会的演讲实录,雷锋网作了不修改原意的整理和编辑:
大家好,我的分享主要围绕机器人导航技术展开,从通用平台和垂直场景两个角度去理解,以及提供我本人的一些判断。
机器人“动”起来
这次讲的主要是移动服务机器人而不是工业机器人,因为那不是我们的专长。此外,我们希望机器人能“动”起来,能为我们提供处理问题的服务,因此也不讲固定机器人。在过去几年,我们看到很多机器人在不同的场景服务人类,但服务局限于交互服务,如人脸识别、语音识别、对话、迎宾等。相反,我们探索的是机器的自主运动服务。因为人类一个非常重要的功能就是行走,要在物理世界互动。机器人需要扮演的是一个跟物理世界互动的角色。张宏院士提到定位导航,即我在哪,机器人需要知道我在哪,然后知道自己要去哪,因为这是它能够开展服务的一个核心。但是我们先不谈“我是谁”,因为这是强人工智能的问题,这是终极机器人的答案,我们现在暂时无法回答。接下来我会提供一些自己的想法,即我们认为它有什么、猜测它会变成什么样,但是我们不能断言它具体是什么样子的。
服务机器人行业的市场规模大概如下:
如上图所示,全球服务机器人的规模是100亿美元左右,而且还在快速增长,中国在全球的占比也是不断增长,速度加快,但最关键的一点是,服务机器人正围绕着“我在哪”和“我要去哪”这两个核心问题发展出了一系列应用。
现在已经有很多基于传统AGV的新应用出现,比如商用清洁、配送、安全巡逻、现代农业等(如下图):
上图展示了机器人在许多场景下的应用。
最左边的三张图是相对传统的行业应用,如搬运机器人,如变电站与核电场内的巡检机器人。以及左下角是现代农业的自动化推料机器人。这三张图跟其他应用的不同之处在于:左边的场景离我们的生活稍微有点远,我们并不用每天去仓库,可能也被禁止进入核电站。右边这三列诠释了近几年的应用变化。服务机器人进入这些环境,已经是跟我们进行零距离接触了。我们家里可能会用小小的扫地机器人帮我们扫地,在商场会看到商用清洁机器人为大环境进行清洁,也看到一些零售服务机器人和信息广告分发机器人,它们能在商场或更大的环境里自主运行。相信很多人也见过送餐机器人,它可以让繁忙和需要人力的行业慢慢变得高效。右边三样是室外机器人的应用,如物流配送机器人、巡逻机器人、零售机器人。
服务机器人的应用场景越来越丰富,所处环境的变化越来越多,而人类能对它进行的改造其实越来越少。怎样才能打造这么一些系统呢?我们相信真正有效率的办法是找到这些机器人的共性,平台化,让它扩展。
上图顶部的场景就像是一棵树的枝,底下是我们想到的通用的平台和模块。一个机器人系统可能有非常多这样的模块,那么它们之间有哪些共性呢?我们应该怎么看待每一个模块呢?它们是更容易通用化的东西,还是需要非常多细致的定制呢?接下来做一些简单的介绍。
1. 运动平台
首先,移动服务机器人肯定有一个运动平台,涉及到“海陆空”三军。我们看到天上飞的、水里游的、地上走的,似乎都有两种模式、能跨越各种地形的足式的机器人。如果我们是一个小小的爱好者,或者是小小的创业公司,要做产品,需不需要从头开始搭建一个机器人品牌呢?不需要。我们可以去找通用的平台。
目前看起来,许多工作已经开始往平台化、通用化的方向努力了。比如智能驾驶汽车,里面线控与其他部件的标准已经非常固定、非常成熟。那是否意味着运动平台作为运动机器人的核心已经固定地通用化了呢?其实不是,因为我们看到机器人的一切服务都是在场景当中,运动平台自然是要为场景服务,我们没有办法让轮式机器人到天上去巡逻、去追踪,也没有办法把一个无人机放在海里面。
比方说,最左边的两个机器人都可以运动,都是驶轮式的,控制可能也都比较简单,可以原地旋转。但是我们可不可以在室内使用坦克一样强壮的机器人呢?理论上是可以,但是它的预算、功耗、对环境的干扰和影响有可能是灾难性的。所以我们在高端的写字楼里应该不会看到这么强壮的机器人。或者说,如果要在小区里、公路上、开放道路上做巡逻,我们可不可以用左上角的机器人呢?好像也不可以。这就造成一个问题:好像就连这么一个简单的运动平台,也没有办法完全通用化,而更多是一定要根据场景进行选择。
上图所示是一些比较传统的定位导航设备,如轮子里程计、惯性测量单元和GPS。相对于前面的环节来说,它的通用性会更好一点。但是,如果我们要做机器人服务的产品,那些这些东西的选择一样是有非常多的考量,比如制造的成本、性能和成本的平衡。
接下来这几类传感器是近几年比较热门的:
激光雷达可以直接探测周围环境物体的位置和距离。右边的摄像头看起来很不起眼,但擅长追踪物体和环境的纹理信息。这两种类型的传感器最大的特点是信息量非常巨大,可以提供各种各样的冗余。好像这样的传感器配上开元算法是不是就解决了导航所有的问题呢?是不是就可以判断它是通用呢?其实不是。
我们看左边的激光雷达。提到“激光雷达”,大家认为具体是指什么样的雷达呢?是平面雷达还是360度的3D雷达?如果是3D雷达,又是多少线的?还是那个不怕振动但是视场角有限的MEMS雷达?你要的雷达是美国人生产的还是中国人生产的?需要的是第几代雷达?这是一系列非常细致的问题。即使确定了这些,我们也会发现后面有一些跟算法紧密相关的问题。
视觉则更复杂。单个摄像头可能看起来简单一点,但是引入立体视觉(机器人系统中非常常见的设备)之后,就有非常多具体的问题,比如分辨率、精度、曝光时间。像立体视觉还有基线的问题,基线长的话可能探测的时间越长、越远,甚至还有一些混搭的玩法,比如右下角360度的鱼眼的全景摄像头能不能跟其他传统摄像头进行配合?这一系列的东西听起来更像是为了场景设计出来的部件,而不是通用的部件。由于激光雷达和视觉系统的误差、模型、定位的精度不同,而且又有一些互补,所以现在出现了第三类的、介于两者中间的混合型产品(如RGBD相机),可以同时提供纹理和比较精确的深度。有些创业公司把激光雷达和一个或多个摄像头配合在一起,通过非常高级的算法和定制化的芯片直接计算出非常长距离的、非常高精度的深度信息和RGBD信息。这里列出来的设备范围有限,但是我们看到过这样的创业公司会做出非常远距离的深度相机。这些都是优化的方向。那它们之间有没有通用呢?有没有共性呢?有,但还是以场景导向为主。
2. 计算平台
接下来讲到较有通用性的计算平台。从嵌入式到PC,再到汽车上使用的自动驾驶器和超级计算机。我们也希望这些东西是机器人系统里面最容易被通用化、最容易被广泛推广的。
下面是定位导航的核心软件。我们做机器人导航与算法优化经常会听到客户、投资人、爱好者或其他人问的一个问题:这些东西不都是开源了吗?这些东西都已经是造好的轮子,你们为什么要自己去开发呢?
我讲几个简单的对比。现代的数学其实是几百年前就已经开源了,那我们能够用几百年前的数学做出机器人或者人脸识别的机器吗?不能。数学就像一个万能的轮子,但是你要把这个轮子打造成自己想要的样子。这里就是我们做定位导航和算法优化要考量的地方。首先是开源还是闭源?其实没有软件可以完全不依赖于开源,或者只依赖于开源。它一定存在非常多定制化和场景适配的问题。从开源到闭源,中间的平衡掌握恰好是一个机器人公司,特别是做底层技术机器人公司真正有价值的地方。在这个探索的过程当中形成对场景、场景配置和模块组合的理解,还有对从业者本身优秀的直觉。这些理解的价值远远大于产生酷炫好看的demo。
另一个问题是:可配置化和可替换组件是一种好的方式吗?还是用一体化和傻瓜化的东西?这里我想举两个例子。如果有一把瑞士军刀,现在伸出来是螺丝刀,但是我希望它马上变成开瓶器。我想这个是非常容易的,只需要把另外一边拔起来。它是一个可配置化的产品,也是一个可以替换的组件。但我们卖给用户的一定是这样的东西吗?再举个例子:最近有一种比较火的化学物质叫硝酸铵,它可以配置成高效率的氮肥,也可以配置成非常凶猛的炸弹。那我们要把这么一种东西交到用户手上吗?这一切都非常依赖于你对产品的定义、对产品使用场景的限制,还有中间缺失的某一种运营的环节。
还有一个问题是:端上的功能还是云上的功能?这涉及到算力分配。我想这以后慢慢会变成协同,但是协同的界限在哪里?哪些东西是需要实时、马上、立刻、快速处理的?而哪些东西可计算量不大,不用占据我太多资源,我也不着急用的,我也可以慢慢交给云?随着通信系统的变化,界限也会慢慢推移。
3. 环境改造
环境改造是机器人行业关注的又一个话题。人类在适应环境的过程当中学会了改造环境,这是人类与其他动物不同的地方。人类不会认为什么都不穿,就靠人的肉体的改变就能适应从南极到北极再到赤道的不同温度。我们是把环境按照人类自己的需求进行改造的。为什么机器人不可以呢?其实机器人已经在享受这样的好处了。比如说火车,说起来好像跟机器人没有关系,但是火车配备了各种各样的自动化系统,已经不是完全依靠人在开了。接下来是改造铺装道路的问题。原来的铺装道路改造只把限越野车开的地方改成小汽车和电动车都能轻易行动的地方,但在未来,车联网和智慧城市的概念会对环境进一步改造,使环境更适合机器人。
未来的改造也会越来越友好化,没有那么有侵略性。就像GPS,它是不是改造了环境呢?答案是肯定的。它的卫星分布在天上,对我们的生活影响没有那么直接,这就是非侵略性的改造。我们看到的仓库环境,甚至一开始都不能叫改造,而是建设,用二维码、视觉特征和电磁特征来引导和定位。上图最下面一行中间偏左的图是很多年前的送餐机器人,脚下是有轨道的,这是对环境的改造。为什么呢?因为如果不做这样的改造,那时候的技术很难让它稳定的定位运行。现在环境增强需要对环境改造到什么强度呢?我们在房顶装几个小小的地面站,或者是在天花板上装一个视觉特征。这个视觉特征甚至是红外的,人类肉眼看不清。人类润物细无声地改变环境,让环境保持对人友好的同时,也对机器人更友好。我们的初心是制造有用的、零部署的、不需要改造环境的机器人。但我们目前还没有办法保证完全不改动环境就能让机器人运行。右下角显示的是门禁和梯控机器人的场景,这些场景也需要简单改变环境,但是没有那么有侵略性。
上图所示的协同调度系统适用于大规模的机器人,能使无人机跳舞,管理运输机器人,协同多个机器人同时完成多个任务,或是控制无人车队。这些运营努力是建立在对场景的理解和软硬件的基础设施上。
关于通用还是垂直,我们有几个比较粗浅的判断:
第一,垂直应用仍然是机器人行业(尤其是服务机器人行业)的主流和驱动力。我们不可能在脱离场景的前提下去谈酷炫的算法、开源和取代。
第二,机器人产业的链条会变得更长,具有更多的环节,每个环节本身内部可能出现比较多的通用性。比如前面所说的惯性导航元件于GPS接收器,这些已经开始在内部通用化,接口非常标准一致。它聚焦的是更小的地方,像一个链条越来越长,每个链条上的东西越来越漂亮,越来越牢不可破。
第三,场景会更加协议化,环境改造会对机器人更友好。场景改造会借助新基建和智慧城市的努力而使服务机器人的市场更加繁荣。
第四,机器人的应用运营会越来越重要。什么是应用?我们发现,学界或产业界向终端客户推广产品时,他们好像有各种各样的不情愿。我想不是因为威胁到了他们的工作,而是产品使用很麻烦。在机器人解决强人工智能的问题之前,终端用户可能不愿意用机器人产品。哪怕点一下鼠标、按一下开关,都是增加他的工作量。如果好处还不足够大,给他们增加简单重复的工作更没有意义。这时候,我们猜测中间可能会出现一个类似于手机用户和华为、中兴设备生产商中间的运营商。
影响因素
但上述判断也会受到一些重要因素的影响:
1. 通信技术
新一代通信技术带来最直接的冲击之一就是机器人部署方式的革命。我们以前推广的机器人需要巡逻,需要在场景里面做构图。在这些步骤完全自动化之前,谁来完成呢?其实是我们自己在完成,因为终端客户是不愿意配合你做这个事情的,他们觉得很麻烦。那我们的人是不是需要到物理世界进行复杂的部署和后续的维护?但是如果有了更快、更可靠、更低延时的通信手段,就可以像上图这位大哥一样,坐在几个屏幕面前遥控汽车和机器人,遥控进行对机器人的维护。
第二点是混合智能,即人和机器结合的智能。机器人不可能百分之百稳定地工作。那么机器人不稳定的时候,谁来维护?我们可以通过远程可靠的通信网络来解决机器自己没办法解决的问题。
这又涉及到云计算的问题,它可以抹平算力上的差别。另一个是人工智能技术,比如语义SLAM技术。语义SLAM技术不再将场景理解为简单的点云、像素、纹理,而是理解为物体及物体本身的性质,如物体可不可以移动、是长久存在还是临时存在、会不会发生光照变化、会不会发生体积变化(像一棵树)。这些都是AI比传统的几何SLAM更擅长做的事。这也会带来更强的物理互动。还有一点系统本身的复杂化、非线性、强非线性甚至是混沌效应。传统的手工设计的方法可能已经不是很适合应对这些问题。那怎么办呢?通过强化学习、深度学习,让机器人自己跟环境互动、学习。
2. 新基建和智慧城市
新基建与智慧城市会让机器人和人都在更友好的环境下行动。机器人进电梯就是在实际生活中会遇到的问题。每一家电梯都有协议,且电梯作为一个非常重要的安全设备,不能随便Hack进去,这是被禁止的。那么,谁有能力来推进标准的统一,使得一个机器人在一部电梯上行动之后,就可以在另一些电梯上行动呢?那一定是业界、政府、学界的共同努力。在未来的智慧环境中,机器人还可以扮演其他角色,比如数据采集者和治理的执行者。
3. Covid-19和公共卫生方面的挑战
今年疫情下,每一家公司都说自己能做防疫机器人,喷药、紫外线杀毒、探测人体温度、发烧识别等等。我们能从中得到什么启示呢?在处理重大公共卫生问题时,可以让机器人选配功能,装什么能消毒、装什么能识别温度,然后慢慢变成标配。服务机器人作为公共卫生产品是必要还是蹭热点?这仰赖于产品设计和运行。
4. 国际政治的挑战
机器人在物理场景行动,可以采集很多信息,所装载的数据会因为政治原因变得更敏感,需求也更分化,网络安全问题也会成为焦点。对底层的开发人员来说,算法的开源和核心器件的生产和销售也都面临着政治化的挑战。我们看不到红线在哪里,机器人运营也备受挑战。
服务机器人的未来
服务机器人首先要对场景有一个非常垂直的理解,包括对场景的定位、导航、服务、后台的连接、客户的交互,打通各个环节。然后走创业的方向,现在的方向主要是在机器人配送和机器人清洁两方面。雷锋网
其次可以做系统适配和平台化。就是用自己的技术做机器人,配合合作方推向市场。但是,我们就不再花大力气做具体的运营和落地。雷锋网
还有一个方向是制造关键设备,比如智能驾驶、智能芯片、定位导航的模组。这个方向对技术研发要求非常高。
最后是机器人运营商。这也是非常关键的合作方。 它的存在既加速机器人的落地推广和反馈推进机器人的迭代,也方便终端客户和普通大众接收和享受机器人给我们生活带来的实际便利。雷锋网