有肖健雄的地方,就有关于摄像头方案的讨论。
在自动驾驶行业,肖健雄的名字几乎已经与摄像头方案绑在了一起。以往的报道中,我们看到最多的是这位 CV 界权威对摄像头方案一贯的笃定和推崇,也因此,在激光雷达代表着“技术正确”的自动驾驶领域,人们对于从实验室走出来的研究者究竟能不能顺利完成商业化转身,总是怀着一连串问号,虽然我们知道,这位被称为 X 教授的学术大牛是三维点云深度学习的开创者,是普林斯顿大学计算机视觉和机器人实验室的创办人,也是 ECCV 最佳学生论文奖和 Google Research Awards 得主。
前情铺垫是,2016 年 6 月,从普林斯顿大学助理教授职位离开的肖健雄在硅谷创办了自动驾驶公司 AutoX,团队组建 6 个月后,就改造出了一辆自动驾驶原型车,公司发布的路测视频中,开头便是“USING ONLY CAMERAS”的醒目标识,这辆仅搭载 7 个摄像头的林肯 MKZ 在 2017 年初完成了 AutoX 的自动驾驶首秀。
创业两年后,这位在学生和同行口中获得无数称赞的 X 教授频繁用“exciting”来形容眼下的状态,“速度”“商业化”“大众”“LBS 运力”是贯穿整个访谈的关键词。你问“之前一直坚持摄像头路线的 X 教授也使用激光雷达了,这是在妥协吗”,他说:“没有任何变化”;你问“商业化落地的哪个环节最重要”,他说“没有一个环节不重要”;你问“又有哪个环节最困难”,他说“每一个环节都困难”......这不是面对媒体的太极打法,而是如他自己所说,从大学教授到创业公司 CEO,在发现问题、解决问题的日常进阶中,他自己也在发生着变化。
自动驾驶的商业化起点:互联网下半场的运力之争
在肖健雄教授的阐述中,自动驾驶与互联网的用场没有本质分别,两者都属于基础的生活设施建设,为各种日常应用赋能。互联网只有应用领域之分,而不具指某家公司,自动驾驶也是一样;互联网有电商、外卖、打车、旅游等垂直化应用,自动驾驶也会有园区车、扫地车、乘用车等不同落地方式。
“互联网的竞争已经进入下半场,其中,LBS 是近几年被革命化的新领域。LBS 的上半场是互联网算力之争,但效率已经提升到极限,下半场其实就是运力之争,谁的运力强,谁就占领市场。”
“运力的主要问题是'运力池'不足,限制了业务发展。现在的外卖或打车业务量其实可以进一步增长,只是没有足够多的人去送、去开车,导致价格太贵。如果'运力池'更大,整个服务会更好,大家的用量会更上一个台阶。”这是肖健雄的基本判断。
所以,今天我们所看到的出行和运输瓶颈并非需求的饱和,而是运力的匮乏,并非平台的独大,而是成本的可压缩空间已接近极限。
“所谓自动驾驶其实不是来代替人类工作,而是让这个'运力池'增大。”这是 AutoX 的商业主线,肖健雄将其阐释为“平民化自动驾驶”,即让自动驾驶连接城市衣食住行等日常需求。
三条落地路线
根据这些,AutoX 给出了基于三款无人驾驶车的 LBS 解决方案:同城低速物流配送车,同城全速物流配送车,和同城 L4 自动驾驶乘用车。
“我们想快速把 L4 落地。在这个过程中,如果做别的也可以,但中间停太多站反而会减慢速度。”肖健雄就此解释了其对 L4 而非辅助驾驶或 L3 方案的青睐。
AutoX 的低速配送车类似之前京东、智行者推出的园区自动配送车大小,因为速度较低,体积较小,安全可控性也相对更强,全速配送车则更像一个移动的蜂巢快递柜。目前,AutoX 的低速送货车队已经在深圳某园区试运营,到今年年底,车队规模将增加到上百台,而目前仍在内部测试的全速车(包括送货车和送人车)到时也将上线试运营。
但今天的技术成熟度是否足以支撑城市道路上 L4 自动驾驶技术的落地,这款自动驾驶乘用车又如何进行商业化定义?
肖健雄表示,车辆会率先以固定路线巴士的形式出现,由此道路情况处于可控范围内,车辆运行难度也会相对降低。“L4 的难点就是测试问题,如果搞成滴滴,确实很难,因为整个北京城,任意两点之间的每条路得测试很多遍,这样算起来,路的数目就很大。固定路径的话,你一上来就 50 台车来测,测一年,我觉得已经测到比较有信心了,该见到的东西都基本见过了。”
*左为低速配送车,右为全速配送车
还是摄像头为主
之前,肖健雄曾在多个场合强调摄像头为主的传感器方案,这是基于其对技术快速落地的商业化考虑,“够便宜,用户才能接受”,也来自其对摄像头功能演进的信心——算法的优化可帮助弥补摄像头的现有缺陷。
但这次 AutoX 给出的技术方案不仅使用了摄像头,也出现了激光雷达:在低速车型上,车辆两边各放一个广角摄像头,前后各放两个摄像头,并配备一个速腾的 16 线激光雷达,包括车辆在内的整体成本在 1 万美元左右(非量产);全速车型上,团队则设计了一个由 8 个单目摄像头组成的 360 环绕组合,并使用了一个 40 线激光雷达。
摄像头组合的想法是初次在自动驾驶公司中实现,AutoX 团队从几百个摄像头中选出了 8 个单目摄像头,完成了整体设计,成本在 300 美元左右(非量产),内部的摄像头分布,日后也可根据适配车型进行调试。
关于激光雷达的作用,目前有两种主要论点,一种认为其是车辆感知的必要配置;一种则认为激光雷达仅仅是作为冗余存在,自动驾驶车辆运行的主要工作依然要靠摄像头来完成,如 Mobileye CEO Amnon Shashua 就曾在多个场合阐述这种主张,显然,肖健雄也是后种论断的支持者,所以也坚持不会在现有基础上使用更多激光雷达。
“加入激光雷达首先是为了必要的冗余,但大家的意识也被谷歌训练了,觉得头上有个顶很重要,要是没有,人家反而觉得不好,就算藏在车身里,他也不敢坐。”一直强调“要榨干摄像头性能”的 X 教授并没有放弃自己的“初心”,这次访谈中,他也展示了团队在强化算法的基础上完成的摄像头测试,包括雨天、黑夜、太阳直射等多种情境下的优秀感知效果,与普通的激光雷达相比,其对远距离物体的探测也表现出了明显优势。
“其实现在摄像头技术是非常成熟的,而且非常廉价,比方说它的动态范围可以很高,有的甚至超过人眼。当然肯定不能乱选,要选对的。我们团队有很多视觉领域的专家,有多年的行业经验,会选择最高性能的摄像头。我觉得未来的前景肯定是摄像头越来越强。”
当然,对摄像头的执着仍是源于成本优化的考虑,肖健雄也表示,摄像头与激光雷达并非对立面,只是各家的算法有差。
在 AutoX 的自动驾驶车辆上,还设置了一个 LED 显示屏来告知车辆状态,与外部车辆、行人交互。而这类交互设计也已经被越来越多的公司接受和使用,最近宣布即将落地自动驾驶打车服务的 Drive.ai 也使用了类似的外部设计。
正确决定
与从事学术研究的漫长生涯相比,肖健雄创业仅仅只有两年时间,但在他口中不时发出的却是“创业走了很长路”的感慨,让他振奋的是团队“效率越来越高,打法越来越清晰”,而如何更快完成产品化落地,让用户接受这项新技术也是他每天需要重复思考的第一命题。
快速落地,快速进入实际场景应用,快速获取大量数据,确保公司和技术都“不是活在真空里”,他用这几个“快速”追赶行业,也催促自己,却很少显出疲态。
“我很兴奋,我特别看好这个,我觉得选中创业是很正确的决定。”
以下为雷锋网与肖健雄教授的部分采访实录,雷锋网做了不改变原意的编辑:
雷锋网:现在 AutoX 把重心放在了 L4,但之前您对 L4、L5 的预期好像还是比较保守的。
肖健雄:现在也还是比较保守的,很多人说到 2020 年就有大规模的自动驾驶车了,我觉得很难达到,固定路径落地会更快,但城市的任意两点,2020 年是达不到的,我现在还是处于保守的那一帮。
雷锋网:到底是先做 L3 还是 L4,如何看待这两者的争议?
肖健雄:L3 其实基本上就是 L4,做 L3 的基本上要做到 L4 水平,然后把它倒退回来,用在 L3 上。很多业界的人觉得 L2、L3 跟 L4 是不可融合的,我觉得是可以的,而且是必须的。我觉得 L3 只是面向 L4 的一个中间步骤,关键是用不用这个中间步骤,这就要看和具体商业合作伙伴的碰撞。我们不是说完全不做 L3,我们现阶段重点是在做 L4,但这个技术上我们觉得是通用的。
好的 L3 一定能基本上达到 L4,因为 L3 就是我们说的,可能有 10 秒钟 hand over,这个要求太高了,你要是开在美国道路上,大概 120 公里每小时,10 秒钟都可以跑 300 多米,这个基本上就是 L4,L4 大家一般也就最多看 200 米。除非把 L4 用在 L3 上,要不然 L3 就是个伪命题。甚至做的好的 L2,比方通用的 Super Cruise,也已经用了一些 L4 的技术了。
雷锋网:自动驾驶从技术成熟,到大范围落地,这之间的商业化鸿沟是什么?
肖健雄:我觉得更多是产品化的问题,不是说自动驾驶做好了,当天就产品化了,有很多问题需要解决。比方说,我刚刚说了好多硬件设计,硬件要够可靠,相机抖动范围有严格要求,而且 Durability 要很久,所以有大量产品化的问题。
第二就是 AI 产品化应用问题。比如说现在自动驾驶车停在那里,等用户来拿包裹,这时候发现挡住别人的路了,后面有人倒车倒不了,怎么办?以前人家肯定会喊一句,别挡我,我要走了,那你就开走了。现在车里没人,你怎么喊它,喊它也没用。所以这其实有个产品化的过程,需要考虑的实际应用问题大大超过了自动驾驶技术本身。
雷锋网:之前您一直坚持摄像头方案,现在加上激光雷达更多是为了说服合作方吗?
肖健雄:主要还是为了安全冗余,但我觉得也要说服合作方、说服普通老百姓,让大家去接受这个新事物。我们做了很多前融合和后融合算法,也把激光雷达用在了定位上。
雷锋网:这算是一个妥协吗?
肖健雄:其实我们一直说的都是 Camera First,我觉得现在没有任何变化,我们是强调摄像头的潜力有多大,能力有多强,比如那些说激光雷达好的自动驾驶公司,也不止是用激光雷达,也用了摄像头,所以我们是说 Camera First,不是 Camera Only。
大家可能觉得 Camera Only 更好说,我们其实向来都是 Camera First,我们不排斥其它传感器,以摄像头为主,其它传感器为辅,要不然我们就得装很多激光雷达,现在我们用一个就够了,不用很多很多个,也不用很高分辨率的。
所以这也是我们的一个考虑,我们就以摄像头为主,这个肯定是没有变,因为只有成本够低,才有商业价值,太贵了就没办法落地。
雷锋网:40 线的激光雷达,加上这样一个摄像头组合,您对它的安全性有足够信心吗?
肖健雄:这个是绝对有足够信心的,我觉得已经够了,这已经很贵了。
雷锋网:我们是自己做的高精地图,为什么没有找专门的图商来做?
肖健雄:首先,我们这个要求蛮高的,很多图商其实并没有做自动驾驶全套系统,他其实并不知道自动驾驶的需求是什么,做出的地图也不一定是最优的。
还有,比如有的采集车用了很多传感器,那跟我们的传感器不一样,采了也没什么用。因为不同传感器,大家可能还有一点不一样,你的相机跟我的相机不大一样,你的激光雷达跟我的激光雷达又不大一样,装的位置又不大一样.......这里面有大量技术难点。我们的好处就是一模一样的车去采,一模一样的车来开,能达到定位性能最优。
第二,我们公司的一个特色,就是效率特别高,有什么需求马上调,马上改,调起来性能达到最优。我回到那一点,自动驾驶安全要求非常高,就意味着什么环节都不能掉链子,什么环节都得紧密配合,有些东西可做可不做,我们都不做,像芯片已经很成熟了,自己发明芯片也没有什么提高,但是像地图这种,其实还不是很成熟,我们自己做的好处是能确保它的性能非常好。
第三,还有成本问题,很多图商的制图成本大大超过了我们的成本,我们设计了非常廉价的制图方式。
雷锋网:我们未来的商业模式是如何设定的?
肖健雄:收费模式我们有两种,一种是长租,一种是短租。
短租现在很流行,像滴滴这种,Driving As Service,主要是卖服务,主要是小 B 和 C 端用,但是对大 B 来说,他们可能有更高要求,可能想彻底占有这个车,这个更像长租,我们也需要提供一些服务,例如地图、维修等。
雷锋网:我们的合作伙伴会是哪些?谁来运营车辆?
肖健雄:我们跟快递、物流、超市、饭店和一切需要运力的公司合作,我们其实就是给这些公司提供里程服务的运力公司。以前是有人驾驶,有两种运营模式:物流公司运营,或者第三方车队运营。分界点就是开车的人到底是物流公司的员工还是第三方公司的员工,一旦无人驾驶以后,其实这个界限就非常模糊了,不好说到底谁运营,这个其实不好界定。
有一种合作方式,就是车厂给我们提供车,我们装上我们的东西,再拿去运营,我们是车厂的客户。
所以,这是一种可能反过来的合作模式,不是说我们把东西卖给车厂,再卖给消费者。
雷锋网:现在看起来,我们跟 Tier 1 的接触反而会比较少一些。
肖健雄:主要是速度问题。我们要走传统车厂那条路,落地速度比较慢,我们想今年运营几百台,等不了,这样速度太慢了。一旦技术成熟,马上要商业化,我们现在已经到达那个点了,已经很成熟了,所以需要商业化,等不急了。
雷锋网:与做学术相比,创业让你兴奋的点主要是什么?
肖健雄:我觉得是团队变化,这也是我们为什么想创业的原因。实际上很多东西变化非常快,几个月后你回头一想,好像好几年前的感觉。而且团队效率也很高,大家很有斗志,现在是一个比较大的团队一起作战,不是单打独斗,学术还是主要靠单打独斗。
公司发展越来越快,效率越来越高,打法越来越清晰,团队磨合的速度也很快,很快就进入下一个级别。当然能力的提升是非常强的,这点也是创业最重要的一点,就是快速学习能力,在这个过程中可以学到很多。一定要亲身体验一遍,才能学到这么多,很多东西很难靠看书看出来。
雷锋网注:6 项会员专享特权,全年 100 期精华内容,带你深入浅出看懂自动驾驶。如果想加入雷锋网「新智驾会员计划」,欢迎点击链接 :https://www.leiphone.com/aidrive/vip 或扫描海报下方二维码了解详情。