滴滴做自动驾驶非常明确。
8 月8 日,CCF-GAIR 2020智能驾驶专场上,滴滴自动驾驶公司COO孟醒提到,滴滴做的是针对L4级自动驾驶的RoboTaxi。L4延伸出来是L5,这是其未来的方向。
滴滴的核心基因是出行公司,出行是滴滴的基因。出行的重点是安全,当滴滴考虑做自动驾驶时,主要围绕的就是安全。
以下是孟醒的演讲全文,雷锋网新智驾进行了不改变原意的编辑:
各位下午好,很高兴来到CCF-GAIR 2020现场跟大家分享滴滴自动驾驶在过去一段时间所取得的进展,以及我们对未来的展望。
在开始分享之前,我先明确一个观点:自动驾驶是一件很难、很大的事情。很多公司都从技术方向努力,但从实践来讲,自动驾驶除了需要战略、方向、意愿,还需要基因。某种程度上你会带着天生的基因以及思考的维度,使得你做自动驾驶的角度与别人不同。
滴滴的核心基因是我出行公司,出行是我们的基因。
出行的重点是安全,当我们考虑做自动驾驶时,我们的初心就是围绕安全开始的。
有数据表明,全球每年因交通事故死亡的人数很多,约100多万人。其中,道路交通事故是5-14岁儿童和15-29岁年轻人的首位死因,这不光影响未来年轻人,还影响很多祖国未来花朵的成长。滴滴自动驾驶的初心就是改变这种现象的发生,哪怕只起到一点点改变也是我们非常希望做的事。
从全球的交通数据来看,每年因全球航空事故的死亡人数是562,航空运输量比交通运输量小很多,我们有没有可能把135万变成562,当然,我们希望这个数字是0。这是我们做这件事的初心,不是技术,不是体验,而是安全。
保证滴滴自动驾驶安全的三点是ADN:核心是AI能力,燃料是数据,边界是出行生态网络。
分别介绍这三个方向滴滴的工作。
1、人工智能驾驶
第一,核心的人工智能技术。滴滴自动驾驶非常明确,是针对L4级别的RoboTaxi。当然,L4延伸出来是L5,这是未来。有人认为未来会实现,有人认为不会实现,有人认为某个时间点会实现。此外,L4级自动驾驶以上的能力是我们现在的方向。
值得注意的是,其全栈能力都是自主研发,从车上的感知、预测、规划、控制,到车下的仿真、功能安全、信息安全、基础架构、系统集成等一系列都是我们自己做。而且这件事我们做了4年。
当然,上图是一个框架,框架定了,并不代表你能做得好。因为在框架的背后有两件比较重要的事情。
我相信今天所有人看到的L4级自动驾驶车,其能力还未达到车在没有安全员的情况下,完全放出去跑1-5年,这件事今天大家都达不到。不过,这是大家目前努力的目标。
与此同时,能达到上述目标的核心是迭代的速度如何更快。当然,更快的背后有两件事:
一是—见多识广,就是更多的长尾场景。80%的场景我们今天都能解决,难的是最后的20%、2%、0.2%这些场景,只有见过这些场景才能训练、迭代最终解决。
二是—千锤百炼,就是在这些场景下要跑更多的里程、做更多的测试。
其中,长尾场景是很难解决的一件事,原因是今天大家的车很少。目前自动驾驶的测试数据绝大多数来自于自动驾驶测试车,但自动驾驶测试车尤其是L4的测试车还不是量产的车型,绝大多数测试车是把软件、硬件、计算平台装在车上测试。多数都是有几十辆或者几百辆,没有一家公司有几千辆L4级自动驾驶测试车。
就算拥有几百辆测试车,每年能跑的里程也是非常有限的。对应长尾场景,今天累计里程能跑到几十万、几百万,多的甚至上千万的里程。
但是,有很多场景上千万公里才出现一次,有些里程上亿公里才会出现一次。而且你要解决这样的场景,你要见过同样场景100次、1000次,甚至10000次,才有足够多的数据解决该场景。
如此,怎么办?
对滴滴而言,我们不光有自动驾驶测试车收集这样的场景,我们还有桔视。
桔视是我们为司机师傅提供的安全保护设备,主要提供车前行车记录、行程中车内录像、判责及申诉取证等功能,50%的滴滴订单都有桔视设备的保护,一年下来大概有1000亿公里的数据。
值得注意的是,桔视涵盖的场景非常广,包括城市、乡村、城乡结合部等,此外晚上也有“奇奇怪怪”的场景,包括鸡飞狗跳,老年代步车逆行。
值得注意的是,长尾场景不光体现在数据复杂度上,还包括交通参与者动作的复杂性。
例如,我们在上海测试到的场景,有一个大车挡住对面来的大车,而且是跨线过来的。你不知道他会变得更违规过来还是回到自己的线上,这个过程中,预测的难度是很高的。
这样的预测跑多了以后,我们才知道对应的车该如何对应处理,同时比较好地跟别人进行交互。同时,保证我们对这样的车如何做得预测更准确。
除了我们的自动驾驶车辆外,我们还有桔视,它大概有5-6个数量级以上的额外数据让我们看到更多的场景,然后提取出来变成我们可预见的长尾场景,最后在仿真场景里测试,以此不断提升我们的算法。
几十辆、几百辆的自动驾驶测试车是非常有限的,因此我们扩展测试里程就是增加仿真,仿真可以提升10-100倍左右。
仿真产生出来的新场景,往往其分布跟真实世界场景的分布不尽一致,很多时候是我们创造出来的,虽然它对我们的算法提供新的挑战,但它对我们解决现实中的问题有一定的偏离。
桔视好处是我们有上千亿级公里数据的自动驾驶辅助,1000亿公里不是每公里都有用,但它能几乎覆盖所有的长尾场景,而且远远不止复制一遍。
2、数据
滴滴自动驾驶燃料数据分为两种:一部分是与技术迭代相关的数据,另一部分是与运营相关的数据。
滴滴作为网约车平台,因为其原生形态会自动产生很多数据,包括路程行径轨迹、用户需求、未来预测、轨迹数据、用户行为等。
L4级自动驾驶车与网约车不同,网约车可以从一个城市开往另一个城市,L4级自动驾驶车是从一个区域开始,会受到地理、天气情况,以及交通参与者的限制。
这些限制我们会逐步打开,可能以线上OTA方式打开,也可能是大版本迭代打开。不管怎样开放这个过程,它都是一步步展开的,不会以城市为单位逐步打开。
反过来想,我们如何在起始范围或者小范围内达到服务客户的目的?
举例来看,如果开放区域太小,像机场等场景,可能订单是很多的。如果不在你自动驾驶的区域范围内那就无法服务乘客,如此体验很差,乘客不会用你的服务。
怎么做?
滴滴平台每天会产生大量的运营数据,8年的累计不仅有数据还有经验。
其一是经营地图。我们把所有数据放在地图看,哪些路的收益最大,哪些地段有订单,哪些地段没有订单。
最重要的是,我们可以确定有没有闭环,以及会有多少订单。
其二是安全地图。我们会考虑哪些路段上人类司机开车发生重大事故、刮蹭事故、小事故,同时我们会对每个路段进行打分,然后用可视化的方式进行标注。
其三是技术地图。根据现在技术定义和路段本身的限速、车道清晰程度、自行车道和汽车道等打分。
可以看出,上述图片里的三张地图代表的含量信息不一样,但都是结果化信息。
更重要的是,我们把三张图放在一起形成滴滴战术地图,以此循序渐进推进自动驾驶。
这是一个很有意思的例子,我们把它做出来并形成了一套打法或者产品化的思路。虽然它具备时效性,但我们会基于大数据平台会实时更新,最终这些数据可能以秒为单位迭代。
其实,这套方法论非常普适,在中国普适,在全国不同地方都非常普适。
传统来讲,如果我们需要在小范围内开一片区域运营。首先,我们需要调研用户出行习惯,看有没有用户在哪里打车,需求是什么。同时,验证技术的可行性,这可能又需要一段时间,判断会不会遇到现在技术不能解决的问题。然后,我们在这个区域里用自动驾驶采图、打磨、迭代。整个流程大概需要半年时间。
现在来讲,我们只需要把三图合一形成战术地图,从需求角度、技术角度、安全角度搭建这套体系大概10秒钟时间,最终量化判断结果。
本质来看,我们在做自动驾驶本身的产品定义。
大家都在讨论L4、L5级自动驾驶,但它们依然是宏大的概念,也有各自其定义。重要的是如何限定各自范围、区域,并进行迭代和扩张。
其实,任何一家创业公司都面临这样的选择。这个命题不难,但执行起来很难,因为你没有数据。
这个过程在移动互联网时代是依靠产品经理实现,但在自动驾驶场景里主要是量化和数据实现。
3、网络
运营网络是我们自动驾驶行驶的边界。
在滴滴平台上有很多产品,包括出租车、快车、豪华车等,绝大多数经常打车的同学非常熟悉。
自动驾驶车是我们额外的品类,这件事有什么意义?
当你只有自动驾驶车辆,没有其他品类车辆的时候,几十辆车、几百辆自动驾驶车在限定的区域里是无法很好地服务用户的。
对用户而言,早期就是尝鲜,但只有限定范围和少量车,就无法提供很好的体验。
滴滴是采取混合派单的方式解决上述问题。
在滴滴平台上,我们把自动驾驶车和大量有司机驾驶的网约车放在一起,当区域、路况、天气符合自动驾驶条件时,我们把单派给自动驾驶车辆,否则就派给网约车司机。
其实,司机在相当长一段时间是非常重要的元素,他们是我们运输的主力,同事也解决了自动驾驶长时间无法解决的问题。
实际上,自动驾驶车辆和有司机驾驶的网约车是相辅相成的。他们可以在两种情况下无缝连接,逐步快速迭代自动驾驶网络的生成。
因为自动驾驶车队不可能一步到位完成所有事情。
除了运营网络外,还有两个网络很重要:乘客和车队运营。
乘客运营网络方面,滴滴有超过5亿用户,一年有超过100亿次的运送人次。我们有非常多服务经验,这个经验是无价的。你服务第一个客户时有很新鲜的体验感,当你服务100个用户时,他们提出的意见、需求各不相同,这时候你对产品的需求不断变高。当你服务到10万、100万、1000万时,你的认知是不断迭代的。其实,滴滴网约车的形成也是是经过每年百亿次的打磨做成的。
车队运营网络方面,对应的客户是庞大体系的车队。这些车绝大多数不是滴滴自己持有的,但很多车是我们服务的,包括集中采买、车辆使用、车辆养护、充电、加油、维修、后续处置等,滴滴有相当长时间的经验,服务超过100万辆车的车队。
在自动驾驶时代,上述提到的都是我们L4级自动驾驶技术以外的能力。当RoboTaxi真正落地商业化时,
这些能力变得尤为重要。
上述提到的运营能力体现在哪些上面?与我们一般认知有什么区别?
在运营场景下,滴滴自动驾驶涉及安全的场景是这么做的:
提到自动驾驶安全,一般人们会想到车上是否有安全员、安全员身份是否核查,以及车辆、车辆状态、行程等是否都有检测。
除此之外,实际上我们会做整套体系,这是一个庞大的体系,还包括车辆检查、接单限制、安全员、功能确认、测试等,这是安全体系里都会涉及的部分,大概76个模块。
76个流程就是为了做好滴滴自动驾驶安全这件事。不过,这只是是几十辆、几百辆自动驾驶车辆的安全管理体系。还不包括未来运营更多车辆、硬件设施、软件开发的安全流程。
这只是一个例子,背后其实还有很多这样的例子在运营体系里。
做好技术是一方面,做好技术所带来的应用场景是另一方面,这里面有很多细节,非常难的。
回顾刚刚分享的三点:AI能力、大数据和网络,这三者结合是我们滴滴自动驾驶的DNA。
滴滴做网约车自动驾驶场景非常合适,因为滴滴自动驾驶有天然的基因优势。上述三者结合,自动驾驶这件事我们可以看得到希望,并能把它做出来。
6月27日我们在上海把基因、能力、运营能力、经验组合在一起,在上海嘉定区域启动载人示范,普通乘客可以直接报名体验滴滴自动驾驶车。包括比较复杂的真实场景,跟一个城市覆盖绝大多数的室内场景相似,包括地铁站、购物中心、会展中心、大公司办公场景以及居住区域。上线当天有了万人报名,现在超过数万人报名。
除了车上的运营以外,我们真正运营还包括安全护航中心。
因为车上不能解决所有的场景,比如遇到交警指挥,你不知道自动驾驶车是否懂得交警的口语、手势等。我们设置的安全护航中心类似火箭发射指挥中心的中控平台,它会检测车辆的运营情况和报警情况,如果发现问题,它会调取车辆的实际运营状态,并且给予提示和参与意见,让车更好地处理长尾场景中不能处理的场景。此外,安全护航中心还能看路上的情况。
更重要的是,滴滴拥有自己的车路协同团队。
做自动驾驶时做车路协同,对车路协同本身的开发很重要。如果只做车路协同不做自动驾驶,往往车路协同的解决方案不是为使用方考虑的。如果你两方都做,就算不是自己铺基建,那也是从需求方的角度整体考虑这件事。
目前,滴滴有完整的解决方案,我们在上海铺设了这样的方案。从路的角度来看,可以看到我们的盲区、红绿灯等车内看不到的场景,通过我们车路协同的设备就能直接进入车里,进行感知协同。
最后,分享两个小故事:
滴滴自动驾驶上线以来,00001号体验乘客是在上海迪斯尼跳舞的舞者,她认为自动驾驶对她们是一种美好的体验。
她给我们特别大的鼓励,但比起鼓励,我们更珍惜的是对我们的打击和鞭策。
还有一位60多岁退休的大学教授,他坐过很多自动驾驶车。当天,他开了2个多小时的车过来体验滴滴自动驾驶车,同时提了很多意见。正式这些意见让我们走出舒适区,进入无人区,不断扩大边界。所以鼓励和鞭策对我们来说都很重要,都是我们往前走的动力。
雷锋网 雷锋网