去年 12 月,谷歌的无人驾驶项目从 Google X 中剥离,成为 Alphabet 旗下一家独立公司 Waymo。
从 2007 年至今,谷歌无人驾驶项目已经进行了超过 200 万英里的测试,但至今未有成型的消费级产品出炉。而如今谷歌拆分出 Waymo,或许是不再将注意力集中于造车,而是将无人驾驶系统更好地(或者说更快地)进行商业化。
今天,Waymo 技术负责人,原谷歌视觉识别软件工程师 Dmitri Dolgov 在 AAAI 2017 的现场带来了名为《自动驾驶汽车与移动化未来》的主题演讲,与雷锋网及在场的各位听众们一同回顾了谷歌无人驾驶项目八年来的进展。
全球每年有 1200 万人因交通事故而丧生,而在美国,这个数字达到了 350 万。而其中,94% 的交通事故是由人为驾驶失误导致的,包括饮酒、超速、疲劳驾驶及注意力不集中等问题。自动驾驶这个强需求也就应运而生,人类也需要一个这样的「老司机」来帮助人类避免不必要的失误。
Dolgov 认为,自动驾驶汽车需要从两个维度来衡量效果。一个是驾驶能力;一个是鲁棒性。如果二者都不兼具,那这辆汽车就毫无价值;而如果驾驶能力好,鲁棒性稍弱,那么它会是一个好的 demo,能够承载一些试验性的工作,但还不能让它放心上路;而如果能力弱而鲁棒性好,则算得上是一个半成品。「当然,我们所要追求的是一个两者兼具的产品。而谷歌项目的这八年,也就是一个不断努力提升驾驶能力与鲁棒性的过程。」
在 2009 年,谷歌开始尝试改装六辆丰田普锐斯和一辆奥迪 TT,并在加州山景城进行路测,从环绕太浩湖、到圣克拉门托,再到走遍所有的跨海大桥,甚至还去了著名的九曲花街(雷锋网按:以九曲十八弯的道路而闻名的一条街)。不过舆论当时并把自动驾驶太当回事,觉得那还是一个疯狂的想法。「在谷歌项目的前两年,团队最重要的任务是理解问题所在。我们希望能在这个过程中逐渐弄明白自动驾驶的发展空间能有多大。」
而为了最大程度地排除人为因素对汽车的干预,谷歌团队邀请了一名名为 Steve(音)的盲人来参与道路测试。
在 2012 年的时候,谷歌汽车的鲁棒性已经够好,当时已经达到了 level-3 的水平。「我们当时设计的驾驶理念是让汽车自主行驶,但当它遇到无法解决的复杂情况时,它会反馈给司机,并继续保持行驶以等待司机控制汽车。」
但这还不够。Dologv 认为,自动驾驶的核心是要建立人对系统的信任。「汽车的技术发展到什么程度并不是最重要的,更重要的一点是,人类是否在这个过程中感到舒适,感到安全。」
三年后,当谷歌再次对自动驾驶汽车进行测试时,此时它已经是「真正意义上」的自动驾驶了:没有方向盘、没有刹车、没有挂挡。视频中,这位谷歌工程师坐在缓缓行驶的谷歌汽车里,用钳子剪掉了传感器的电线,车子马上停了下来,并发出了警报声。
(然后这位工程师就发出了奸笑)
在这个时候,车体的各种传感器已经是我们所熟知的版本:近场的前后雷达,还有顶端的激光摄像机/雷达。自动驾驶首先要解决的是从复杂的环境中筛选出噪音,并分析出对汽车产生影响的信息。目前的分辨率精确到什么程度呢?Dologv 举了个例子,当自动驾驶汽车在路上行驶时,可以探测到前方数百英里处刚刚从旧金山国际机场起飞的一辆飞机。
但只有识别当然也远远不够。Dologv 表示,自动驾驶是实际上一种社交行为,汽车在驾驶过程中都是依照「识别——分类——判断——预测——行动」的逻辑来实现的,最重要的是,这个过程中需要与环境产生交互和反馈。
Dologv 在演讲中提到了一个比较复杂的例子:自动汽车在行驶过程中检测到最右边的车道有两辆汽车,还有一辆自行车。这并没有什么好奇怪的。但是,经过短时间的分析后,自动驾驶汽车就会发现,两辆汽车都停在路边。此外,越来越多的信息能够帮助汽车判断出此时的情况:后面车辆的警灯、放在地上的防撞桩、站在道路上的人(可能是警察)、开着的车门……综合上述情况,汽车需要学会判断此情此景可能代表着什么情况,并根据这些内容做出相应的预测(比如是否应该放缓速度或者变道以避开站在路上的警察),最后做出相应的决策。
当然,也有可能出现一些让汽车摸不着头脑的情况,比如……
谷歌的自动驾驶汽车目前已经积累了不少训练里程,包括 2500 万英里的道路测试数据;10 亿英里的模拟训练数据(截至 2016 年),已经将每 1000 英里的驾驶危险系数从 2015 年的 0.80 降低到 2016 年的 0.20。但对自动驾驶这种亟需大量数据的系统而言,这还只是九牛一毛。
Dologv 最后表示,现在每年全球会产生 10 万亿英里的行驶里程,而美国自然占了大头。而在未来,Waymo 也将持续提升自动驾驶系统的计算力、识别能力及预测能力,将自动驾驶技术更快地带给人们便利。雷锋网也同样希望能继续听到Waymo的好消息。