自动驾驶大脑被认为是自动驾驶汽车的灵魂,也是多数公司正在努力的核心环节。但是,作为自动驾驶的最重要组成部分,自动驾驶大脑究竟是如何构成和工作的,很多人对此却仍然一知半解。最近,北京智行者科技 CTO 王肖在雷锋网 · AI 慕课学院的“未来汽车大讲堂”,对这一问题做出了将近两个小时的详细讲解。
王肖博士毕业于清华大学汽车工程系,曾作为核心人员参与 2012、2014 及 2015 年中国智能车未来挑战赛,并获得团队冠军,还曾参与起草中国智能网联车辆技术路线图,获汽车工业科学技术进步一等奖、军队科技进步奖等多项奖励。
智行者科技设定的自动驾驶路线分为两方面,一是限制场景下的园区低速车,2017 年 9 月,其研发的自动驾驶扫地车已经在北京奥林匹克森林公园进行了试运营;另外,开放场景下的自动驾驶乘用车也是其聚焦方向之一,鉴于近期北京市路测政策的出台,公司在这一领域的步伐也在不断加快。
基于智行者在技术升级和落地两方面的突出表现,关于自动驾驶大脑的构成与运行,王肖博士应该是行业最具发言权的人士之一。
(2018 年 1 月 16 日,雷锋网 · 新智驾将在美国硅谷举办 GAIR 硅谷智能驾驶峰会,届时,将有国内外多位自动驾驶行业专家到场,带来丰富的行业干货分享。详情请点击 https://gair.leiphone.com/gair/gairsv2018)
整个课程共分为三部分:自动驾驶大脑的研究背景、自动驾驶大脑的设计思路探析以及 AVOS 关键技术的设计与应用。
研究背景
首先,王肖博士对自动驾驶大脑的研究背景进行了讲解,这其中包括自动驾驶大脑与人类驾驶员各自的行为逻辑分析,自动驾驶大脑的组成,以及 Google 等先进自动驾驶公司在此所做的实践。
2016 年 11 月 8 日,谷歌公布自动驾驶视频在业内引起巨大轰动,很多人一度认为自动驾驶将马上走入普通人生活。但第二天,拉斯维加斯的一辆自动驾驶低速摆渡车便与一辆卡车发生了车祸。事故的原因并非自动驾驶车辆本身出现了问题,而是卡车在倒车过程中不小心撞上了停在一边的摆渡车。
这一事故便集中反映了目前自动驾驶大脑的局限性及其与人类驾驶员的区别:在遭遇外界的某种“入侵”时,人类驾驶员可以采取积极行动,进行躲避,而停止的自动驾驶汽车则多半只能“坐以待毙”。
由此也引出两个重要问题:
一、眼下的自动驾驶系统是否具备真正的智能?
王肖博士认为,围绕事件判断中“what”、“which”、“who”、“when”、“where”等核心问题,现有的人工智能技术还远不能给出完整准确的回答。
比如,利用眼下的技术,用户可以搜索出美国总统是谁,在什么时间当选总统,但关于其为什么可以当选、通过什么手段当选这样的问题,Google 上能搜索出来的仅仅是引用的相关专家回答,搜索引擎自己并不能生成智能分析。
因此,可以说,在分析“为什么”或者“怎么样”的问题时,现有的人工智能仍然非常“傻”。关于“在哪儿”、“要去哪儿”、“周围车辆状态如何”这样的问题,现有的自动驾驶系统可以很容易做出高精度感知和定位,但如果面对堵车、如何换道这样的问题,自动驾驶系统多数只能基于规则来工作。
在此,王肖博士举出了一个具体案例。最早,Google 的豆荚车看见小朋友穿着奇形怪状衣服,可以做到停车避让,这是所有新司机都可以达到的水平。但是,如果是一个老司机,则会想,小朋友穿着奇怪的衣服是否是因为前方学校正在举行活动,学校举行活动是否会引发堵车,如此是不是需要避开这条路,重新规划一条路线。但现在即使是 Google 在内的所有自动驾驶公司的产品都做不到这一点,即无法产生一个正常司机能够产生的联想。
所以,王肖博士得出的结论是,现有的自动驾驶系统并不具备真正的智能,我们所说的智能车,某种程度上,还处于非常“弱智”的阶段。
二、人类的常规驾驶是否需要如自动驾驶一般的高精度输入与输出?
现在世界上最好的摄像头、激光雷达、高精度定位都宣称自己能做到厘米级,王肖博士表示,在与很多汽车行业的朋友交流时,经常被问到“人为什么不需要高精度地图”之类的问题。
王肖认为,这之中非常重要的一个问题是,大部分人类驾驶员做不到高精度识别或高精度控制。人识别不了厘米级误差,而且,人类开车只需要确定一个大概的方向,基本靠局部定位,在驾驶过程中凭感觉完成判断。高精度控制也是同理。人开车时只要不打瞌睡,基本上都能比世界上最好的自动驾驶系统完成更好的驾驶。
行业常说希望自动驾驶汽车达到人类驾驶水平,但是自动驾驶研究的思路和实现方案与人类则完全不一样。现在的自动驾驶汽车依赖高精度感知定位,某种程度上就是因为自动驾驶大脑本身太弱。
......
自动驾驶大脑设计思路探析
自动驾驶大脑的分析设计是此次课程的核心环节,关于自动驾驶大脑的认知、规划,情境的输入与输出,王肖博士花费了大量篇幅从各个细节进行了讲解,并从智行者的产品出发,做出了多种情境的实例解析。
自动驾驶包括感知、认知、规划三个部分,自动驾驶大脑则主要包括认知和规划模块。认知的输入就是感知的输入,输出后便直接到达了规划。
在这里,王肖博士引入了几个重要的行业术语,比如感知的输出为场景,场景便是传感器识别到的人或车,是孤立的事物,其相互连接并不紧密。情境则是眼前的画面映射到大脑中产生的关联分析,这种分析又包括多维场景的融合分析,对象显著性分析,注意力聚焦分析,情境形式化分析。关于这四个模块,王肖博士都做出了非常详尽的解释。
……
AVOS 关键技术
在第三部分,王肖博士则介绍了智行者自动驾驶操作系统(AVOS)的设计思路与应用,以及其涉及的关键技术,并分享了团队的测试视频。
…...
课程最后,王肖对学员的在线提问也做出了耐心解答,这些问题涵盖了自动驾驶大脑的研究设计到整个自动驾驶行业发展的多个方面。
比如,自动驾驶运动规划的方法有哪些?
王肖博士的回答是,运动规划大致有两种,一种是常规的路径加速度的分解,一种是模型的方法,后者最典型的代表是戴姆勒,其主要思路是,综合考虑障碍物位置、道路属性等多种因素后,得出车的轨迹。对两种方法的好处与缺陷,王肖博士也进行了分析。
比如,最近有消息称,博世与国内三大图商合作完成了高精度地图众包采集与数据标注的可行性验证,那么,高精地图的制作未来会不会被主流图商或大型供应商垄断,创业公司自己做采集、标注平台的意义还大吗?
王肖博士认为,未来,高精度地图肯定会由图商来做,包括智行者在内的大多数科技公司并不想做,也没有能力去做大范围的高精度地图。
而高精度地图为什么是各家自动驾驶公司商业化的必备条件,王肖分析了几点原因,包括高精度地图是导航的基本依据;高精度地图是弥补感知缺失的重要手段;高精度地图是量产产品行为一致性的可靠保证。
......
点击课程链接 http://www.mooc.ai/open/course/412,即可获取王肖完整课程视频。或可加入“低速社群”,观看完整系列课程。(低速社员专享:http://www.mooc.ai/course/394)
“未来汽车大讲堂”由雷锋网 · 新智驾、 AI 慕课学院联合主办,从 2017 年 11 月 30 日晚 8 点开始邀请业内专家、智能驾驶一线从业者进行行业干货分享,至今已更新 6 期。更多详情,欢迎加入未来汽车低速讨论群。微信添加助教“小慕”(moocmm),备注“低速”,审核入群。